南开23秋学期(仅限-高起专1909、专升本1909)《并行程序设计》在线作业【标准答案】 作者:奥鹏周老师 分类: 南开大学 发布时间: 2023-11-14 21:11 作业答案 联系QQ:3326650399 微信:cs80188 微信二维码 23秋学期(仅限-高起专1909、专升本1909)《并行程序设计》在线作业-00003 试卷总分:100 得分:100 一、单选题 (共 50 道试题,共 100 分) 1.OpenMP是___的一个常见代替。 A.SSE B.MPI C.Pthread D.CUDA 2.为知道决CPU内流水线深度约束,首要的技术手法是____。 A.下降指令杂乱度 B.去掉分支预测功用 C.增大中心数 D.超支量技术 3.SSE intrinsics _mm_hadd_ps指令的功用是____。 A.存放器间单精度浮点数向量加法 B.存放器间双精度浮点数向量加法 C.存放器内单精度浮点数加法 D.存放器内双精度浮点数加法 4.选用区分子矩阵(巨细b*b)的方法完成n*n矩阵乘法,一次乘—加运算触及的子矩阵可悉数放入cache,则整个计算过程中,两个输入矩阵的每个元素会发生____次访存。 A.n B.t C.n-t D.n/t 5.程序访存更多在____中射中,可最大程度进步功能、下降功耗 A.本CPU cache B.本CPU主存 C.本结点其他CPU主存 D.远端结点主存 6.动态使命区分相关于静态使命区分的缺陷是____。 A.能够致使负载不均 B.通讯开支高 C.使命粒度粗 D.计算杂乱度高 7.关于向线程函数传递参数,下列说法错误的是____。 A.线程函数并非用户程序调用,因而无法直接传递 B.线程函数有必要承受void *参数,因而只能传递巨细不超越指针的数据对象 C.线程一般经过此路径获取线程号 D.不一样线程间的参数传递彼此无关,即便它们具有一样的线程函数 8.FORTRAN语言存储二维数组采纳____。 A.行主次第存储 B.列主次第存储 C.交织式存储 D.对角线存储 9.用GCC编译器编译SSE intrinsics程序,需运用编译选项 A.-march=corei7 B.-g C.-O D.-O2 10.____不是SIMD架构。 A.SSE B.超线程 C.AltiVec D.Neon 11.关于MPI_recv对源地址的标识,下列说法正确的是____。 A.只能运用进程编号 B.能够运用IP地址 C.能够运用IPV6地址 D.能够运用MPI_ANY_SOURCE 12.记并行时刻为T,串行时刻为T\',处理器数量为p,并行价值的界说是____。 A.pT B.T\'+T C.p(T\'-T) D.pT-T\' 13.Pthread不撑持____。 A.创立并发履行线程 B.同步 C.非显式通讯 D.自动并行化 14.主线程创立了4个线程,它们打印各自的线程号(0-3),未运用任何同步,则输出次序____。 A.必定是0 1 2 3 B.必定是4 3 2 1 C.不可以能是4 3 2 1 D.以上皆错 15.新一代GPU要点供给的新特性不包含____。 A.新式高速显存 B.GPU间直接高速互联 C.自动并行化 D.人工智能计算专门优化 16.关于科学仿真并行计算的一般方法,哪个过程的描绘是错误的? A.将空间离散化为网格 B.在网络进步行部分计算 C.部分计算成果彻底独立 D.重复若干时刻步 17.对矩阵乘法串行程序主体三重循环的最内层循环进行向量化,则该循环履行结束后,就计算出了断果矩阵的一个元素,这种说法是____。 A.正确的 B.错误的 18.咱们在小规划系统和小规划输入下测试了几个并行算法,应挑选哪个应用在实践系统中? A.挑选功能测试并行时刻起码者 B.挑选功能测试加快比最大者 C.挑选功能测试功率最高者 D.应结合可拓展性剖析做出挑选 19.对一个串行程序进行SIMD并行化,应要点思考的程序有些是____。 A.声明句子 B.条件分支句子 C.循环句子 D.输入输出句子 20.OpenMP并行模型是一种____编程模型。 A.静态线程 B.动态线程 C.混合线程 D.众核 21.和一对多播送对应的组通讯操作是____。 A.多对一搜集 B.多对多搜集 C.多对一归约 D.多对多归约 22.银河1号、银河2号、威风.太湖之光整体上都是____架构 A.单核 B.多核 C.众核 D.集群 23.MPI程序中发送和接纳音讯的两个进程有必要____。 A.在同一个网段中 B.衔接在同一个路由器上 C.在同一个通讯域中 D.以上皆错 24.SSE的blend指令的8位二进制整数参数被用做8个掩码imm8[0:7],若imm8[j]=0则表明___。 A.将榜首个源存放器的第j个元素放在方针存放器方位0 B.将第二个源存放器的第j个元素放在方针存放器方位0 C.将榜首个源存放器的第j个元素放在方针存放器方位j D.将第二个源存放器的第j个元素放在方针存放器方位j 25.OpenMP循环并行指令是____。 A.omp parallel B.omp single C.omp parallel for D.omp master 26.SIMD架构未见于_____中。 A.多媒体拓展 B.图形和游戏处理器 C.计算机集群 D.协处理器 27.假如运算对象是独立无关的变量,则在向量运算之前需____。 A.将变量复制到接连区域 B.将变量地址复制到接连区域 C.将变量逐一传输到向量存放器 D.以上皆错 28.OpenMP编译指示中阐明同享变量是用____子句。 A.private B.shared C.schedule D.nowait 29.主线程经过____函数获取特定线程的回来成果。 A.pthread_create B.pthread_join C.pthread_cancel D.pthread_get 30.以下哪条不是推进并行计算开展的要素? A.存储是系统瓶颈 B.单CPU开展已能满意应用需求 C.使用规范硬件结构并行机令晋级简单 D.编程环境规范化逐渐开展 31.数据依靠是指有必要坚持两个内存操作的____才干确保程序成果正确。 A.巨细 B.时序 C.时长 D.cache部分性 32.CPU cache巨细为32KB,如期望(单精度浮点数)矩阵乘法计算过程中一切数据都驻留cache中,则矩阵巨细最大为 A.16*16 B.32*32 C.64*64 D.128*128 33.全球500强超算在CPU、网络等硬件上越来越表现出选用____的趋势。 A.特别硬件 B.通用硬件 C.非揭露硬件 D.贱卖硬件 34.选用MPI主从模型处理矩阵每行排序疑问,主进程不断向每个从进程发送使命、接纳成果,则它从从进程接纳成果时,以下哪种方法非常好____。 A.按编号次序顺次从从进程接纳成果 B.按编号逆序顺次从从进程接纳成果 C.按编号次序、逆序替换从从进程接纳成果 D.运用MPI_ANY_SOURCE和MPI_ANY_TAG 35.Flynn分类法中,下面哪种体系结构在实践中简直没有含义? A.SISD B.SIMD C.MISD D.MIMD 36.我国初次取得戈登?贝尔奖是在____年。 A.2015 B.2016 C.2017 D.2018 37.多线程是____架构下的并行形式。 A.MIMD B.同享内存 C.散布式内存 D.别离式地址空间 38.OpenMP循环区分战略不包含____。 A.static B.fixed C.dynamic D.guided 39.SSE intrinsics _mm_store_sd指令的功用是____。 A.对齐向量存单精度浮点数 B.未对齐向量存单精度浮点数 C.对齐标量存双精度浮点数 D.未对齐标量存双精度浮点数 40.关于音讯传递编程的特色,以下说法正确的是____。 A.与同享内存相同有竞赛条件 B.编程简略 C.需程序员思考部分性 D.无需思考进程间通讯 41.经典冯诺依曼架构履行一条指令的过程中不包含哪个操作? A.取指令 B.解码 C.安全性检查 D.履行指令 42.MPI程序中默许的通讯域是____。 A.MPI_ANY_SOURCE B.MPI_ANY_TAG C.MPI_ANY_COMM D.MPI_COMM_WORLD 43.矩阵每行排序的疑问更合适运用MPI的____编程模型。 A.堵塞的 B.非堵塞的 C.对等的 D.主从的 44.关于加快比S和处理器数量p,下列说法正确的是____。 A.有能够S>p B.必定S C.不可以能S=p D.两者无相关 45.关于向量化,以下说法错误的是____。 A.总会有打包/解包开支 B.若运算对象接连存储,可消除打包开支 C.若运算成果接连存储,可消除解包开支 D.打包/解包开支由数据存储决议 46.记并行时刻为T,串行时刻为T\',处理器数量为p,功率为E,则价值最优的界说是____。 A.pT\'=T B.E=Θ(1) C.E=pT/T\' D.E=T\'/pT 47.在用pthread_mutex_lock对互斥量进行加锁时,若其已上锁,则线程进入____状况。 A.初始化 B.堵塞 C.继续履行 D.毁掉 48.并行算法设计所做的事情不包含____。 A.分化计算工作分配给多个处理器 B.坚持数据依靠确保成果正确 C.保证不能发生重复计算 D.尽量下降通讯等额定开支 49.MPI根本原语不包含____。 A.MPI_Barrier B.MPI_Comm_rank C.MPI_Comm_size D.MPI_Init 50.下面矩阵运算中,哪个进行简略的数据并行作用欠安____。 A.矩阵求和 B.矩阵相乘 C.矩阵向量相乘 D.高斯消去 作业答案 联系QQ:3326650399 微信:cs80188 微信二维码
试卷总分:100 得分:100
一、单选题 (共 50 道试题,共 100 分)
1.OpenMP是___的一个常见代替。
A.SSE
B.MPI
C.Pthread
D.CUDA
2.为知道决CPU内流水线深度约束,首要的技术手法是____。
A.下降指令杂乱度
B.去掉分支预测功用
C.增大中心数
D.超支量技术
3.SSE intrinsics _mm_hadd_ps指令的功用是____。
A.存放器间单精度浮点数向量加法
B.存放器间双精度浮点数向量加法
C.存放器内单精度浮点数加法
D.存放器内双精度浮点数加法
4.选用区分子矩阵(巨细b*b)的方法完成n*n矩阵乘法,一次乘—加运算触及的子矩阵可悉数放入cache,则整个计算过程中,两个输入矩阵的每个元素会发生____次访存。
A.n
B.t
C.n-t
D.n/t
5.程序访存更多在____中射中,可最大程度进步功能、下降功耗
A.本CPU cache
B.本CPU主存
C.本结点其他CPU主存
D.远端结点主存
6.动态使命区分相关于静态使命区分的缺陷是____。
A.能够致使负载不均
B.通讯开支高
C.使命粒度粗
D.计算杂乱度高
7.关于向线程函数传递参数,下列说法错误的是____。
A.线程函数并非用户程序调用,因而无法直接传递
B.线程函数有必要承受void *参数,因而只能传递巨细不超越指针的数据对象
C.线程一般经过此路径获取线程号
D.不一样线程间的参数传递彼此无关,即便它们具有一样的线程函数
8.FORTRAN语言存储二维数组采纳____。
A.行主次第存储
B.列主次第存储
C.交织式存储
D.对角线存储
9.用GCC编译器编译SSE intrinsics程序,需运用编译选项
A.-march=corei7
B.-g
C.-O
D.-O2
10.____不是SIMD架构。
A.SSE
B.超线程
C.AltiVec
D.Neon
11.关于MPI_recv对源地址的标识,下列说法正确的是____。
A.只能运用进程编号
B.能够运用IP地址
C.能够运用IPV6地址
D.能够运用MPI_ANY_SOURCE
12.记并行时刻为T,串行时刻为T\',处理器数量为p,并行价值的界说是____。
A.pT
B.T\'+T
C.p(T\'-T)
D.pT-T\'
13.Pthread不撑持____。
A.创立并发履行线程
B.同步
C.非显式通讯
D.自动并行化
14.主线程创立了4个线程,它们打印各自的线程号(0-3),未运用任何同步,则输出次序____。
A.必定是0 1 2 3
B.必定是4 3 2 1
C.不可以能是4 3 2 1
D.以上皆错
15.新一代GPU要点供给的新特性不包含____。
A.新式高速显存
B.GPU间直接高速互联
C.自动并行化
D.人工智能计算专门优化
16.关于科学仿真并行计算的一般方法,哪个过程的描绘是错误的?
A.将空间离散化为网格
B.在网络进步行部分计算
C.部分计算成果彻底独立
D.重复若干时刻步
17.对矩阵乘法串行程序主体三重循环的最内层循环进行向量化,则该循环履行结束后,就计算出了断果矩阵的一个元素,这种说法是____。
A.正确的
B.错误的
18.咱们在小规划系统和小规划输入下测试了几个并行算法,应挑选哪个应用在实践系统中?
A.挑选功能测试并行时刻起码者
B.挑选功能测试加快比最大者
C.挑选功能测试功率最高者
D.应结合可拓展性剖析做出挑选
19.对一个串行程序进行SIMD并行化,应要点思考的程序有些是____。
A.声明句子
B.条件分支句子
C.循环句子
D.输入输出句子
20.OpenMP并行模型是一种____编程模型。
A.静态线程
B.动态线程
C.混合线程
D.众核
21.和一对多播送对应的组通讯操作是____。
A.多对一搜集
B.多对多搜集
C.多对一归约
D.多对多归约
22.银河1号、银河2号、威风.太湖之光整体上都是____架构
A.单核
B.多核
C.众核
D.集群
23.MPI程序中发送和接纳音讯的两个进程有必要____。
A.在同一个网段中
B.衔接在同一个路由器上
C.在同一个通讯域中
D.以上皆错
24.SSE的blend指令的8位二进制整数参数被用做8个掩码imm8[0:7],若imm8[j]=0则表明___。
A.将榜首个源存放器的第j个元素放在方针存放器方位0
B.将第二个源存放器的第j个元素放在方针存放器方位0
C.将榜首个源存放器的第j个元素放在方针存放器方位j
D.将第二个源存放器的第j个元素放在方针存放器方位j
25.OpenMP循环并行指令是____。
A.omp parallel
B.omp single
C.omp parallel for
D.omp master
26.SIMD架构未见于_____中。
A.多媒体拓展
B.图形和游戏处理器
C.计算机集群
D.协处理器
27.假如运算对象是独立无关的变量,则在向量运算之前需____。
A.将变量复制到接连区域
B.将变量地址复制到接连区域
C.将变量逐一传输到向量存放器
D.以上皆错
28.OpenMP编译指示中阐明同享变量是用____子句。
A.private
B.shared
C.schedule
D.nowait
29.主线程经过____函数获取特定线程的回来成果。
A.pthread_create
B.pthread_join
C.pthread_cancel
D.pthread_get
30.以下哪条不是推进并行计算开展的要素?
A.存储是系统瓶颈
B.单CPU开展已能满意应用需求
C.使用规范硬件结构并行机令晋级简单
D.编程环境规范化逐渐开展
31.数据依靠是指有必要坚持两个内存操作的____才干确保程序成果正确。
A.巨细
B.时序
C.时长
D.cache部分性
32.CPU cache巨细为32KB,如期望(单精度浮点数)矩阵乘法计算过程中一切数据都驻留cache中,则矩阵巨细最大为
A.16*16
B.32*32
C.64*64
D.128*128
33.全球500强超算在CPU、网络等硬件上越来越表现出选用____的趋势。
A.特别硬件
B.通用硬件
C.非揭露硬件
D.贱卖硬件
34.选用MPI主从模型处理矩阵每行排序疑问,主进程不断向每个从进程发送使命、接纳成果,则它从从进程接纳成果时,以下哪种方法非常好____。
A.按编号次序顺次从从进程接纳成果
B.按编号逆序顺次从从进程接纳成果
C.按编号次序、逆序替换从从进程接纳成果
D.运用MPI_ANY_SOURCE和MPI_ANY_TAG
35.Flynn分类法中,下面哪种体系结构在实践中简直没有含义?
A.SISD
B.SIMD
C.MISD
D.MIMD
36.我国初次取得戈登?贝尔奖是在____年。
A.2015
B.2016
C.2017
D.2018
37.多线程是____架构下的并行形式。
A.MIMD
B.同享内存
C.散布式内存
D.别离式地址空间
38.OpenMP循环区分战略不包含____。
A.static
B.fixed
C.dynamic
D.guided
39.SSE intrinsics _mm_store_sd指令的功用是____。
A.对齐向量存单精度浮点数
B.未对齐向量存单精度浮点数
C.对齐标量存双精度浮点数
D.未对齐标量存双精度浮点数
40.关于音讯传递编程的特色,以下说法正确的是____。
A.与同享内存相同有竞赛条件
B.编程简略
C.需程序员思考部分性
D.无需思考进程间通讯
41.经典冯诺依曼架构履行一条指令的过程中不包含哪个操作?
A.取指令
B.解码
C.安全性检查
D.履行指令
42.MPI程序中默许的通讯域是____。
A.MPI_ANY_SOURCE
B.MPI_ANY_TAG
C.MPI_ANY_COMM
D.MPI_COMM_WORLD
43.矩阵每行排序的疑问更合适运用MPI的____编程模型。
A.堵塞的
B.非堵塞的
C.对等的
D.主从的
44.关于加快比S和处理器数量p,下列说法正确的是____。
A.有能够S>p
B.必定S
C.不可以能S=p
D.两者无相关
45.关于向量化,以下说法错误的是____。
A.总会有打包/解包开支
B.若运算对象接连存储,可消除打包开支
C.若运算成果接连存储,可消除解包开支
D.打包/解包开支由数据存储决议
46.记并行时刻为T,串行时刻为T\',处理器数量为p,功率为E,则价值最优的界说是____。
A.pT\'=T
B.E=Θ(1)
C.E=pT/T\'
D.E=T\'/pT
47.在用pthread_mutex_lock对互斥量进行加锁时,若其已上锁,则线程进入____状况。
A.初始化
B.堵塞
C.继续履行
D.毁掉
48.并行算法设计所做的事情不包含____。
A.分化计算工作分配给多个处理器
B.坚持数据依靠确保成果正确
C.保证不能发生重复计算
D.尽量下降通讯等额定开支
49.MPI根本原语不包含____。
A.MPI_Barrier
B.MPI_Comm_rank
C.MPI_Comm_size
D.MPI_Init
50.下面矩阵运算中,哪个进行简略的数据并行作用欠安____。
A.矩阵求和
B.矩阵相乘
C.矩阵向量相乘
D.高斯消去
作业答案 联系QQ:3326650399 微信:cs80188