南开大学22春学期《并行程序设计》在线作业-2

作者:奥鹏周老师 分类: 南开大学 发布时间: 2022-05-17 13:39
答案来历:熊猫奥鹏(www.188open.com)并行程序设计-[南开大学]22春学期(高起本1709、全层次1803-2103)《并行程序设计》在线作业
试卷总分:100 得分:100
第1题,对单精度浮点计算MMX最高完成路并行
A、2
B、4
C、8
D、16
正确答案:


第2题,从线程检查主线程是不是要求它退出应选用
A、pthread_join
B、pthread_cancel
C、pthread_testcancel
D、pthread_exit
正确答案:


第3题,条件变量相关于互斥量的长处是
A、是多源状况
B、加锁解锁开支低
C、条件不建立时堵塞线程并自动解锁加锁
D、以上皆错
正确答案:


第4题,编写矩阵乘法的SSE程序若矩阵元素为单精度浮点数则应对矩阵乘加计算的循环进行路循环打开
A、2
B、4
C、8
D、16
正确答案:


答案来历:熊猫奥鹏(www.188open.com),floata[64]fori=0i60i+=4Va=a[i+2i+5]系统向量化访存是按16字节对齐的则此向量化程序每个循环步发生个内存拜访操作
A、1
B、2
C、3
D、4
正确答案:


第6题,全球500强超算在CPU、网络等硬件上越来越表现出选用的趋势
A、特别硬件
B、通用硬件
C、非揭露硬件
D、贱卖硬件
正确答案:


第7题,并行算法设计所做的事情不包含
A、分化计算工作分配给多个处理器
B、坚持数据依靠确保成果正确
C、保证不能发生重复计算
D、尽量下降通讯等额定开支
正确答案:


第8题,CPUcache巨细为32KB64*64的两个矩阵进行加法计算下面说法正确的是
A、可使用cache时刻部分性优化功能
B、可使用cache空间部分性优化功能
C、可经过矩阵分片优化功能
D、访存方面无优化能够
正确答案:


第9题,pthreadjoin的效果是
A、强行停止指定线程
B、检测指定线程是不是完毕
C、等候指定线程完毕才回来
D、向指定线程发送数据
正确答案:


答案来历:熊猫奥鹏(www.188open.com),运用无法直接完成"主线程等候4个从线程完结使命"
A、1个信号量
B、妨碍
C、1个互斥量
D、4个互斥量
正确答案:


第11题,OpenMP并行模型是一种编程模型
A、静态线程
B、动态线程
C、混合线程
D、众核
正确答案:


答案来历:熊猫奥鹏(www.188open.com),关于MPIrecv抵消息的区别下列说法正确的是
A、只能运用音讯标签
B、能够运用MPI_ANY_TAG
C、能够运用音讯名
D、能够运用端标语
正确答案:


第13题,推进GPU应用于通用高功能计算迸发式增加的开发东西是
A、OpenGL
B、OpenCL
C、DirectX
D、CUDA
正确答案:


第14题,OpenMP是的一个常见代替
A、SSE
B、MPI
C、Pthread
D、CUDA
正确答案:


答案来历:熊猫奥鹏(www.188open.com),一个AVX存放器最多寄存个整型数
A、2
B、4
C、8
D、16
正确答案:


第16题,一个Neon存放器最多寄存个整型数
A、2
B、4
C、8
D、16
正确答案:


第17题,每个AVX存放器宽度为位
A、64
B、128
C、256
D、512
正确答案:


第18题,以下是MPI根本原语
A、MPI_barrier
B、MPI_Comm_numprocs
C、MPI_Comm_rank
D、MPI_Comm_Send
正确答案:


第19题,银河1号、银河2号、威风太湖之光整体上都是架构
A、单核
B、多核
C、众核
D、集群
正确答案:


答案来历:熊猫奥鹏(www.188open.com),编写矩阵乘法的Neon程序若矩阵元素为单精度浮点数则应对矩阵乘加计算的循环进行路循环打开
A、2
B、4
C、8
D、16
正确答案:


第21题,履行pthreadrwlockrdlock时的状况下加锁成功
A、已有一个线程上了写锁
B、已有多个线程上了写锁
C、已有多个线程上了读锁
D、已有多个线程上了读锁和写锁
正确答案:


第22题,AVX是渠道的SIMD架构
A、x86
B、POWER
C、SPARC
D、ARM
正确答案:


第23题,和一对多播送对应的组通讯操作是
A、多对一搜集
B、多对多搜集
C、多对一归约
D、多对多归约
正确答案:


第24题,两个n*n的矩阵相乘将一切n^2个乘法计算区分给不一样进程再将对应某行某列的n个乘法成果累加得到成果矩阵对应元素这是一种区分的数据并行
A、输入数据
B、中心成果
C、输出数据
D、暂时数据
正确答案:


答案来历:熊猫奥鹏(www.188open.com),为避免编译器不撑持OpenMP应运用完成OpenMP代码和普通代码的条件编译
A、"#include "
B、"#pragma omp parallel"
C、"#ifdef _OPENMP"
D、"#define _OPENMP"
正确答案:


第26题,对矩阵每行排序的程序进行多线程并行化对矩阵选用
A、简略均匀块区分即可确保负载均衡
B、循环区分才干完成负载均衡
C、动态区分才干完成负载均衡
D、随机区分才干完成负载均衡
正确答案:


第27题,加快比计算中串行时刻大概取求解同一疑问的哪个串行算法的时刻
A、恣意一个串行算法
B、作为并行算法基础的那个串行算法
C、已知最优的串行算法
D、一切串行算法的均匀时刻
正确答案:


第28题,当处理器数量不变时跟着疑问规划增大功率增大对建立
A、有些并行算法
B、一切并行算法
C、一切并行算法都不
D、以上皆错
正确答案:


第29题,运用一个信号量完成"主线程等候4个从线程完结使命"信号量初始值应设置为
A、0
B、1
C、2
D、4
正确答案:


答案来历:熊猫奥鹏(www.188open.com),OpenMP循环区分战略不包含
A、static
B、fixed
C、dynamic
D、guided
正确答案:


第31题,矩阵乘法疑问更合适运用MPI的编程模型
A、堵塞的
B、非堵塞的
C、对等的
D、主从的
正确答案:


第32题,将存放器设置为4个给定单精度浮点数的SSEintrinsics指令是
A、_mm_set_ps
B、_mm_set1_ss
C、_mm_setzero_ss
D、_mm_setzero_ps
正确答案:


第33题,操控流句子进行SIMD并行化很艰难的缘由是操控流句子致使
A、接连数据履行不一样指令
B、接连数据履行一样指令
C、同一数据履行不一样指令
D、同一数据履行一样指令
正确答案:


第34题,n个节点的超立方结构成本为
A、O(logn)
B、O(sqrt(n))
C、O(n)
D、O(nlogn)
正确答案:


第35题,MMX有个专用存放器
A、4
B、8
C、16
D、32
正确答案:


第36题,pthreadrwlockrdlock是对读写锁进行操作
A、加锁
B、解锁
C、加读琐
D、加写锁
正确答案:


第37题,对下面程序说法正确的是
pragmaompparallelfornumthreadsthreadcountreduction+sum
fork=1k=nk++{sum+=factor/2*k1factor=factor
}
A、损坏了数据依靠
B、未损坏数据依靠
C、取决于变量声明
D、比临界区方法功能差
正确答案:


第38题,以下说法正确的是
A、多对多播送的高效算法根据一对多播送的高效算法
B、多对多归约的高效算法根据多对一归约的高效算法
C、多对多播送的高效算法根据串行的一对多播送算法
D、以上皆错
正确答案:,C,D


第39题,为了完成向量计算SIMD架构还需供给
A、更大的内存容量
B、更快的内存传输
C、更宽的存放器
D、更快的网络传输
正确答案:


第40题,Pthread不撑持
A、创立并发履行线程
B、同步
C、非显式通讯
D、自动并行化
正确答案:


第41题,一个AVX存放器最多寄存个单精度浮点数
A、2
B、4
C、8
D、16
正确答案:


第42题,SSEintrinsicsmmstoreupd指令的功用是
A、对齐标量存单精度浮点数
B、未对齐标量存单精度浮点数
C、对齐向量存双精度浮点数
D、未对齐向量存双精度浮点数
正确答案:


第43题,一个Neon存放器最多寄存个单精度浮点数
A、2
B、4
C、8
D、16
正确答案:


第44题,在用pthreadmutexlock对互斥量进行加锁时若其已上锁则线程进入状况
A、初始化
B、堵塞
C、继续履行
D、毁掉
正确答案:


第45题,对单精度浮点计算SSE最高完成路并行
A、2
B、4
C、8
D、16
正确答案:


第46题,SSEintrinsicsmmhaddps指令的功用是
A、存放器间单精度浮点数向量加法
B、存放器间双精度浮点数向量加法
C、存放器内单精度浮点数加法
D、存放器内双精度浮点数加法
正确答案:


第47题,有很多分支指令的程序不合适下面哪种体系结构进步行并行化
A、SISD
B、SIMD
C、SPMD
D、MIMD
正确答案:


第48题,关于加快比S和处理器数量p下列说法正确的是
A、有能够Sp
B、必定Sp
C、不可以能S=p
D、两者无相关
正确答案:


第49题,在编写运用n个线程进行n个数求和的OpenMP的程序时选用临界区技术则多线程版别串行版别
A、必定快于
B、必定慢于
C、能够快于
D、以上皆错
正确答案:


答案来历:熊猫奥鹏(www.188open.com),两个矩阵相乘若矩阵总规划小于cache巨细则优化访存的最好方法是
A、先将两个矩阵读入cache再进行乘法
B、先转置榜首个矩阵再进行乘法
C、先转置第二个矩阵再进行乘法
D、以上皆错
正确答案:

作业答案 联系QQ:3326650399 微信:cs80188