22春学期(高起本1709、全层次1803-2103)《并行程序设计》在线作业答卷
22春学期(高起本1709-1803、全层次1809-2103)《并行程序设计》在线作业-00002
试卷总分:100得分:100
一、单选题 (共 50 道试题,共 100 分)
1.对单精度浮点计算,MMX最高完成____路并行。
A.2
B.4
C.8
D.16
答案:
2.从线程检查主线程是不是要求它退出应选用____。
A.pthread_join
B.pthread_cancel
C.pthread_testcancel
D.pthread_exit
答案:
3.条件变量相关于互斥量的长处是____。
A.是多源状况
B.加锁解锁开支低
C.条件不建立时堵塞线程并自动解锁加锁
D.以上皆错
答案:
4.编写矩阵乘法的SSE程序,若矩阵元素为单精度浮点数,则应对矩阵乘-加计算的循环进行____路循环打开。
A.2
B.4
C.8
D.16
答案:
5.float a[64]; for (i=0; i<60; i+=4) Va = a[i+2:i+5]; 系统向量化访存是按16字节对齐的,则此向量化程序每个循环步发生____个内存拜访操作。
A.1
B.2
C.3
D.4
答案:
6.全球500强超算在CPU、网络等硬件上越来越表现出选用____的趋势。
A.特别硬件
B.通用硬件
C.非揭露硬件
D.贱卖硬件
答案:
7.并行算法设计所做的事情不包含____。
A.分化计算工作分配给多个处理器
B.坚持数据依靠确保成果正确
C.保证不能发生重复计算
D.尽量下降通讯等额定开支
答案:
8.CPU cache巨细为32KB,64*64的两个矩阵进行加法计算,下面说法正确的是____。
A.可使用cache时刻部分性优化功能
B.可使用cache空间部分性优化功能
C.可经过矩阵分片优化功能
D.访存方面无优化能够
答案:
9.pthread_join的效果是____。
A.强行停止指定线程
B.检测指定线程是不是完毕
C.等候指定线程完毕才回来
D.向指定线程发送数据
答案:
10.运用____无法直接完成"主线程等候4个从线程完结使命"。
A.1个信号量
B.妨碍
C.1个互斥量
D.4个互斥量
答案:
11.OpenMP并行模型是一种____编程模型。
A.静态线程
B.动态线程
C.混合线程
D.众核
答案:
12.关于MPI_recv抵消息的区别,下列说法正确的是____。
A.只能运用音讯标签
B.能够运用MPI_ANY_TAG
C.能够运用音讯名
D.能够运用端标语
答案:
13.推进GPU应用于通用高功能计算迸发式增加的开发东西是____。
A.OpenGL
B.OpenCL
C.DirectX
D.CUDA
答案:
14.OpenMP是___的一个常见代替。
A.SSE
B.MPI
C.Pthread
D.CUDA
答案:
15.一个AVX存放器最多寄存____个整型数。
A.2
B.4
C.8
D.16
答案:
16.一个Neon存放器最多寄存____个整型数。
A.2
B.4
C.8
D.16
答案:
17.每个AVX存放器宽度为____位。
A.64
B.128
C.256
D.512
答案:
18.以下____是MPI根本原语。
A.MPI_barrier
B.MPI_Comm_numprocs
C.MPI_Comm_rank
D.MPI_Comm_Send
答案:
19.银河1号、银河2号、威风.太湖之光整体上都是____架构
A.单核
B.多核
C.众核
D.集群
答案:
20.编写矩阵乘法的Neon程序,若矩阵元素为单精度浮点数,则应对矩阵乘-加计算的循环进行____路循环打开。
A.2
B.4
C.8
D.16
答案:
21.履行pthread_rwlock_rdlock时,____的状况下加锁成功。
A.已有一个线程上了写锁
B.已有多个线程上了写锁
C.已有多个线程上了读锁
D.已有多个线程上了读锁和写锁
答案:
22.AVX是____渠道的SIMD架构。
A.x86
B.POWER
C.SPARC
D.ARM
答案:
23.和一对多播送对应的组通讯操作是____。
A.多对一搜集
B.多对多搜集
C.多对一归约
D.多对多归约
答案:
24.两个n*n的矩阵相乘,将一切n^2个乘法计算区分给不一样进程,再将对应某行某列的n个乘法成果累加得到成果矩阵对应元素,这是一种区分____的数据并行。
A.输入数据
B.中心成果
C.输出数据
D.暂时数据
答案:
25.为避免编译器不撑持OpenMP,应运用____完成OpenMP代码和普通代码的条件编译。
A."#include "
B."#pragma omp parallel"
C."#ifdef _OPENMP"
D."#define _OPENMP"
答案:
26.对矩阵每行排序的程序进行多线程并行化,对矩阵选用____。
A.简略均匀块区分即可确保负载均衡
B.循环区分才干完成负载均衡
C.动态区分才干完成负载均衡
D.随机区分才干完成负载均衡
答案:
27.加快比计算中串行时刻大概取求解同一疑问的哪个串行算法的时刻____。
A.恣意一个串行算法
B.作为并行算法基础的那个串行算法
C.已知最优的串行算法
D.一切串行算法的均匀时刻
答案:
28.当处理器数量不变时,跟着疑问规划增大,功率增大对____建立。
A.有些并行算法
B.一切并行算法
C.一切并行算法都不
D.以上皆错
答案:
29.运用一个信号量完成"主线程等候4个从线程完结使命",信号量初始值应设置为____。
A.0
B.1
C.2
D.4
答案:
30.OpenMP循环区分战略不包含____。
A.static
B.fixed
C.dynamic
D.guided
答案:
31.矩阵乘法疑问更合适运用MPI的____编程模型。
A.堵塞的
B.非堵塞的
C.对等的
D.主从的
答案:
32.将存放器设置为4个给定单精度浮点数的SSE intrinsics指令是____。
A._mm_set_ps
B._mm_set1_ss
C._mm_setzero_ss
D._mm_setzero_ps
答案:
33.操控流句子进行SIMD并行化很艰难的缘由是操控流句子致使____。
A.接连数据履行不一样指令
B.接连数据履行一样指令
C.同一数据履行不一样指令
D.同一数据履行一样指令
答案:
34.n个节点的超立方结构成本为____。
A.O(logn)
B.O(sqrt(n))
C.O(n)
D.O(nlogn)
答案:
35.MMX有____个专用存放器。
A.4
B.8
C.16
D.32
答案:
36.pthread_rwlock_rdlock是对读写锁进行____操作。
A.加锁
B.解锁
C.加读琐
D.加写锁
答案:
37.对下面程序,说法正确的是 # pragma omp parallel for num_threads(thread_count) \ reduction(+:sum) for (k = 1; k <= n; k++) { sum += factor/(2*k-1); factor = -factor; }
A.损坏了数据依靠
B.未损坏数据依靠
C.取决于变量声明
D.比临界区方法功能差
答案:
38.以下说法正确的是____。
A.多对多播送的高效算法根据一对多播送的高效算法
B.多对多归约的高效算法根据多对一归约的高效算法
C.多对多播送的高效算法根据串行的一对多播送算法
D.以上皆错
答案:
39.为了完成向量计算,SIMD架构还需供给____。
A.更大的内存容量
B.更快的内存传输
C.更宽的存放器
D.更快的网络传输
答案:
40.Pthread不撑持____。
A.创立并发履行线程
B.同步
C.非显式通讯
D.自动并行化
答案:
41.一个AVX存放器最多寄存____个单精度浮点数。
A.2
B.4
C.8
D.16
答案:
42.SSE intrinsics _mm_storeu_pd指令的功用是____。
A.对齐标量存单精度浮点数
B.未对齐标量存单精度浮点数
C.对齐向量存双精度浮点数
D.未对齐向量存双精度浮点数
答案:
43.一个Neon存放器最多寄存____个单精度浮点数。
A.2
B.4
C.8
D.16
答案:
44.在用pthread_mutex_lock对互斥量进行加锁时,若其已上锁,则线程进入____状况。
A.初始化
B.堵塞
C.继续履行
D.毁掉
答案:
45.对单精度浮点计算,SSE最高完成____路并行。
A.2
B.4
C.8
D.16
答案:
46.SSE intrinsics _mm_hadd_ps指令的功用是____。
A.存放器间单精度浮点数向量加法
B.存放器间双精度浮点数向量加法
C.存放器内单精度浮点数加法
D.存放器内双精度浮点数加法
答案:
47.有很多分支指令的程序不合适下面哪种体系结构进步行并行化?
A.SISD
B.SIMD
C.SPMD
D.MIMD
答案:
48.关于加快比S和处理器数量p,下列说法正确的是____。
A.有能够S>p
B.必定SC.不可以能S=p
D.两者无相关
答案:
49.在编写运用n个线程进行n个数求和的OpenMP的程序时选用临界区技术,则多线程版别____串行版别。
A.必定快于
B.必定慢于
C.能够快于
D.以上皆错
答案:
50.两个矩阵相乘,若矩阵总规划小于cache巨细,则优化访存的最好方法是____。
A.先将两个矩阵读入cache再进行乘法
B.先转置榜首个矩阵再进行乘法
C.先转置第二个矩阵再进行乘法
D.以上皆错
答案:
试卷总分:100得分:100
一、单选题 (共 50 道试题,共 100 分)
1.对单精度浮点计算,MMX最高完成____路并行。
A.2
B.4
C.8
D.16
答案:
2.从线程检查主线程是不是要求它退出应选用____。
A.pthread_join
B.pthread_cancel
C.pthread_testcancel
D.pthread_exit
答案:
3.条件变量相关于互斥量的长处是____。
A.是多源状况
B.加锁解锁开支低
C.条件不建立时堵塞线程并自动解锁加锁
D.以上皆错
答案:
4.编写矩阵乘法的SSE程序,若矩阵元素为单精度浮点数,则应对矩阵乘-加计算的循环进行____路循环打开。
A.2
B.4
C.8
D.16
答案:
5.float a[64]; for (i=0; i<60; i+=4) Va = a[i+2:i+5]; 系统向量化访存是按16字节对齐的,则此向量化程序每个循环步发生____个内存拜访操作。
A.1
B.2
C.3
D.4
答案:
6.全球500强超算在CPU、网络等硬件上越来越表现出选用____的趋势。
A.特别硬件
B.通用硬件
C.非揭露硬件
D.贱卖硬件
答案:
7.并行算法设计所做的事情不包含____。
A.分化计算工作分配给多个处理器
B.坚持数据依靠确保成果正确
C.保证不能发生重复计算
D.尽量下降通讯等额定开支
答案:
8.CPU cache巨细为32KB,64*64的两个矩阵进行加法计算,下面说法正确的是____。
A.可使用cache时刻部分性优化功能
B.可使用cache空间部分性优化功能
C.可经过矩阵分片优化功能
D.访存方面无优化能够
答案:
9.pthread_join的效果是____。
A.强行停止指定线程
B.检测指定线程是不是完毕
C.等候指定线程完毕才回来
D.向指定线程发送数据
答案:
10.运用____无法直接完成"主线程等候4个从线程完结使命"。
A.1个信号量
B.妨碍
C.1个互斥量
D.4个互斥量
答案:
11.OpenMP并行模型是一种____编程模型。
A.静态线程
B.动态线程
C.混合线程
D.众核
答案:
12.关于MPI_recv抵消息的区别,下列说法正确的是____。
A.只能运用音讯标签
B.能够运用MPI_ANY_TAG
C.能够运用音讯名
D.能够运用端标语
答案:
13.推进GPU应用于通用高功能计算迸发式增加的开发东西是____。
A.OpenGL
B.OpenCL
C.DirectX
D.CUDA
答案:
14.OpenMP是___的一个常见代替。
A.SSE
B.MPI
C.Pthread
D.CUDA
答案:
15.一个AVX存放器最多寄存____个整型数。
A.2
B.4
C.8
D.16
答案:
16.一个Neon存放器最多寄存____个整型数。
A.2
B.4
C.8
D.16
答案:
17.每个AVX存放器宽度为____位。
A.64
B.128
C.256
D.512
答案:
18.以下____是MPI根本原语。
A.MPI_barrier
B.MPI_Comm_numprocs
C.MPI_Comm_rank
D.MPI_Comm_Send
答案:
19.银河1号、银河2号、威风.太湖之光整体上都是____架构
A.单核
B.多核
C.众核
D.集群
答案:
20.编写矩阵乘法的Neon程序,若矩阵元素为单精度浮点数,则应对矩阵乘-加计算的循环进行____路循环打开。
A.2
B.4
C.8
D.16
答案:
21.履行pthread_rwlock_rdlock时,____的状况下加锁成功。
A.已有一个线程上了写锁
B.已有多个线程上了写锁
C.已有多个线程上了读锁
D.已有多个线程上了读锁和写锁
答案:
22.AVX是____渠道的SIMD架构。
A.x86
B.POWER
C.SPARC
D.ARM
答案:
23.和一对多播送对应的组通讯操作是____。
A.多对一搜集
B.多对多搜集
C.多对一归约
D.多对多归约
答案:
24.两个n*n的矩阵相乘,将一切n^2个乘法计算区分给不一样进程,再将对应某行某列的n个乘法成果累加得到成果矩阵对应元素,这是一种区分____的数据并行。
A.输入数据
B.中心成果
C.输出数据
D.暂时数据
答案:
25.为避免编译器不撑持OpenMP,应运用____完成OpenMP代码和普通代码的条件编译。
A."#include "
B."#pragma omp parallel"
C."#ifdef _OPENMP"
D."#define _OPENMP"
答案:
26.对矩阵每行排序的程序进行多线程并行化,对矩阵选用____。
A.简略均匀块区分即可确保负载均衡
B.循环区分才干完成负载均衡
C.动态区分才干完成负载均衡
D.随机区分才干完成负载均衡
答案:
27.加快比计算中串行时刻大概取求解同一疑问的哪个串行算法的时刻____。
A.恣意一个串行算法
B.作为并行算法基础的那个串行算法
C.已知最优的串行算法
D.一切串行算法的均匀时刻
答案:
28.当处理器数量不变时,跟着疑问规划增大,功率增大对____建立。
A.有些并行算法
B.一切并行算法
C.一切并行算法都不
D.以上皆错
答案:
29.运用一个信号量完成"主线程等候4个从线程完结使命",信号量初始值应设置为____。
A.0
B.1
C.2
D.4
答案:
30.OpenMP循环区分战略不包含____。
A.static
B.fixed
C.dynamic
D.guided
答案:
31.矩阵乘法疑问更合适运用MPI的____编程模型。
A.堵塞的
B.非堵塞的
C.对等的
D.主从的
答案:
32.将存放器设置为4个给定单精度浮点数的SSE intrinsics指令是____。
A._mm_set_ps
B._mm_set1_ss
C._mm_setzero_ss
D._mm_setzero_ps
答案:
33.操控流句子进行SIMD并行化很艰难的缘由是操控流句子致使____。
A.接连数据履行不一样指令
B.接连数据履行一样指令
C.同一数据履行不一样指令
D.同一数据履行一样指令
答案:
34.n个节点的超立方结构成本为____。
A.O(logn)
B.O(sqrt(n))
C.O(n)
D.O(nlogn)
答案:
35.MMX有____个专用存放器。
A.4
B.8
C.16
D.32
答案:
36.pthread_rwlock_rdlock是对读写锁进行____操作。
A.加锁
B.解锁
C.加读琐
D.加写锁
答案:
37.对下面程序,说法正确的是 # pragma omp parallel for num_threads(thread_count) \ reduction(+:sum) for (k = 1; k <= n; k++) { sum += factor/(2*k-1); factor = -factor; }
A.损坏了数据依靠
B.未损坏数据依靠
C.取决于变量声明
D.比临界区方法功能差
答案:
38.以下说法正确的是____。
A.多对多播送的高效算法根据一对多播送的高效算法
B.多对多归约的高效算法根据多对一归约的高效算法
C.多对多播送的高效算法根据串行的一对多播送算法
D.以上皆错
答案:
39.为了完成向量计算,SIMD架构还需供给____。
A.更大的内存容量
B.更快的内存传输
C.更宽的存放器
D.更快的网络传输
答案:
40.Pthread不撑持____。
A.创立并发履行线程
B.同步
C.非显式通讯
D.自动并行化
答案:
41.一个AVX存放器最多寄存____个单精度浮点数。
A.2
B.4
C.8
D.16
答案:
42.SSE intrinsics _mm_storeu_pd指令的功用是____。
A.对齐标量存单精度浮点数
B.未对齐标量存单精度浮点数
C.对齐向量存双精度浮点数
D.未对齐向量存双精度浮点数
答案:
43.一个Neon存放器最多寄存____个单精度浮点数。
A.2
B.4
C.8
D.16
答案:
44.在用pthread_mutex_lock对互斥量进行加锁时,若其已上锁,则线程进入____状况。
A.初始化
B.堵塞
C.继续履行
D.毁掉
答案:
45.对单精度浮点计算,SSE最高完成____路并行。
A.2
B.4
C.8
D.16
答案:
46.SSE intrinsics _mm_hadd_ps指令的功用是____。
A.存放器间单精度浮点数向量加法
B.存放器间双精度浮点数向量加法
C.存放器内单精度浮点数加法
D.存放器内双精度浮点数加法
答案:
47.有很多分支指令的程序不合适下面哪种体系结构进步行并行化?
A.SISD
B.SIMD
C.SPMD
D.MIMD
答案:
48.关于加快比S和处理器数量p,下列说法正确的是____。
A.有能够S>p
B.必定SC.不可以能S=p
D.两者无相关
答案:
49.在编写运用n个线程进行n个数求和的OpenMP的程序时选用临界区技术,则多线程版别____串行版别。
A.必定快于
B.必定慢于
C.能够快于
D.以上皆错
答案:
50.两个矩阵相乘,若矩阵总规划小于cache巨细,则优化访存的最好方法是____。
A.先将两个矩阵读入cache再进行乘法
B.先转置榜首个矩阵再进行乘法
C.先转置第二个矩阵再进行乘法
D.以上皆错
答案: