南开22春学期（高起本1709、全层次1803-2103）《大数据开发技术（一）》在线作业【标准答案】

作者:奥鹏周老师分类: 南开大学发布时间: 2022-11-08 18:53

作业答案联系QQ:3326650399 微信:cs80188

22春学期（高起本1709-1803、全层次1809-2103）《大数据开发技术（一）》在线作业-00001

试卷总分:100 得分:100

一、单选题 (共 30 道试题,共 60 分)

1.UMP系统中面临分库分表用户怎么进行资源调度()

A.能够同享同一个MySQL实例

B.每个用户独占一个MySQL实例

C.会占用多个独立的MySQL实例

D.随机分配MySQL实例

2.以下说法不正确的是()。

A.MapReduce的中心思想即是“分面治之”

B.HDFS是对GFS的开源完成

C.MapReduce是一种散布式计算模型

D.HDFS选用HBase作为其底层数据存储

3.HDFS中()记载了每个文件中各个块地点的数据节点的方位信息

A.NameNode

B.SecondaryNameNode

C.DataNode

D.Block

4.Amazon DynamoDB归于()

A.关系数据库

B.键值数据库

C.NoSQL数据库

D.数据库房

5.SQL Azure体系结构层中哪层是存储节点集群,适当于普通Web系统的数据库层

A.Client Layer

B.Services Layer

C.Platform Layer

D.Infrastructure Layer

6.以下对于Hive的说法不正确的是()。

A.Hive是一个根据Hadoop的数据库房东西

B.Hive是关系数据库

C.Hive QL是一种查询语言

D.Hive能够供给查询剖析存储等功用

7.Gephi是哪种可视化东西()

A.信息图表

B.地图东西

C.时刻线东西

D.剖析东西

8.SQL Azure体系结构层中哪层是硬件和操作系统

A.Client Layer

B.Services Layer

C.Platform Layer

D.Infrastructure Layer

9.UMP系经过()来完成完成在不断机的状况下动态扩容、缩容和搬迁

A.Controller效劳器

B.Procy效劳器

C.愚公系统

D.Agent效劳器

10.Amazon SimpleDB归于()

A.关系数据库

B.键值数据库

C.NoSQL数据库

D.数据库房

11.关于Storm中Topology说法错误的是()。

A.Topology可视为流通换图

B.Topology能够被提交到Storm集群履行

C.在Topology里边能够指定每个组件的并行度， Storm会在集群里边分配那么多的线程来一起计算

D.Topology里边的每一个组件都是串行运转的

12.谷歌 Fusion Tables是哪种可视化东西()

A.信息图表

B.地图东西

C.时刻线东西

D.剖析东西

13.Pregel计算模型中每个极点ID的类型是()

A.String

B.Int

C.Double

D.结构体

14.HDFS中ClientProtocol的()方法告诉称号节点封闭文件

A.close

B.finish

C.exit

D.complete

15.Storm结构在处理()上比MapReduce更有优势。

A.静态数据

B.流数据

C.批量数据

D.网络数据

16.以下亚马逊的商品中哪个是数据库房

A.ElastiCache

B.RDS

C.DynamoDB

D.Redshift

17.长处是拓展性好,灵敏性好,很多写操作时功能高的数据库是()

A.列族数据库

B.键值数据库

C.图数据库

D.文档数据库

18.Pregel计算模型以()作为输入

A.有向图

B.无向图

C.矢量图

D.树

19.运用Amazon云环境布置Hadoop的说法中错误的是()。

A.Hadoop不只能够运转在企业界部的集群中，也能够运转在云计算环境中

B.Hadoop自带有一套脚本，用于在EC2上面运转Hadoop

C.在EC2上运转Hadoop特别适用于一些工作流

D.Amazon EC2为Hadoop供给了存储效劳

20.NoSQL中的CAP理论中的P代表()

A.共同性

B.可用性

C.分区忍受性

D.可拓展性

21.Storm结构不适用于哪个范畴()。

A.实时剖析

B.实时交通

C.远程RPC

D.前史记载查询

22.Amazon Redshift归于()

A.关系数据库

B.键值数据库

C.NoSQL数据库

D.数据库房

23.以下哪个不归于MongoDB的特色

A.供给了面向文档的存储

B.能够设置任何特点索引

C.具有极好的笔直可拓展性

D.撑持丰厚的查询表达式

24.HBase的客户端并不依靠Master,而是经过()来取得Region方位信息,大大都客户端乃至历来不好Master通讯,这种设计方法使得Master负载很小

A.Master

B.Region

C.Zookeeper

D.Chubby

25.()是一个通用文件系统的笼统基类,能够被散布式文件系统承继

A.DistributedFileSystem

B.GFSSystem

C.FileSystem

D.HDFSSystem

26.词频计算即是典型的()运算。

A.关系衔接

B.分组聚合

C.关系代数

D.矩阵

27.行式数据库选用()存储模型

A.NSM

B.DSM

C.Hbase

D.MySQL

28.列式数据库选用()存储模型

A.NSM

B.DSM

C.Hbase

D.MySQL

29.Storm中假如要确保一样字段的Tuple分配到同一个Task中,大概选用哪种Stream Groupings()。

A.ShuffleGrouping

B.AllGrouping

C.GlobalGrouping

D.FiedlsGrouping

30.信息技术开展史上的第三次信息化浪潮处理的疑问是啥()。

A.信息处理

B.信息增加

C.信息爆破

D.信息传输

二、多选题 (共 10 道试题,共 20 分)

31.以下图计算软件哪种归于根据遍历算法的、实时的图数据库

A.Neo4j

B.OrientDB

C.Infinite Graph

D.Pregel

32.散布式文件系统的设计意图包含()。

A.并发操控

B.可弹性性

C.容错

D.速度

33.MapReduce的main函数中设置输出类型的方法有()。

A.setOutputKeyClass

B.setOutputClass

C.setOutputValueClass

D.setKeyValueClass

34.以下哪些是数据可视化时刻线东西()

A.Echarts

B.Timetoast

C.Xtimeline

D.R

35.HDFS中NameNode保留的中心数据结构是()

A.FsImage

B.DataNode

C.Block

D.EditLog

36.关系数据库与NoSQL数据库比较适用于哪些范畴()

A.电信

B.银行

C.互联网企业大数据处理

D.传统企业的数据剖析

37.以下哪种数据库归于NoSQL数据库()

A.MongoDB

B.Oracle

C.Neo4j

D.Redis

E.Hbase

38.HDFS要完成的方针

A.流数据读写

B.大数据集的操作

C.杂乱的文件模型

D.强壮的跨渠道兼容性

39.以下哪些是数据可视化信息图表东西()

A.大数据魔镜

B.D3

C.谷歌 Chart API

D.谷歌 Fusion Tables

40.NoSQL数据库与关系数据库比较适用于哪些范畴()

A.电信

B.银行

C.互联网企业大数据处理

D.传统企业的数据剖析

三、判别题 (共 10 道试题,共 20 分)

41.Hbase中为每个Region效劳器装备了一个HLog文件,它是一种后写式日志

42.Pregel的音讯形式选用异步和批量的方法传递音讯,却无法减轻远程读取的推迟

43.大数据决议计划逐步变成一种新的决议计划方法,大数据应用有力推进了信息技术与各职业的深度交融,大数据开发大大推进了新技术和新应用的不断出现。

44.Storm中的Tuple是一个Key-Value的Map,但也能够填入一个Value-List。

45.HDFS在块的巨细的设计上显着要小于普通文件系统,能够最小化寻址开支

46.Linux系统中只要Ubuntu能够装置Hadoop。

47.Storm中Bolt能够履行过滤、函数操作、Join、操作数据库等任何操作。

48.Pregel将计算细化到极点,一起在极点内操控循环迭代次数,而MapReduce则将计算批量化处理,按使命进行循环迭代操控

49.Hbase中每个Region 运用一个Hlog

50.MapReduce履行程序时能够直接运转.class文件

作业答案联系QQ:3326650399 微信:cs80188