国开《大数据技术》形考任务3【答案】

作者:周老师分类: 其他院校发布时间: 2022-06-24 10:42

专业辅导各院校在线、离线考核、形考、终极考核、统考、社会调查报告、毕业论文写作交流等！

联系我们：QQ客服：3326650399 439328128 微信客服①：cs80188 微信客服②：cs80189

扫一扫添加我为好友扫一扫添加我为好友

支付宝微信钱包

直接下载提交即可

“大数据技术” 课程形考作业三

一、单选题

1、下列传统并行计算结构，说法错误的是哪一项？

（）刀片效劳器、高速网、SAN，报价贵，拓展性差上

（）同享式(同享内存/同享存储)，容错性好

（）编程难度高

（）实时、细粒度计算、计算密布型

2、下列关于MapReduce模型的描绘，错误的是哪一项？

（） MapReduce选用“ 分而治之”战略

（） MapReduce设计的一个理念即是“ 计算向数据挨近”

（） MapReduce结构选用了Master/Slave架构

（） MapReduce应用程序只能用Java来写

3、Hadoop1.0的中心组件（），下列哪项是它的缺乏？

（）笼统层次高

（）表达才能有限，笼统层次低，需人工编码

（）报价贵重

（）可保护性低

4、下面哪个选项不归于Hadoop1.0 的疑问？

（）单一称号节点，存在单点失效疑问

（）单一命名空间，无法完成资源阻隔

（）资源管理功率低

（）很难上手

5、.下列有关Hive和Impala的比照错误的是:

(A)Hive与Impala运用一样的元数据

(B)Hive与Impala中对SQL的解说处理对比类似，都是经过词法剖析生成履行方案

(C)Hive合适于长期的批处理查询剖析，而Impala合适于实时交互式SQL查询

(D)Hive在内存缺乏以存储一切数据时，会运用外存，而Impala也是如此

6、下列关于Hive根本操作指令的解说错误的是:

(A)create database userdb;//创立数据库userdb

(B)create table if not exists usr(id bigint,namestring,age int);//假如usr表不存在，创立表usr，含三个特点id,name,age

(D)insert overwrite table student select * fromuser where age>10; //向表usr1中刺进来自usr表的age大于10的数据并掩盖student表华夏稀有据

7、下面哪个不可以能是Hive的履行引擎：

(A)MapReduce

（）Tez

（）Storm

（）Spark

8、下列关于Spark的描绘，错误的是哪一项？

(A)Spark开始由美国加州伯克利大学（）的AMP试验室于2009年开发

(B)Spark在2014年打破了Hadoop坚持的基准排序纪录.

(C)Spark用非常之一的计算资源，取得了比Hadoop快3倍的速度

(D)Spark运转形式单一

9、下列关于Spark的描绘，错误的是哪一项？

(A)运用DAG履行引擎以撑持循环数据流与内存计算析

(B)可运转于独立的集群形式中，可运转于Hadoop中，也可运转于Amazon EC2等云环境中

(C)撑持运用Scala、Java、Python和R语言进行编程，可是不可以以经过Spark Shell进行交互式编程

(D)可运转于独立的集群形式中，可运转于Hadoop中，也可运转于Amazon EC2等云环境中

10、下列关于Scala特性的描绘，错误的是哪一项？

(A)Scala语法杂乱，可是能供给高雅的API计算

(B)Scala具有强壮的并发性，撑持函数式编程，能够非常好地撑持散布式系统

(C)Scala兼容Java，运转速度快，且能交融到Hadoop生态圈中

(D)Scala是Spark的首要编程语言

二、多选题

1、 MapReduce相较于传统的并行计算结构有啥优势？

（）非同享式，容错性好

（）普通PC机，廉价，拓展性好

（）编程简略，只需通知MapReduce做啥即可

（）批处理、非实时、数据密布型

2、 MapReduce体系结构首要由以下那几个有些构成？

（） Client

（） JobTracker

（） TaskTracker

（） Task

3、下列关于MapReduce的体系结构的描绘，说法正确的有？

（）用户编写的MapReduce程序经过Client提交到JobTracker端

（） JobTracker担任资源监控和作业调度

（） TaskTracker监控一切TaskTracker与Job的安康情况

（） TaskTracker 运用“slot”等量区分本节点上的资源量（）

4、下列选项中，哪些归于Hadoop1.0的中心组件的缺乏之处？

（）实时性差（）

（）资源糟蹋（）

（）履行迭代操作功率低

（）难以看到程序全体逻辑

5、Hadoop的优化与开展首要表现在哪几个方面？

（） Hadoop本身中心组件MapReduce的架构设计改善

（） Hadoop本身中心组件HDFS的架构设计改善

（） Hadoop生态系统其它组件的不断丰厚

（） Hadoop生态系统削减不用要的组件，结合系统

6、下列哪些归于Hadoop2.0相关于Hadoop1.0的改善？

（）设计了HDFS HA

（）供给称号节点热备机制

（）设计了HDFS Federation，管理多个命名空间

（）设计了新的资源管理结构YARN

7、下列说法正确的是：

（）数据库房Hive不需求凭借于HDFS就能够完结数据的存储

（）Impala和Hive、HDFS、HBase等东西能够一致布置在一个Hadoop渠道上

（）Hive自身不存储和处理数据，依靠HDFS存储数据，依靠MapReduce处理数据

（）HiveQL语法与传统的SQL语法很类似

8、Impala首要由哪几个有些构成:

（）Impalad

（）State Store

（） CLI

（） Hive

9、Spark具有以下哪几个首要特色？

(A)运转速度快

(B)简单运用

(C)通用性

(D)运转形式单一

10、Scala具有以下哪几个首要特色？

(A)Scala的优势是供给了REPL（），进步程序开发功率

(B)Scala兼容Java，运转速度快，且能交融到Hadoop生态圈中

(C)Scala具有强壮的并发性，撑持函数式编程

(D)Scala能够非常好地撑持散布式系统

国开(1585)形考(287)

专业辅导各院校在线、离线考核、形考、终极考核、统考、社会调查报告、毕业论文写作交流等！（非免费）

联系我们：QQ客服：3326650399 439328128 微信客服①：cs80188 微信客服②：cs80189

扫一扫添加我为好友扫一扫添加我为好友

支付宝微信钱包