国开《大数据技术》形考任务3【答案】

作者:周老师 分类: 其他院校 发布时间: 2022-06-24 10:42

专业辅导各院校在线、离线考核、形考、终极考核、统考、社会调查报告、毕业论文写作交流等!

联系我们:QQ客服:3326650399   439328128    微信客服①:cs80188     微信客服②:cs80189

              扫一扫添加我为好友                           扫一扫添加我为好友

支付宝微信钱包



直接下载提交即可




“大数据技术” 课程形考作业三

一、单选题


1、下列传统并行计算结构,说法错误的是哪一项?


( ) 刀片效劳器、高速网、SAN,报价贵,拓展性差上


( ) 同享式(同享内存/同享存储),容错性好


( ) 编程难度高


( ) 实时、细粒度计算、计算密布型


2、下列关于MapReduce模型的描绘,错误的是哪一项?


( ) MapReduce选用“ 分而治之”战略


( ) MapReduce设计的一个理念即是“ 计算向数据挨近”


( ) MapReduce结构选用了Master/Slave架构


( ) MapReduce应用程序只能用Java来写


3、Hadoop1.0的中心组件( ),下列哪项是它的缺乏?


( ) 笼统层次高


( ) 表达才能有限,笼统层次低,需人工编码


( ) 报价贵重


( ) 可保护性低


4、下面哪个选项不归于Hadoop1.0 的疑问?


( ) 单一称号节点,存在单点失效疑问


( ) 单一命名空间,无法完成资源阻隔


( ) 资源管理功率低


( ) 很难上手


5、.下列有关Hive和Impala的比照错误的是:


(A)Hive与Impala运用一样的元数据


(B)Hive与Impala中对SQL的解说处理对比类似,都是经过词法剖析生成履行方案


(C)Hive合适于长期的批处理查询剖析,而Impala合适于实时交互式SQL查询


(D)Hive在内存缺乏以存储一切数据时,会运用外存,而Impala也是如此


6、下列关于Hive根本操作指令的解说错误的是:


(A)create database userdb;//创立数据库userdb


(B)create table if not exists usr(id bigint,namestring,age int);//假如usr表不存在,创立表usr,含三个特点id,name,age


(C) load data local inpath‘/usr/local/data’ overwrite into table usr; //把目录’/usr/local/data’下的数据文件中的数据以追加的方法装载进usr表


(D)insert overwrite table student select * fromuser where age>10; //向表usr1中刺进来自usr表的age大于10的数据并掩盖student表华夏稀有据


7、下面哪个不可以能是Hive的履行引擎:


(A)MapReduce


( )Tez


( )Storm


( )Spark


8、下列关于Spark的描绘,错误的是哪一项?


(A)Spark开始由美国加州伯克利大学( )的AMP试验室于2009年开发


(B)Spark在2014年打破了Hadoop坚持的基准排序纪录.


(C)Spark用非常之一的计算资源,取得了比Hadoop快3倍的速度


(D)Spark运转形式单一


9、下列关于Spark的描绘,错误的是哪一项?


(A)运用DAG履行引擎以撑持循环数据流与内存计算析


(B)可运转于独立的集群形式中,可运转于Hadoop中,也可运转于Amazon EC2等云环境中


(C)撑持运用Scala、Java、Python和R语言进行编程,可是不可以以经过Spark Shell进行交互式编程


(D)可运转于独立的集群形式中,可运转于Hadoop中,也可运转于Amazon EC2等云环境中


10、下列关于Scala特性的描绘,错误的是哪一项?


(A)Scala语法杂乱,可是能供给高雅的API计算


(B)Scala具有强壮的并发性,撑持函数式编程,能够非常好地撑持散布式系统


(C)Scala兼容Java,运转速度快,且能交融到Hadoop生态圈中


(D)Scala是Spark的首要编程语言


二、多选题


1、 MapReduce相较于传统的并行计算结构有啥优势?


( ) 非同享式,容错性好


( ) 普通PC机,廉价,拓展性好


( ) 编程简略,只需通知MapReduce做啥即可


( ) 批处理、非实时、数据密布型


2、 MapReduce体系结构首要由以下那几个有些构成?


( ) Client


( ) JobTracker


( ) TaskTracker


( ) Task


3、 下列关于MapReduce的体系结构的描绘,说法正确的有?


( ) 用户编写的MapReduce程序经过Client提交到JobTracker端


( ) JobTracker担任资源监控和作业调度


( ) TaskTracker监控一切TaskTracker与Job的安康情况


( ) TaskTracker 运用“slot”等量区分本节点上的资源量( )


4、下列选项中,哪些归于Hadoop1.0的中心组件的缺乏之处?


( ) 实时性差( )


( ) 资源糟蹋( )


( ) 履行迭代操作功率低


( ) 难以看到程序全体逻辑


5、Hadoop的优化与开展首要表现在哪几个方面?


( ) Hadoop本身中心组件MapReduce的架构设计改善


( ) Hadoop本身中心组件HDFS的架构设计改善


( ) Hadoop生态系统其它组件的不断丰厚


( ) Hadoop生态系统削减不用要的组件,结合系统


6、下列哪些归于Hadoop2.0相关于Hadoop1.0的改善?


( ) 设计了HDFS HA


( ) 供给称号节点热备机制


( ) 设计了HDFS Federation,管理多个命名空间


( ) 设计了新的资源管理结构YARN


7、 下列说法正确的是:


( ) 数据库房Hive不需求凭借于HDFS就能够完结数据的存储


( )Impala和Hive、HDFS、HBase等东西能够一致布置在一个Hadoop渠道上


( )Hive自身不存储和处理数据,依靠HDFS存储数据,依靠MapReduce处理数据


( )HiveQL语法与传统的SQL语法很类似


8、Impala首要由哪几个有些构成:


( )Impalad


( )State Store


( ) CLI


( ) Hive


9、Spark具有以下哪几个首要特色?


(A)运转速度快


(B)简单运用


(C)通用性


(D)运转形式单一


10、Scala具有以下哪几个首要特色?


(A)Scala的优势是供给了REPL( ),进步程序开发功率


(B)Scala兼容Java,运转速度快,且能交融到Hadoop生态圈中


(C)Scala具有强壮的并发性,撑持函数式编程


(D)Scala能够非常好地撑持散布式系统








专业辅导各院校在线、离线考核、形考、终极考核、统考、社会调查报告、毕业论文写作交流等!(非免费)

联系我们:QQ客服:3326650399   439328128    微信客服①:cs80188     微信客服②:cs80189

               扫一扫添加我为好友                           扫一扫添加我为好友

支付宝微信钱包