东大24秋《大数据技术》在线平时作业2【标准答案】 作者:周老师 分类: 东北大学 发布时间: 2024-08-17 17:38 专业辅导各院校在线、离线考核、形考、终极考核、统考、社会调查报告、毕业论文写作交流等! 联系我们:QQ客服:3326650399 439328128 微信客服①:cs80188 微信客服②:cs80189 扫一扫添加我为好友 扫一扫添加我为好友 《大数据技术》在线平常作业2-00001 试卷总分:100 得分:100 一、单选题 (共 10 道试题,共 50 分) 1.( )能够在已知研讨对象现已分为若干类的状况下,断定新的对象归于哪一类 A.间隔原则 B.Fisher原则 C.贝叶斯原则 D.以上一切 2.大数据的4V特征中的Variety是指( )。 A.价值密度低 B.处理速度快 C.数据类型繁复 D.数据体量无穷 3.语义剖析是从文本和语音数据中由( )获取有含义的信息的实习。 A.机器 B.人工 C.数据发掘 D.数值剖析 4.每个剖析项目都大概毫无破例地从一个明晰界说好的( )开端。 A.事务方针 B.政策政策 C.赢利目标 D.质量目标 5.Hadoop 作者 A.Hadoop B.Nutch C.Lucene D.Solr 6.能够用3个特征相结合来界说大数据:即( )。 A.数量、数值和速度 B.巨大容量、极疾速度和多样丰厚的数据 C.数量、速度和价值 D.丰厚的数据、极快的速度、极大的能量 7.( )倾向于在剖析方面有无穷出资的团队中工作,或许在供给剖析效劳的安排中担任咨询师和开发者 A.显现 B.加载 C.打印 D.开释 8.下列( )不是预测剖析的首要效果。 A.辨认、获取、过滤、获取、整理和聚合 B.打印、计算、过滤、获取、整理和聚合 C.统计、计算、过滤、存储、整理和聚合 D.存储、获取、统计、计算、剖析和打印 9.语义检索是指在( )安排的基础上,从常识库中检索出常识的过程,是一种根据这个别系,可以完成常识相关和概念语义检索的智能化的检索方法。 A.网络 B.信息 C.字符 D.常识 10.时刻序列图能够剖析在固守时间距离记载的数据,它一般用( )图表明,x轴表明时刻,y轴记载数据值。 A.圆饼 B.折线 C.热区 D.直方 二、多选题 (共 5 道试题,共 25 分) 11.下列关于Bloom Filter的描绘正确的是? A.是一个很长的二进制向量和一系列随机映射函数 B.没有误算率 C.有必定的误算率 D.能够在Bloom Filter中删去元素 12.在网络爬虫的匍匐战略中,应用最为基础的是 A.深度优先遍历战略 B.广度优先遍历战略 C.高度优先遍历战略 D.反向连接战略 E.大战优先战略 13.下列哪个是 Hadoop 运转的形式? A.单机版 B.伪散布式 C.散布式 14.HBase功能优化包括下面的哪些选项? A.读优化 B.写优化 C.装备优化 D.JVM优化 15.大数据人才全体上需求具有( )等中心常识。 A.数学与统计常识 B.计算机有关常识 C.马克思主义哲学常识 D.市场运营管理常识 E.在特定事务范畴的常识 三、判别题 (共 5 道试题,共 25 分) 16.由于 HDFS 有多个副本,所以 NameNode 是不存在单点疑问的。 17.Hadoop 环境变量中的 HADOOP_HEAPSIZE 用于设置一切 Hadoop 看护线程的内存。它默许是 200 GB。 18.Ganglia 不只能够进行监控,也能够进行告警。 19.集群内每个节点都大概配 RAID,这样防止单磁盘损坏,影响整个节点运转。 20.Hadoop 是 Java 开发的,所以 MapReduce 只撑持 Java 语言编写。 专业辅导各院校在线、离线考核、形考、终极考核、统考、社会调查报告、毕业论文写作交流等!(非免费) 联系我们:QQ客服:3326650399 439328128 微信客服①:cs80188 微信客服②:cs80189 扫一扫添加我为好友 扫一扫添加我为好友
试卷总分:100 得分:100
一、单选题 (共 10 道试题,共 50 分)
1.( )能够在已知研讨对象现已分为若干类的状况下,断定新的对象归于哪一类
A.间隔原则
B.Fisher原则
C.贝叶斯原则
D.以上一切
2.大数据的4V特征中的Variety是指( )。
A.价值密度低
B.处理速度快
C.数据类型繁复
D.数据体量无穷
3.语义剖析是从文本和语音数据中由( )获取有含义的信息的实习。
A.机器
B.人工
C.数据发掘
D.数值剖析
4.每个剖析项目都大概毫无破例地从一个明晰界说好的( )开端。
A.事务方针
B.政策政策
C.赢利目标
D.质量目标
5.Hadoop 作者
A.Hadoop
B.Nutch
C.Lucene
D.Solr
6.能够用3个特征相结合来界说大数据:即( )。
A.数量、数值和速度
B.巨大容量、极疾速度和多样丰厚的数据
C.数量、速度和价值
D.丰厚的数据、极快的速度、极大的能量
7.( )倾向于在剖析方面有无穷出资的团队中工作,或许在供给剖析效劳的安排中担任咨询师和开发者
A.显现
B.加载
C.打印
D.开释
8.下列( )不是预测剖析的首要效果。
A.辨认、获取、过滤、获取、整理和聚合
B.打印、计算、过滤、获取、整理和聚合
C.统计、计算、过滤、存储、整理和聚合
D.存储、获取、统计、计算、剖析和打印
9.语义检索是指在( )安排的基础上,从常识库中检索出常识的过程,是一种根据这个别系,可以完成常识相关和概念语义检索的智能化的检索方法。
A.网络
B.信息
C.字符
D.常识
10.时刻序列图能够剖析在固守时间距离记载的数据,它一般用( )图表明,x轴表明时刻,y轴记载数据值。
A.圆饼
B.折线
C.热区
D.直方
二、多选题 (共 5 道试题,共 25 分)
11.下列关于Bloom Filter的描绘正确的是?
A.是一个很长的二进制向量和一系列随机映射函数
B.没有误算率
C.有必定的误算率
D.能够在Bloom Filter中删去元素
12.在网络爬虫的匍匐战略中,应用最为基础的是
A.深度优先遍历战略
B.广度优先遍历战略
C.高度优先遍历战略
D.反向连接战略
E.大战优先战略
13.下列哪个是 Hadoop 运转的形式?
A.单机版
B.伪散布式
C.散布式
14.HBase功能优化包括下面的哪些选项?
A.读优化
B.写优化
C.装备优化
D.JVM优化
15.大数据人才全体上需求具有( )等中心常识。
A.数学与统计常识
B.计算机有关常识
C.马克思主义哲学常识
D.市场运营管理常识
E.在特定事务范畴的常识
三、判别题 (共 5 道试题,共 25 分)
16.由于 HDFS 有多个副本,所以 NameNode 是不存在单点疑问的。
17.Hadoop 环境变量中的 HADOOP_HEAPSIZE 用于设置一切 Hadoop 看护线程的内存。它默许是 200 GB。
18.Ganglia 不只能够进行监控,也能够进行告警。
19.集群内每个节点都大概配 RAID,这样防止单磁盘损坏,影响整个节点运转。
20.Hadoop 是 Java 开发的,所以 MapReduce 只撑持 Java 语言编写。
专业辅导各院校在线、离线考核、形考、终极考核、统考、社会调查报告、毕业论文写作交流等!(非免费)
联系我们:QQ客服:3326650399 439328128 微信客服①:cs80188 微信客服②:cs80189
扫一扫添加我为好友 扫一扫添加我为好友