[南开大学]20秋学期《数据分析》在线作业 作者:周老师 分类: 南开大学 发布时间: 2020-10-19 13:45 专业辅导各院校在线、离线考核、形考、终极考核、统考、社会调查报告、毕业论文写作交流等! 联系我们:QQ客服:3326650399 439328128 微信客服①:cs80188 微信客服②:cs80189 扫一扫添加我为好友 扫一扫添加我为好友 答案来历:熊猫奥鹏(www.188open.com)-[南开大学]20秋学期(1709、1803、1809、1903、1909、2003、2009 )《数据剖析》在线作业 试卷总分:100 得分:100 第1题,()反映了学习方法对不知的测试数据集的预测才能,是学习中的重要概念 A、练习差错 B、测试差错 C、统计差错 D、均匀差错 正确答案: 第2题,撑持向量机的MapReduce完成要进行几轮MapReduce() A、1 B、2 C、3 D、自行规则 正确答案: 第3题,类的R型聚类是指() A、对样本个别进行聚类 B、对目标变量进行聚类。 正确答案: 第4题,在估量PLSA生成模型的参数时,运用() A、极大似然估量 B、对数似然函数 C、特征独立假定 D、贝叶斯定理 正确答案: 答案来历:熊猫奥鹏(www.188open.com),在连接做弊的废物农场中,做弊者具有并彻底操控的网页称为() A、不可以达网页 B、可达网页 C、自有网页 正确答案: 第6题,潜在语义剖析立异地引进了() A、单词维度 B、文本维度 C、论题维度 正确答案: 第7题,非频频形式() A、其相信度小于阈值 B、令人不感爱好 C、包括负形式和负有关形式 D、对反常数据项灵敏 正确答案: 第8题,相信度(confidence)是衡量爱好度衡量()的目标 A、简练性 B、断定性 C、实用性 D、新颖性 正确答案: 第9题,决议计划树中的叶结点表明() A、特征 B、类 C、特点 D、值域输出 正确答案: 答案来历:熊猫奥鹏(www.188open.com),数据发生方法革新中数据发生方法是自动的首要是来自哪个期间()。 A、运营式系统期间 B、用户自创内容期间 C、感知式系统期间 正确答案: 第11题,文本中一切单词的呈现状况表明了文本的() A、品种 B、特征 C、语义内容 D、语义结构 正确答案: 答案来历:熊猫奥鹏(www.188open.com),闵式间隔参数是()年代表曼哈顿间隔 A、0 B、1 C、2 D、无量 正确答案: 第13题,为了计算中介度,有必要计算一切边上()的数目。 A、一切途径 B、最短途径 C、结点入度 D、节点出度 正确答案: 第14题,聚类归于() A、有监督学习 B、无监督学习 C、强化学习 D、对立学习 正确答案: 答案来历:熊猫奥鹏(www.188open.com),评估分类器作用时,表明正确分类的样本数与总样本数之比的目标是()。 A、精确率 B、准确率 C、召回率 D、F1值 正确答案: 第16题,逻辑斯谛散布的散布函数规模在() A、(-∞,+∞) B、(0,1) C、(-1/2,1/2) D、(-1,1) 正确答案: 第17题,Apriori算法的加快过程依靠于以下哪个战略( ) A、抽样 B、剪枝 C、缓冲 D、并行 正确答案: 第18题,向量空间模型中,将单词在文本中呈现的数据用一个()表明 A、单词-文本矩阵 B、单词-向量矩阵 C、间隔矩阵 D、权重矩阵 正确答案: 第19题,潜在语义剖析中,以()表明文本的语义内容 A、论题 B、论题向量 C、语义向量 D、间隔向量 正确答案: 答案来历:熊猫奥鹏(www.188open.com),KNN算法用MapReduce完成,要进行几轮MapReduce() A、1 B、2 C、3 D、4 正确答案: 第21题,按社团构成机制分类,社团包含() A、显着的社团 B、预订义社团 C、自安排社团 D、隐含的社团 正确答案:,C 第22题,决议计划树的生成过程是() A、递归地进行下去,直至一切练习据子集被根本正确分类,或许没有适宜的特征停止,最终每个子集都被分到叶结点上,即都有了清晰的类 B、假如这些子集现已可以被根本正确分类,那么构建叶结点,并将这些子集分到所对应的叶结点中去 C、构建根结点,将一切练习数据都放在根结点 D、挑选一个最优特征,依照这一特征将练习数据集切割成子集,使得各个子集有一个在当时条件下最佳的分类 E、假如还有子集不能被根本正确分类,那么就对这些子集挑选新的最优特征,继续对其进行切割,构建相应的结点 正确答案: 第23题,回归剖析方法中,依照输入变量个数分类,可分为 A、一元回归 B、多元回归 C、线性回归 D、非线性回归 正确答案: 第24题,下列哪些使命合适构建分类模型() A、银职业务中,客户请求借款,依据客户的有关数据剖析他是归于"诚信"类仍是"失期"类 B、邮件系统能够依据email标题和内容区别出废物邮件 C、医学研讨人员依据病理数据,合理辨识病况情况,采纳合理医治手法 D、房价预测 正确答案: 答案来历:熊猫奥鹏(www.188open.com),ID3算法流程为() A、从根结点开端,对结点计算一切能够的特征的信息增益,挑选信息增益最大的特征作为结点的特征,由该特征的不一样取值树立子结点 B、一切特征的信息增益均很小或没有特征能够挑选 C、得到一个决议计划树 D、对子结点递归地调用,构建决议计划树 正确答案: 第26题,大数据在电信中的应用有 A、根据用户、事务及流量分级的多维管控机制 B、精准的客户剖析及营销 C、使用方位和轨道信息效劳社会 正确答案:,B,C 第27题,统计学习方法的构成 A、监督学习 B、无监督学习 C、强化学习 正确答案: 第28题,大数据在教学中的应用 A、网上揭露课 B、慕课 C、才智学校 D、翻转讲堂 正确答案:,B,C,D 第29题,下列归于朴素贝叶斯缺陷的是() A、分类作用不安稳 B、不合适增量式练习 C、先验模型能够致使成果欠安 D、对缺失数据不太灵敏 正确答案:,D 答案来历:熊猫奥鹏(www.188open.com),根据分类对象的分类有() A、Q型聚类 B、凝集方法 C、R型聚类 D、分化方法 正确答案: 第31题,kNN算法中,挑选较大的k值"学习"的估量差错会减小。() T、对 F、错 正确答案: 第32题,SVM是在特征空间上的距离最大的线性分类器。() T、对 F、错 正确答案: 第33题,可信度是对相关规矩的精确度的衡量。 T、对 F、错 更新答案联系微信或QQ 熊猫奥鹏(www.188open.com) 第34题,要避免过拟合,进行最优的模型挑选,即挑选杂乱度最恰当的模型,以到达使测试差错最小的学习意图 T、对 F、错 正确答案: 第35题,假如一个网页被许多网页所指向,那么该网页很能够是重要的。() T、对 F、错 正确答案: 第36题,FP-growth算法能够防止冗余的IO读写 T、对 F、错 更新答案联系微信或QQ 熊猫奥鹏(www.188open.com) 第37题,经过剖析已知练习样本种类的数据集特点,经过练习树立相应分类模型,是监督学习。() T、对 F、错 正确答案: 第38题,大数据的速度快表现在数据发生速度快和要求剖析处理速度快 T、对 F、错 更新答案联系微信或QQ 熊猫奥鹏(www.188open.com) 第39题,ID3算法的中心是在决议计划树叶结点上应用信息增益原则挑选特征,递归地构建决议计划树。 T、对 F、错 正确答案: 第40题,数据收集,又称数据获取,是大数据生命周期的榜首个环节,经过RFID射频辨认技术、传感器、交互型社交网络以及移动互联网等方法取得的各品种型的结构化、半结构化及非结构化的海量数据。 T、对 F、错 正确答案: 第41题,TrustRank算法中,创立优质网页调集时,不会挑选成员受限的域名。 T、对 F、错 正确答案: 第42题,聚类剖析中,一个类是样本的一个子集。 T、对 F、错 正确答案: 第43题,决议计划树中为了避免过拟合表象能够对已生成的树自上而下剪枝。() T、对 F、错 正确答案: 第44题,k均值聚类是硬聚类。() T、对 F、错 正确答案: 第45题,相关规矩能够用枚举的方法发生。 T、对 F、错 更新答案联系微信或QQ 熊猫奥鹏(www.188open.com) 第46题,DAG中的父节点是仅有的。 T、对 F、错 正确答案:F 第47题,PageRank算法是图数据上的无监督学习方法。() T、对 F、错 正确答案: 第48题,TF-IDF算法中,IDF指的是文档频率 T、对 F、错 正确答案: 第49题,监督学习是从标示数据中学习预测模型的机器学习疑问 T、对 F、错 正确答案: 答案来历:熊猫奥鹏(www.188open.com),朴素贝叶斯等价于希望危险最小化。() T、对 F、错 正确答案: 数据分析(3)秋(12179)南开(5584)学期(8554)大学(10551) 专业辅导各院校在线、离线考核、形考、终极考核、统考、社会调查报告、毕业论文写作交流等!(非免费) 联系我们:QQ客服:3326650399 439328128 微信客服①:cs80188 微信客服②:cs80189 扫一扫添加我为好友 扫一扫添加我为好友
试卷总分:100 得分:100
第1题,()反映了学习方法对不知的测试数据集的预测才能,是学习中的重要概念
A、练习差错
B、测试差错
C、统计差错
D、均匀差错
正确答案:
第2题,撑持向量机的MapReduce完成要进行几轮MapReduce()
A、1
B、2
C、3
D、自行规则
正确答案:
第3题,类的R型聚类是指()
A、对样本个别进行聚类
B、对目标变量进行聚类。
正确答案:
第4题,在估量PLSA生成模型的参数时,运用()
A、极大似然估量
B、对数似然函数
C、特征独立假定
D、贝叶斯定理
正确答案:
答案来历:熊猫奥鹏(www.188open.com),在连接做弊的废物农场中,做弊者具有并彻底操控的网页称为()
A、不可以达网页
B、可达网页
C、自有网页
正确答案:
第6题,潜在语义剖析立异地引进了()
A、单词维度
B、文本维度
C、论题维度
正确答案:
第7题,非频频形式()
A、其相信度小于阈值
B、令人不感爱好
C、包括负形式和负有关形式
D、对反常数据项灵敏
正确答案:
第8题,相信度(confidence)是衡量爱好度衡量()的目标
A、简练性
B、断定性
C、实用性
D、新颖性
正确答案:
第9题,决议计划树中的叶结点表明()
A、特征
B、类
C、特点
D、值域输出
正确答案:
答案来历:熊猫奥鹏(www.188open.com),数据发生方法革新中数据发生方法是自动的首要是来自哪个期间()。
A、运营式系统期间
B、用户自创内容期间
C、感知式系统期间
正确答案:
第11题,文本中一切单词的呈现状况表明了文本的()
A、品种
B、特征
C、语义内容
D、语义结构
正确答案:
答案来历:熊猫奥鹏(www.188open.com),闵式间隔参数是()年代表曼哈顿间隔
A、0
B、1
C、2
D、无量
正确答案:
第13题,为了计算中介度,有必要计算一切边上()的数目。
A、一切途径
B、最短途径
C、结点入度
D、节点出度
正确答案:
第14题,聚类归于()
A、有监督学习
B、无监督学习
C、强化学习
D、对立学习
正确答案:
答案来历:熊猫奥鹏(www.188open.com),评估分类器作用时,表明正确分类的样本数与总样本数之比的目标是()。
A、精确率
B、准确率
C、召回率
D、F1值
正确答案:
第16题,逻辑斯谛散布的散布函数规模在()
A、(-∞,+∞)
B、(0,1)
C、(-1/2,1/2)
D、(-1,1)
正确答案:
第17题,Apriori算法的加快过程依靠于以下哪个战略( )
A、抽样
B、剪枝
C、缓冲
D、并行
正确答案:
第18题,向量空间模型中,将单词在文本中呈现的数据用一个()表明
A、单词-文本矩阵
B、单词-向量矩阵
C、间隔矩阵
D、权重矩阵
正确答案:
第19题,潜在语义剖析中,以()表明文本的语义内容
A、论题
B、论题向量
C、语义向量
D、间隔向量
正确答案:
答案来历:熊猫奥鹏(www.188open.com),KNN算法用MapReduce完成,要进行几轮MapReduce()
A、1
B、2
C、3
D、4
正确答案:
第21题,按社团构成机制分类,社团包含()
A、显着的社团
B、预订义社团
C、自安排社团
D、隐含的社团
正确答案:,C
第22题,决议计划树的生成过程是()
A、递归地进行下去,直至一切练习据子集被根本正确分类,或许没有适宜的特征停止,最终每个子集都被分到叶结点上,即都有了清晰的类
B、假如这些子集现已可以被根本正确分类,那么构建叶结点,并将这些子集分到所对应的叶结点中去
C、构建根结点,将一切练习数据都放在根结点
D、挑选一个最优特征,依照这一特征将练习数据集切割成子集,使得各个子集有一个在当时条件下最佳的分类
E、假如还有子集不能被根本正确分类,那么就对这些子集挑选新的最优特征,继续对其进行切割,构建相应的结点
正确答案:
第23题,回归剖析方法中,依照输入变量个数分类,可分为
A、一元回归
B、多元回归
C、线性回归
D、非线性回归
正确答案:
第24题,下列哪些使命合适构建分类模型()
A、银职业务中,客户请求借款,依据客户的有关数据剖析他是归于"诚信"类仍是"失期"类
B、邮件系统能够依据email标题和内容区别出废物邮件
C、医学研讨人员依据病理数据,合理辨识病况情况,采纳合理医治手法
D、房价预测
正确答案:
答案来历:熊猫奥鹏(www.188open.com),ID3算法流程为()
A、从根结点开端,对结点计算一切能够的特征的信息增益,挑选信息增益最大的特征作为结点的特征,由该特征的不一样取值树立子结点
B、一切特征的信息增益均很小或没有特征能够挑选
C、得到一个决议计划树
D、对子结点递归地调用,构建决议计划树
正确答案:
第26题,大数据在电信中的应用有
A、根据用户、事务及流量分级的多维管控机制
B、精准的客户剖析及营销
C、使用方位和轨道信息效劳社会
正确答案:,B,C
第27题,统计学习方法的构成
A、监督学习
B、无监督学习
C、强化学习
正确答案:
第28题,大数据在教学中的应用
A、网上揭露课
B、慕课
C、才智学校
D、翻转讲堂
正确答案:,B,C,D
第29题,下列归于朴素贝叶斯缺陷的是()
A、分类作用不安稳
B、不合适增量式练习
C、先验模型能够致使成果欠安
D、对缺失数据不太灵敏
正确答案:,D
答案来历:熊猫奥鹏(www.188open.com),根据分类对象的分类有()
A、Q型聚类
B、凝集方法
C、R型聚类
D、分化方法
正确答案:
第31题,kNN算法中,挑选较大的k值"学习"的估量差错会减小。()
T、对
F、错
正确答案:
第32题,SVM是在特征空间上的距离最大的线性分类器。()
T、对
F、错
正确答案:
第33题,可信度是对相关规矩的精确度的衡量。
T、对
F、错
更新答案联系微信或QQ 熊猫奥鹏(www.188open.com)
第34题,要避免过拟合,进行最优的模型挑选,即挑选杂乱度最恰当的模型,以到达使测试差错最小的学习意图
T、对
F、错
正确答案:
第35题,假如一个网页被许多网页所指向,那么该网页很能够是重要的。()
T、对
F、错
正确答案:
第36题,FP-growth算法能够防止冗余的IO读写
T、对
F、错
更新答案联系微信或QQ 熊猫奥鹏(www.188open.com)
第37题,经过剖析已知练习样本种类的数据集特点,经过练习树立相应分类模型,是监督学习。()
T、对
F、错
正确答案:
第38题,大数据的速度快表现在数据发生速度快和要求剖析处理速度快
T、对
F、错
更新答案联系微信或QQ 熊猫奥鹏(www.188open.com)
第39题,ID3算法的中心是在决议计划树叶结点上应用信息增益原则挑选特征,递归地构建决议计划树。
T、对
F、错
正确答案:
第40题,数据收集,又称数据获取,是大数据生命周期的榜首个环节,经过RFID射频辨认技术、传感器、交互型社交网络以及移动互联网等方法取得的各品种型的结构化、半结构化及非结构化的海量数据。
T、对
F、错
正确答案:
第41题,TrustRank算法中,创立优质网页调集时,不会挑选成员受限的域名。
T、对
F、错
正确答案:
第42题,聚类剖析中,一个类是样本的一个子集。
T、对
F、错
正确答案:
第43题,决议计划树中为了避免过拟合表象能够对已生成的树自上而下剪枝。()
T、对
F、错
正确答案:
第44题,k均值聚类是硬聚类。()
T、对
F、错
正确答案:
第45题,相关规矩能够用枚举的方法发生。
T、对
F、错
更新答案联系微信或QQ 熊猫奥鹏(www.188open.com)
第46题,DAG中的父节点是仅有的。
T、对
F、错
正确答案:F
第47题,PageRank算法是图数据上的无监督学习方法。()
T、对
F、错
正确答案:
第48题,TF-IDF算法中,IDF指的是文档频率
T、对
F、错
正确答案:
第49题,监督学习是从标示数据中学习预测模型的机器学习疑问
T、对
F、错
正确答案:
答案来历:熊猫奥鹏(www.188open.com),朴素贝叶斯等价于希望危险最小化。()
T、对
F、错
正确答案:
专业辅导各院校在线、离线考核、形考、终极考核、统考、社会调查报告、毕业论文写作交流等!(非免费)
联系我们:QQ客服:3326650399 439328128 微信客服①:cs80188 微信客服②:cs80189
扫一扫添加我为好友 扫一扫添加我为好友