[南开大学]20秋学期《数据科学导论》在线作业-1

作者:周老师 分类: 南开大学 发布时间: 2020-10-19 13:45

专业辅导各院校在线、离线考核、形考、终极考核、统考、社会调查报告、毕业论文写作交流等!

联系我们:QQ客服:3326650399   439328128    微信客服①:cs80188     微信客服②:cs80189

              扫一扫添加我为好友                           扫一扫添加我为好友

支付宝微信钱包

答案来历:熊猫奥鹏(www.188open.com)-[南开大学]20秋学期(1709、1803、1809、1903、1909、2003、2009 )《数据科学导论》在线作业
试卷总分:100 得分:100
第1题,关于k近邻法,下列说法错误的是()。
A、不具有显式的学习过程
B、适用于多分类使命
C、k值越大,分类作用越好
D、一般选用大都表决的分类决议计划规矩
正确答案:


第2题,以下哪个不是处理缺失值的方法()
A、删去记载
B、依照必定准则弥补
C、不处理
D、随意填写
正确答案:


第3题,在一元线性回归模型中,残差项遵守()散布。
A、泊松
B、正态
C、线性
D、非线性
正确答案:


第4题,一元线性回归中,实在值与预测值的差称为样本的()。
A、差错
B、方差
C、测差
D、残差
正确答案:


答案来历:熊猫奥鹏(www.188open.com),Apriori算法的加快过程依靠于以下哪个战略()
A、抽样
B、剪枝
C、缓冲
D、并行
正确答案:


第6题,数据库中有关联的两张表都存储了用户的个人信息,但在用户的个人信息发作改动时只更新了一张表中的数据,这时两张表中就有了纷歧致的数据,这归于()
A、反常值
B、缺失值
C、纷歧致的值
D、重复值
正确答案:


第7题,单层感知机模型归于()模型。
A、二分类的线性分类模型
B、二分类的非线性分类模型
C、多分类的线性分类模型
D、多分类的非线性分类模型
正确答案:


第8题,层次聚类合适规划较()的数据集
A、大
B、中
C、小
D、一切
正确答案:


第9题,经过结构新的目标-线损率,当超出线损率的正常规模, 则能够判别这条线路的用户能够存在窃漏电等反常行动归于数据变换中的()
A、简略函数变换
B、标准化
C、特点结构
D、接连特点离散化
正确答案:


答案来历:熊猫奥鹏(www.188open.com),例如将薪酬收入特点值映射到[-1,1]或许[0,1]内归于数据变换中的()
A、简略函数变换
B、标准化
C、特点结构
D、接连特点离散化
正确答案:


第11题,在有统计学含义的条件下,规范化偏回归系数的肯定值越大,阐明相应的自变量对y的效果()。
A、越小
B、越大
C、无关
D、不断定
正确答案:


答案来历:熊猫奥鹏(www.188open.com),思考下面的频频3-项集的调集:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}假定数据会集只要5个项,选用 兼并战略,由候选发生过程得到4-项集不包括()
A、1,2,3,4
B、1,2,3,5
C、1,2,4,5
D、1,3,4,5
正确答案:


第13题,具有误差和至少()个S型隐含层加上一个()输出层的网络可以迫临任何有理数。
A、1,线性
B、2,线性
C、1,非线性
D、2,非线性
正确答案:


第14题,实体辨认归于以下哪个过程()
A、数据清洁
B、数据集成
C、数据规约
D、数据变换
正确答案:


答案来历:熊猫奥鹏(www.188open.com),经过变量规范化计算得到的回归方程称为()。
A、规范化回归方程
B、规范化偏回归方程
C、规范化自回归方程
D、规范化多回归方程
正确答案:


第16题,咱们需求对已生成的树()进行剪枝,将树变得简略,然后使它具有非常好的泛化才能。
A、自上而下
B、自下而上
C、自左而右
D、自右而左
正确答案:


第17题,聚类是一种()。
A、有监督学习
B、无监督学习
C、强化学习
D、半监督学习
正确答案:


第18题,使用最小二乘法对多元线性回归进行参数估量时,其方针为()。
A、最小化方差#最小化规范差
B、最小化残差平方和
C、最大化信息熵
正确答案:


第19题,实体辨认的常见方式()
A、同名异义
B、异名同义
C、单位不一致
D、特点不一样
正确答案:


答案来历:熊猫奥鹏(www.188open.com),以下哪一项不归于数据变换()
A、简略函数变换
B、标准化
C、特点兼并
D、接连特点离散化
正确答案:


第21题,间隔衡量中的间隔能够是()
A、欧式间隔
B、曼哈顿间隔
C、Lp间隔
D、Minkowski间隔
正确答案:,B,C,D


第22题,Apriori算法的计算杂乱度受()影响。
A、撑持度阈值
B、项数
C、业务数
D、业务均匀宽度
正确答案:,B,C,D


第23题,K-means聚类中K值选择的方法是()。
A、密度分类法
B、手肘法
C、大腿法
D、随机选择
正确答案:,B


第24题,聚类的首要方法有()。
A、区分聚类
B、层次聚类
C、密度聚类
D、间隔聚类
正确答案:,B,C


答案来历:熊猫奥鹏(www.188open.com),关于多层感知机,()层具有激活函数的功用神经元。
A、输入层
B、隐含层
C、输出层
正确答案:,C


第26题,啥状况下结点不必区分()
A、当时结点所包括的样本全归于同一种类
B、当时特点集为空,或是一切样本在一切特点上取值一样
C、当时结点包括的样本集为空
D、还有子集不能被根本正确分类
正确答案:,B,C


第27题,下列选项是BFR的对象是()
A、抛弃集
B、暂时集
C、紧缩集
D、留存集
正确答案:,C,D


第28题,系统日志搜集的根本特征有()
A、高可用性
B、高牢靠性
C、可拓展性
D、高功率
正确答案:,B,C


第29题,下面比如归于分类的是()
A、检测图画中是不是有人脸呈现
B、对客户依照借款危险巨细进行分类
C、辨认手写的数字
D、估量商场客流量
正确答案:,B,C


答案来历:熊猫奥鹏(www.188open.com),k近邻法的根本要素包含()。
A、间隔衡量
B、k值的挑选
C、样本巨细
D、分类决议计划规矩
正确答案:,B,D


第31题,一般来说,信息增益越大,则意味着运用特点a来进行区分所取得的"纯度提高越大",因而咱们可用信息增益来进行决议计划树的最优特征挑选。
T、对
F、错
更新答案联系微信或QQ 熊猫奥鹏(www.188open.com)


第32题,给定一个数据集,假如存在某个超平面S可以将数据集的有些正实例点和负实例点正确的区分到超平面的两边,则称该数据集是线性可分数据集。
T、对
F、错
正确答案:F


第33题,Pearson有关系数是判别特征之间、以及特征和方针变量之间线性有关关系的统计量。
T、对
F、错
更新答案联系微信或QQ 熊猫奥鹏(www.188open.com)


第34题,特征挑选和降维都是用于削减特征数量,进而下降模型杂乱度、避免过度拟合。
T、对
F、错
更新答案联系微信或QQ 熊猫奥鹏(www.188open.com)


第35题,两个对象越类似,他们的相异度就越高。
T、对
F、错
正确答案:F


第36题,朴素贝叶斯分类器有简略、高效、强健的特色,但某些特点能够会下降分类器的功能
T、对
F、错
更新答案联系微信或QQ 熊猫奥鹏(www.188open.com)


第37题,获取数据为数据剖析供给了资料和根据,这儿的数据只包含直接获取的数据。
T、对
F、错
正确答案:F


第38题,挑选较小的k值,适当于用较小的邻域中的练习实例进行预测,学习的"近似差错"会减小,"估量差错"会增大,预测成果会对近邻的点实例点十分灵敏。
T、对
F、错
更新答案联系微信或QQ 熊猫奥鹏(www.188open.com)


第39题,K均值(K-Means)算法是密度聚类。
T、对
F、错
正确答案:F


第40题,K-means算法选用贪心战略,经过迭代优化来近似求解。
T、对
F、错
更新答案联系微信或QQ 熊猫奥鹏(www.188open.com)


第41题,赤池信息原则是衡量统计模型拟合优秀性的一种规范。
T、对
F、错
正确答案:


第42题,均匀削减的不纯度越大,则特征重要度越高。
T、对
F、错
更新答案联系微信或QQ 熊猫奥鹏(www.188open.com)


第43题,规范BP算法是在读取悉数数据集后,对参数进行一致更新的算法。
T、对
F、错
正确答案:F


第44题,子集发生实质上是一个查找过程,该过程能够从空集、随机发生的一个特征子集或许整个特搜集开端。
T、对
F、错
更新答案联系微信或QQ 熊猫奥鹏(www.188open.com)


第45题,数据科学具有广泛的应用范畴,能够应用在社交网络、工作体育、政治竞选
T、对
F、错
正确答案:


第46题,探究性数据剖析的特色是研讨从初始数据下手,彻底以实践数据为根据。
T、对
F、错
更新答案联系微信或QQ 熊猫奥鹏(www.188open.com)


第47题,决议计划树学习的算法一般是一个递归地挑选最优特征,并依据该特征对练习数据进行切割,使得各个子数据集有一个最佳的分类的过程,这一过程对应着特征空间的区分,也对应着决议计划树的构建
T、对
F、错
更新答案联系微信或QQ 熊猫奥鹏(www.188open.com)


第48题,给定相关规矩A→B,意味着:若A发作,B也会发作。
T、对
F、错
正确答案:F


第49题,信息熵越大,数据信息的不断定性越小。
T、对
F、错
正确答案:F


答案来历:熊猫奥鹏(www.188open.com),关于分类数据,常常运用表格,来统计各品种另外数据呈现的频率。
T、对
F、错
更新答案联系微信或QQ 熊猫奥鹏(www.188open.com)

专业辅导各院校在线、离线考核、形考、终极考核、统考、社会调查报告、毕业论文写作交流等!(非免费)

联系我们:QQ客服:3326650399   439328128    微信客服①:cs80188     微信客服②:cs80189

               扫一扫添加我为好友                           扫一扫添加我为好友

支付宝微信钱包