[南开大学]20秋学期《数据科学导论》在线作业-2

作者:奥鹏周老师 分类: 南开大学 发布时间: 2020-10-19 13:45
答案来历:熊猫奥鹏(www.188open.com)-[南开大学]20秋学期(1709、1803、1809、1903、1909、2003、2009 )《数据科学导论》在线作业
试卷总分:100 得分:100
第1题,以下哪一项不是特征挑选常见的方法()
A、过滤式
B、封装式
C、嵌入式
D、敞开式
正确答案:


第2题,使用最小二乘法对多元线性回归进行参数估量时,其方针为()。
A、最小化方差#最小化规范差
B、最小化残差平方和
C、最大化信息熵
正确答案:


第3题,以下哪些不是缺失值的影响()
A、数据建模将丢掉很多有用信息
B、数据建模的不断定性愈加明显
C、对全体老是不发生啥效果
D、包括空值的数据能够会使建模过程堕入紊乱,致使反常的输出
正确答案:


第4题,下列两个变量之间的关系中,哪个是函数关系()。
A、人的性别和他的身高
B、人的薪酬与年纪
C、正方形的面积和边长
D、温度与湿度
正确答案:


答案来历:熊猫奥鹏(www.188open.com),哪一项不归于标准化的方法()
A、最小-最大标准化
B、零-均值标准化
C、小数定标标准化
D、中位数标准化
正确答案:


第6题,某超市研讨销售纪录数据后发现,买啤酒的人很大约率也会采购尿布,这种归于数据发掘的哪类疑问?()
A、相关规矩发现
B、聚类
C、分类
D、天然语言处理
正确答案:


第7题,思考下面的频频3-项集的调集:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}假定数据会集只要5个项,选用 兼并战略,由候选发生过程得到4-项集不包括()
A、1,2,3,4
B、1,2,3,5
C、1,2,4,5
D、1,3,4,5
正确答案:


第8题,为知道决任何杂乱的分类疑问,运用的感知机结构应至少包括()个隐含层。
A、1
B、2
C、3
D、4
正确答案:


第9题,设X={1,2,3}是频频项集,则可由X发生()个相关规矩。
A、4
B、5
C、6
D、7
正确答案:


答案来历:熊猫奥鹏(www.188open.com),以下哪一项不归于数据变换()
A、简略函数变换
B、标准化
C、特点兼并
D、接连特点离散化
正确答案:


第11题,一元线性回归中,实在值与预测值的差称为样本的()。
A、差错
B、方差
C、测差
D、残差
正确答案:


答案来历:熊猫奥鹏(www.188open.com),聚类的最简略最根本方法是()。
A、区分聚类
B、层次聚类
C、密度聚类
D、间隔聚类
正确答案:


第13题,单层感知机模型归于()模型。
A、二分类的线性分类模型
B、二分类的非线性分类模型
C、多分类的线性分类模型
D、多分类的非线性分类模型
正确答案:


第14题,在一元线性回归中,经过最小二乘法求得的直线叫做回归直线或()。
A、最优回归线
B、最优散布线
C、最优预测线
D、最好散布线
正确答案:


答案来历:熊猫奥鹏(www.188open.com),在k近邻法中,挑选较小的k值时,学习的"近似差错"会(),"估量差错"会()。
A、减小,减小
B、减小,增大
C、增大,减小
D、增大,增大
正确答案:


第16题,某产品的产值(X,件)与单位成本(Y,元/件)之间的回归方程为^Y=100-1.2X,这阐明()。
A、产值每添加一台,单位成本添加100元
B、产值每添加一台,单位成本削减1.2元
C、产值每添加一台,单位成本均匀削减1.2元
D、产值每添加一台,单位均匀添加100元
正确答案:


第17题,关于k近邻法,下列说法错误的是()。
A、不具有显式的学习过程
B、适用于多分类使命
C、k值越大,分类作用越好
D、一般选用大都表决的分类决议计划规矩
正确答案:


第18题,实体辨认归于以下哪个过程()
A、数据清洁
B、数据集成
C、数据规约
D、数据变换
正确答案:


第19题,在回归剖析中,自变量为(),因变量为()。
A、离散型变量,离散型变量
B、接连型变量,离散型变量
C、离散型变量,接连型变量
D、接连型变量,接连型变量
正确答案:


答案来历:熊猫奥鹏(www.188open.com),在有统计学含义的条件下,规范化偏回归系数的肯定值越大,阐明相应的自变量对y的效果()。
A、越小
B、越大
C、无关
D、不断定
正确答案:


第21题,K-means聚类中K值选择的方法是()。
A、密度分类法
B、手肘法
C、大腿法
D、随机选择
正确答案:,B


第22题,系统日志搜集的根本特征有()
A、高可用性
B、高牢靠性
C、可拓展性
D、高功率
正确答案:,B,C


第23题,Apriori算法的计算杂乱度受()影响。
A、撑持度阈值
B、项数
C、业务数
D、业务均匀宽度
正确答案:,B,C,D


第24题,间隔衡量中的间隔能够是()
A、欧式间隔
B、曼哈顿间隔
C、Lp间隔
D、Minkowski间隔
正确答案:,B,C,D


答案来历:熊猫奥鹏(www.188open.com),k近邻法的根本要素包含()。
A、间隔衡量
B、k值的挑选
C、样本巨细
D、分类决议计划规矩
正确答案:,B,D


第26题,多层感知机的学习过程包括()。
A、信号的正向传达
B、信号的反向传达
C、差错的正向传达
D、差错的反向传达
正确答案:,D


第27题,一元回归参数估量的参数求解方法有()。
A、最大似然法
B、距估量法
C、最小二乘法
D、欧式间隔法
正确答案:,B,C


第28题,啥状况下结点不必区分()
A、当时结点所包括的样本全归于同一种类
B、当时特点集为空,或是一切样本在一切特点上取值一样
C、当时结点包括的样本集为空
D、还有子集不能被根本正确分类
正确答案:,B,C


第29题,数据科学具有哪些性质()
A、有用性
B、可用性
C、未意料
D、可了解
正确答案:,B,C,D


答案来历:熊猫奥鹏(www.188open.com),下面比如归于分类的是()
A、检测图画中是不是有人脸呈现
B、对客户依照借款危险巨细进行分类
C、辨认手写的数字
D、估量商场客流量
正确答案:,B,C


第31题,剪枝是决议计划树学习算法抵挡"过拟合"的首要手法
T、对
F、错
更新答案联系微信或QQ 熊猫奥鹏(www.188open.com)


第32题,给定一组点,运用点之间的间隔概念,将点分组为若干簇,不一样簇的成员能够一样。
T、对
F、错
正确答案:F


第33题,有关性剖析首要是剖析单个独立变量之间线性有关程度的强弱,并用恰当的统计目标表明出来的过程。
T、对
F、错
正确答案:F


第34题,分拆方法是自底向上的方法。
T、对
F、错
正确答案:F


第35题,探究性数据剖析的特色是研讨从初始数据下手,彻底以实践数据为根据。
T、对
F、错
更新答案联系微信或QQ 熊猫奥鹏(www.188open.com)


第36题,在数据预处理时,不管啥状况,都能够直接将反常值删去
T、对
F、错
正确答案:F


第37题,关于项集来说,相信度没有含义。
T、对
F、错
更新答案联系微信或QQ 熊猫奥鹏(www.188open.com)


第38题,给定相关规矩A→B,意味着:若A发作,B也会发作。
T、对
F、错
正确答案:F


第39题,信息熵越小,样本结合的纯度越低
T、对
F、错
正确答案:F


第40题,聚合方法是自底向上的方法。
T、对
F、错
更新答案联系微信或QQ 熊猫奥鹏(www.188open.com)


第41题,BFR聚类簇的坐标能够与空间的坐标坚持共同。
T、对
F、错
正确答案:F


第42题,会集趋势可以标明在必定条件下数据的共同性质与区别
T、对
F、错
正确答案:F


第43题,使用K近邻法进行分类时,运用不一样的间隔衡量所断定的近来邻点都是一样的。
T、对
F、错
正确答案:F


第44题,朴素贝叶斯分类器有简略、高效、强健的特色,但某些特点能够会下降分类器的功能
T、对
F、错
更新答案联系微信或QQ 熊猫奥鹏(www.188open.com)


第45题,数据科学运用科学方法剖析数据,坐落几个学科的穿插点并使用范畴特定的常识,使大数据的剖析变成能够。
T、对
F、错
更新答案联系微信或QQ 熊猫奥鹏(www.188open.com)


第46题,运用SVD方法进行图画紧缩不可以以保存图画的重要特征。
T、对
F、错
正确答案:F


第47题,K均值(K-Means)算法是密度聚类。
T、对
F、错
正确答案:F


第48题,K-means算法选用贪心战略,经过迭代优化来近似求解。
T、对
F、错
更新答案联系微信或QQ 熊猫奥鹏(www.188open.com)


第49题,获取数据为数据剖析供给了资料和根据,这儿的数据只包含直接获取的数据。
T、对
F、错
正确答案:F


答案来历:熊猫奥鹏(www.188open.com),特征的信息增益越大,则其越不重要。
T、对
F、错
正确答案:F

作业答案 联系QQ:3326650399 微信:cs80188