南开(本)21春学期《数据科学导论》在线作业100分
答案来历:熊猫奥鹏(www.188open.com)-[南开大学(本部)]21春学期(1709、1803、1809、1903、1909、2003、2009、2103)《数据科学导论》在线作业
试卷总分:100 得分:100
第1题,BFR聚类是用于处理数据集()的k-means变体。
A、大
B、中
C、小
D、一切
正确答案:
第2题,思考下面的频频3-项集的调集:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}假定数据会集只要5个项,选用 兼并战略,由候选发生过程得到4-项集不包括()
A、1,2,3,4
B、1,2,3,5
C、1,2,4,5
D、1,3,4,5
正确答案:
第3题,以下哪一项不是特征挑选常见的方法()
A、过滤式
B、封装式
C、嵌入式
D、敞开式
正确答案:
第4题,例如将薪酬收入特点值映射到[-1,1]或许[0,1]内归于数据变换中的()
A、简略函数变换
B、标准化
C、特点结构
D、接连特点离散化
正确答案:
答案来历:熊猫奥鹏(www.188open.com),关于k近邻法,下列说法错误的是()。
A、不具有显式的学习过程
B、适用于多分类使命
C、k值越大,分类作用越好
D、一般选用大都表决的分类决议计划规矩
正确答案:
第6题,手肘法的中心目标是()。
A、SES
B、SSE
C、RMSE
D、MSE
正确答案:
第7题,在k近邻法中,挑选较小的k值时,学习的"近似差错"会(),"估量差错"会()。
A、减小,减小
B、减小,增大
C、增大,减小
D、增大,增大
正确答案:
第8题,变量之间的关系一般能够分为断定性关系与()。
A、非断定性关系
B、线性关系
C、函数关系
D、有关关系
正确答案:
第9题,某产品的产值(X,件)与单位成本(Y,元/件)之间的回归方程为^Y=100-1.2X,这阐明()。
A、产值每添加一台,单位成本添加100元
B、产值每添加一台,单位成本削减1.2元
C、产值每添加一台,单位成本均匀削减1.2元
D、产值每添加一台,单位均匀添加100元
正确答案:
答案来历:熊猫奥鹏(www.188open.com),层次聚类对给定的数据进行()的分化。
A、聚合
B、层次
C、分拆
D、仿制
正确答案:
第11题,下列两个变量之间的关系中,哪个是函数关系()。
A、人的性别和他的身高
B、人的薪酬与年纪
C、正方形的面积和边长
D、温度与湿度
正确答案:
答案来历:熊猫奥鹏(www.188open.com),经过变量规范化计算得到的回归方程称为()。
A、规范化回归方程
B、规范化偏回归方程
C、规范化自回归方程
D、规范化多回归方程
正确答案:
第13题,以部属于相关剖析的是( )
A、CPU功能预测
B、购物篮剖析
C、自动判别鸢尾花种类
D、股市趋势建模
正确答案:
第14题,单层感知机模型归于()模型。
A、二分类的线性分类模型
B、二分类的非线性分类模型
C、多分类的线性分类模型
D、多分类的非线性分类模型
正确答案:
答案来历:熊猫奥鹏(www.188open.com),以下哪一项不归于数据变换()
A、简略函数变换
B、标准化
C、特点兼并
D、接连特点离散化
正确答案:
第16题,层次聚类合适规划较()的数据集
A、大
B、中
C、小
D、一切
正确答案:
第17题,维克托?迈尔-舍恩伯格在《大数据年代:日子、工作与思想的大革新》一书中,继续着重了一个观念:大数据年代的到来,使咱们无法人为地去发现数据中的微妙,与此一起,咱们更大概重视数据中的有关关系,而不是因果关系。其间,数据之间的有关关系能够经过以下哪个算法直接发掘( )
A、K-means
B、Bayes Network
C、C4.5
D、Apriori
正确答案:
第18题,依据映射关系的不一样能够分为线性回归和()。
A、对数回归
B、非线性回归
C、逻辑回归
D、多元回归
正确答案:
第19题,数据质量查验的首要使命即是检查初始数据中是不是存在"脏数据",归纳性来说,脏数据不包含以下()
A、普通值
B、反常值
C、纷歧致的值
D、重复值
正确答案:
答案来历:熊猫奥鹏(www.188open.com),在一元线性回归中,经过最小二乘法求得的直线叫做回归直线或()。
A、最优回归线
B、最优散布线
C、最优预测线
D、最好散布线
正确答案:
第21题,层次聚类的方法是()
A、聚合方法
B、分拆方法
C、组合方法
D、对比方法
正确答案:,B
第22题,k近邻法的根本要素包含()。
A、间隔衡量
B、k值的挑选
C、样本巨细
D、分类决议计划规矩
正确答案:,B,D
第23题,关于多层感知机,()层具有激活函数的功用神经元。
A、输入层
B、隐含层
C、输出层
正确答案:,C
第24题,Apriori算法的计算杂乱度受()影响。
A、撑持度阈值
B、项数
C、业务数
D、业务均匀宽度
正确答案:,B,C,D
答案来历:熊猫奥鹏(www.188open.com),系统日志搜集的根本特征有()
A、高可用性
B、高牢靠性
C、可拓展性
D、高功率
正确答案:,B,C
第26题,K-means聚类中K值选择的方法是()。
A、密度分类法
B、手肘法
C、大腿法
D、随机选择
正确答案:,B
第27题,多层感知机的学习过程包括()。
A、信号的正向传达
B、信号的反向传达
C、差错的正向传达
D、差错的反向传达
正确答案:,D
第28题,啥状况下结点不必区分()
A、当时结点所包括的样本全归于同一种类
B、当时特点集为空,或是一切样本在一切特点上取值一样
C、当时结点包括的样本集为空
D、还有子集不能被根本正确分类
正确答案:,B,C
第29题,下面比如归于分类的是()
A、检测图画中是不是有人脸呈现
B、对客户依照借款危险巨细进行分类
C、辨认手写的数字
D、估量商场客流量
正确答案:,B,C
答案来历:熊猫奥鹏(www.188open.com),间隔衡量中的间隔能够是()
A、欧式间隔
B、曼哈顿间隔
C、Lp间隔
D、Minkowski间隔
正确答案:,B,C,D
第31题,添加神经元的个数,无法进步神经网络的练习精度。
T、对
F、错
正确答案:F
第32题,一个人的身高与体重之间具有函数关系。
T、对
F、错
正确答案:F
第33题,可信度是对相关规矩的精确度的衡量。
T、对
F、错
答案联系QQ:3326650399 微信:cs80188 熊猫奥鹏(www.188open.com)
第34题,给定一组点,运用点之间的间隔概念,将点分组为若干簇,不一样簇的成员能够一样。
T、对
F、错
正确答案:F
第35题,K均值(K-Means)算法是密度聚类。
T、对
F、错
正确答案:F
第36题,具有双隐层的感知机足以用于处理任何杂乱的分类疑问。
T、对
F、错
答案联系QQ:3326650399 微信:cs80188 熊猫奥鹏(www.188open.com)
第37题,当维度添加时,特征空间的体积添加得很快,使得可用的数据变得稠密。
T、对
F、错
正确答案:F
第38题,会集趋势可以标明在必定条件下数据的共同性质与区别
T、对
F、错
正确答案:F
第39题,给定相关规矩A→B,意味着:若A发作,B也会发作。
T、对
F、错
正确答案:F
第40题,数据科学运用科学方法剖析数据,坐落几个学科的穿插点并使用范畴特定的常识,使大数据的剖析变成能够。
T、对
F、错
答案联系QQ:3326650399 微信:cs80188 熊猫奥鹏(www.188open.com)
第41题,BFR聚类簇的坐标能够与空间的坐标坚持共同。
T、对
F、错
正确答案:F
第42题,剪枝是决议计划树学习算法抵挡"过拟合"的首要手法
T、对
F、错
答案联系QQ:3326650399 微信:cs80188 熊猫奥鹏(www.188open.com)
第43题,决议计划树还能够表明给定特征条件下类的条件概率散布,这一概率散布界说在特征空间的一个区分上,将特征空间分为互不相交的单元或区域,并在每个单元界说一个类的概率散布就构成了一个条件概率散布
T、对
F、错
答案联系QQ:3326650399 微信:cs80188 熊猫奥鹏(www.188open.com)
第44题,K-means聚类是发现给定数据集的K个簇的算法。
T、对
F、错
答案联系QQ:3326650399 微信:cs80188 熊猫奥鹏(www.188open.com)
第45题,数据剖析师的使命:用模型来答复详细疑问,知道数据,其来历和结构
T、对
F、错
正确答案:F
第46题,特征的信息增益越大,则其越不重要。
T、对
F、错
正确答案:F
第47题,贝叶斯定理是概率论中的一个成果,它与随机变量的条件概率以及联合概率散布 有关。
T、对
F、错
答案联系QQ:3326650399 微信:cs80188 熊猫奥鹏(www.188open.com)
第48题,给定一个数据集,假如存在某个超平面S可以将数据集的有些正实例点和负实例点正确的区分到超平面的两边,则称该数据集是线性可分数据集。
T、对
F、错
正确答案:F
第49题,关于分类数据,常常运用表格,来统计各品种另外数据呈现的频率。
T、对
F、错
答案联系QQ:3326650399 微信:cs80188 熊猫奥鹏(www.188open.com)
答案来历:熊猫奥鹏(www.188open.com),使用K近邻法进行分类时,运用不一样的间隔衡量所断定的近来邻点都是一样的。
T、对
F、错
正确答案:F
试卷总分:100 得分:100
第1题,BFR聚类是用于处理数据集()的k-means变体。
A、大
B、中
C、小
D、一切
正确答案:
第2题,思考下面的频频3-项集的调集:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}假定数据会集只要5个项,选用 兼并战略,由候选发生过程得到4-项集不包括()
A、1,2,3,4
B、1,2,3,5
C、1,2,4,5
D、1,3,4,5
正确答案:
第3题,以下哪一项不是特征挑选常见的方法()
A、过滤式
B、封装式
C、嵌入式
D、敞开式
正确答案:
第4题,例如将薪酬收入特点值映射到[-1,1]或许[0,1]内归于数据变换中的()
A、简略函数变换
B、标准化
C、特点结构
D、接连特点离散化
正确答案:
答案来历:熊猫奥鹏(www.188open.com),关于k近邻法,下列说法错误的是()。
A、不具有显式的学习过程
B、适用于多分类使命
C、k值越大,分类作用越好
D、一般选用大都表决的分类决议计划规矩
正确答案:
第6题,手肘法的中心目标是()。
A、SES
B、SSE
C、RMSE
D、MSE
正确答案:
第7题,在k近邻法中,挑选较小的k值时,学习的"近似差错"会(),"估量差错"会()。
A、减小,减小
B、减小,增大
C、增大,减小
D、增大,增大
正确答案:
第8题,变量之间的关系一般能够分为断定性关系与()。
A、非断定性关系
B、线性关系
C、函数关系
D、有关关系
正确答案:
第9题,某产品的产值(X,件)与单位成本(Y,元/件)之间的回归方程为^Y=100-1.2X,这阐明()。
A、产值每添加一台,单位成本添加100元
B、产值每添加一台,单位成本削减1.2元
C、产值每添加一台,单位成本均匀削减1.2元
D、产值每添加一台,单位均匀添加100元
正确答案:
答案来历:熊猫奥鹏(www.188open.com),层次聚类对给定的数据进行()的分化。
A、聚合
B、层次
C、分拆
D、仿制
正确答案:
第11题,下列两个变量之间的关系中,哪个是函数关系()。
A、人的性别和他的身高
B、人的薪酬与年纪
C、正方形的面积和边长
D、温度与湿度
正确答案:
答案来历:熊猫奥鹏(www.188open.com),经过变量规范化计算得到的回归方程称为()。
A、规范化回归方程
B、规范化偏回归方程
C、规范化自回归方程
D、规范化多回归方程
正确答案:
第13题,以部属于相关剖析的是( )
A、CPU功能预测
B、购物篮剖析
C、自动判别鸢尾花种类
D、股市趋势建模
正确答案:
第14题,单层感知机模型归于()模型。
A、二分类的线性分类模型
B、二分类的非线性分类模型
C、多分类的线性分类模型
D、多分类的非线性分类模型
正确答案:
答案来历:熊猫奥鹏(www.188open.com),以下哪一项不归于数据变换()
A、简略函数变换
B、标准化
C、特点兼并
D、接连特点离散化
正确答案:
第16题,层次聚类合适规划较()的数据集
A、大
B、中
C、小
D、一切
正确答案:
第17题,维克托?迈尔-舍恩伯格在《大数据年代:日子、工作与思想的大革新》一书中,继续着重了一个观念:大数据年代的到来,使咱们无法人为地去发现数据中的微妙,与此一起,咱们更大概重视数据中的有关关系,而不是因果关系。其间,数据之间的有关关系能够经过以下哪个算法直接发掘( )
A、K-means
B、Bayes Network
C、C4.5
D、Apriori
正确答案:
第18题,依据映射关系的不一样能够分为线性回归和()。
A、对数回归
B、非线性回归
C、逻辑回归
D、多元回归
正确答案:
第19题,数据质量查验的首要使命即是检查初始数据中是不是存在"脏数据",归纳性来说,脏数据不包含以下()
A、普通值
B、反常值
C、纷歧致的值
D、重复值
正确答案:
答案来历:熊猫奥鹏(www.188open.com),在一元线性回归中,经过最小二乘法求得的直线叫做回归直线或()。
A、最优回归线
B、最优散布线
C、最优预测线
D、最好散布线
正确答案:
第21题,层次聚类的方法是()
A、聚合方法
B、分拆方法
C、组合方法
D、对比方法
正确答案:,B
第22题,k近邻法的根本要素包含()。
A、间隔衡量
B、k值的挑选
C、样本巨细
D、分类决议计划规矩
正确答案:,B,D
第23题,关于多层感知机,()层具有激活函数的功用神经元。
A、输入层
B、隐含层
C、输出层
正确答案:,C
第24题,Apriori算法的计算杂乱度受()影响。
A、撑持度阈值
B、项数
C、业务数
D、业务均匀宽度
正确答案:,B,C,D
答案来历:熊猫奥鹏(www.188open.com),系统日志搜集的根本特征有()
A、高可用性
B、高牢靠性
C、可拓展性
D、高功率
正确答案:,B,C
第26题,K-means聚类中K值选择的方法是()。
A、密度分类法
B、手肘法
C、大腿法
D、随机选择
正确答案:,B
第27题,多层感知机的学习过程包括()。
A、信号的正向传达
B、信号的反向传达
C、差错的正向传达
D、差错的反向传达
正确答案:,D
第28题,啥状况下结点不必区分()
A、当时结点所包括的样本全归于同一种类
B、当时特点集为空,或是一切样本在一切特点上取值一样
C、当时结点包括的样本集为空
D、还有子集不能被根本正确分类
正确答案:,B,C
第29题,下面比如归于分类的是()
A、检测图画中是不是有人脸呈现
B、对客户依照借款危险巨细进行分类
C、辨认手写的数字
D、估量商场客流量
正确答案:,B,C
答案来历:熊猫奥鹏(www.188open.com),间隔衡量中的间隔能够是()
A、欧式间隔
B、曼哈顿间隔
C、Lp间隔
D、Minkowski间隔
正确答案:,B,C,D
第31题,添加神经元的个数,无法进步神经网络的练习精度。
T、对
F、错
正确答案:F
第32题,一个人的身高与体重之间具有函数关系。
T、对
F、错
正确答案:F
第33题,可信度是对相关规矩的精确度的衡量。
T、对
F、错
答案联系QQ:3326650399 微信:cs80188 熊猫奥鹏(www.188open.com)
第34题,给定一组点,运用点之间的间隔概念,将点分组为若干簇,不一样簇的成员能够一样。
T、对
F、错
正确答案:F
第35题,K均值(K-Means)算法是密度聚类。
T、对
F、错
正确答案:F
第36题,具有双隐层的感知机足以用于处理任何杂乱的分类疑问。
T、对
F、错
答案联系QQ:3326650399 微信:cs80188 熊猫奥鹏(www.188open.com)
第37题,当维度添加时,特征空间的体积添加得很快,使得可用的数据变得稠密。
T、对
F、错
正确答案:F
第38题,会集趋势可以标明在必定条件下数据的共同性质与区别
T、对
F、错
正确答案:F
第39题,给定相关规矩A→B,意味着:若A发作,B也会发作。
T、对
F、错
正确答案:F
第40题,数据科学运用科学方法剖析数据,坐落几个学科的穿插点并使用范畴特定的常识,使大数据的剖析变成能够。
T、对
F、错
答案联系QQ:3326650399 微信:cs80188 熊猫奥鹏(www.188open.com)
第41题,BFR聚类簇的坐标能够与空间的坐标坚持共同。
T、对
F、错
正确答案:F
第42题,剪枝是决议计划树学习算法抵挡"过拟合"的首要手法
T、对
F、错
答案联系QQ:3326650399 微信:cs80188 熊猫奥鹏(www.188open.com)
第43题,决议计划树还能够表明给定特征条件下类的条件概率散布,这一概率散布界说在特征空间的一个区分上,将特征空间分为互不相交的单元或区域,并在每个单元界说一个类的概率散布就构成了一个条件概率散布
T、对
F、错
答案联系QQ:3326650399 微信:cs80188 熊猫奥鹏(www.188open.com)
第44题,K-means聚类是发现给定数据集的K个簇的算法。
T、对
F、错
答案联系QQ:3326650399 微信:cs80188 熊猫奥鹏(www.188open.com)
第45题,数据剖析师的使命:用模型来答复详细疑问,知道数据,其来历和结构
T、对
F、错
正确答案:F
第46题,特征的信息增益越大,则其越不重要。
T、对
F、错
正确答案:F
第47题,贝叶斯定理是概率论中的一个成果,它与随机变量的条件概率以及联合概率散布 有关。
T、对
F、错
答案联系QQ:3326650399 微信:cs80188 熊猫奥鹏(www.188open.com)
第48题,给定一个数据集,假如存在某个超平面S可以将数据集的有些正实例点和负实例点正确的区分到超平面的两边,则称该数据集是线性可分数据集。
T、对
F、错
正确答案:F
第49题,关于分类数据,常常运用表格,来统计各品种另外数据呈现的频率。
T、对
F、错
答案联系QQ:3326650399 微信:cs80188 熊猫奥鹏(www.188open.com)
答案来历:熊猫奥鹏(www.188open.com),使用K近邻法进行分类时,运用不一样的间隔衡量所断定的近来邻点都是一样的。
T、对
F、错
正确答案:F