[南开大学]21秋学期《数据科学导论》在线作业
答案来历:熊猫奥鹏(www.188open.com)数据科学导论-[南开大学]21秋学期(1709、1803、1809、1903、1909、2003、2009、2103)《数据科学导论》在线作业
试卷总分:100 得分:100
第1题,经过变量规范化计算得到的回归方程称为()。
A、规范化回归方程
B、规范化偏回归方程
C、规范化自回归方程
D、规范化多回归方程
正确答案:
第2题,数据质量查验的首要使命即是检查初始数据中是不是存在"脏数据",归纳性来说,脏数据不包含以下()
A、普通值
B、反常值
C、纷歧致的值
D、重复值
正确答案:
第3题,例如将薪酬收入特点值映射到[-1,1]或许[0,1]内归于数据变换中的()
A、简略函数变换
B、标准化
C、特点结构
D、接连特点离散化
正确答案:
第4题,为知道决任何杂乱的分类疑问,运用的感知机结构应至少包括()个隐含层。
A、1
B、2
C、3
D、4
正确答案:
答案来历:熊猫奥鹏(www.188open.com),设X={1,2,3}是频频项集,则可由X发生()个相关规矩。
A、4
B、5
C、6
D、7
正确答案:
第6题,BFR聚类是用于处理数据集()的k-means变体。
A、大
B、中
C、小
D、一切
正确答案:
第7题,在k近邻法中,挑选较小的k值时,学习的"近似差错"会(),"估量差错"会()。
A、减小,减小
B、减小,增大
C、增大,减小
D、增大,增大
正确答案:
第8题,变量之间的关系一般能够分为断定性关系与()。
A、非断定性关系
B、线性关系
C、函数关系
D、有关关系
正确答案:
第9题,以下哪一项不是特征挑选常见的方法()
A、过滤式
B、封装式
C、嵌入式
D、敞开式
正确答案:
答案来历:熊猫奥鹏(www.188open.com),使用最小二乘法对多元线性回归进行参数估量时,其方针为()。
A、最小化方差#最小化规范差
B、最小化残差平方和
C、最大化信息熵
正确答案:
第11题,以部属于相关剖析的是( )
A、CPU功能预测
B、购物篮剖析
C、自动判别鸢尾花种类
D、股市趋势建模
正确答案:
答案来历:熊猫奥鹏(www.188open.com),在一元线性回归模型中,残差项遵守()散布。
A、泊松
B、正态
C、线性
D、非线性
正确答案:
第13题,经过结构新的目标-线损率,当超出线损率的正常规模, 则能够判别这条线路的用户能够存在窃漏电等反常行动归于数据变换中的()
A、简略函数变换
B、标准化
C、特点结构
D、接连特点离散化
正确答案:
第14题,下面不是分类的常用方法的有()
A、K近邻法
B、朴素贝叶斯
C、决议计划树
D、条件随机场
正确答案:
答案来历:熊猫奥鹏(www.188open.com),某超市研讨销售纪录数据后发现,买啤酒的人很大约率也会采购尿布,这种归于数据发掘的哪类疑问?()
A、相关规矩发现
B、聚类
C、分类
D、天然语言处理
正确答案:
第16题,具有误差和至少()个S型隐含层加上一个()输出层的网络可以迫临任何有理数。
A、1,线性
B、2,线性
C、1,非线性
D、2,非线性
正确答案:
第17题,以下哪些不是缺失值的影响()
A、数据建模将丢掉很多有用信息
B、数据建模的不断定性愈加明显
C、对全体老是不发生啥效果
D、包括空值的数据能够会使建模过程堕入紊乱,致使反常的输出
正确答案:
第18题,BFR聚类用于在()欧氏空间中对数据进行聚类
A、高维
B、中维
C、低维
D、中高维
正确答案:
第19题,关于k近邻法,下列说法错误的是()。
A、不具有显式的学习过程
B、适用于多分类使命
C、k值越大,分类作用越好
D、一般选用大都表决的分类决议计划规矩
正确答案:
答案来历:熊猫奥鹏(www.188open.com),思考下面的频频3-项集的调集:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}假定数据会集只要5个项,选用 兼并战略,由候选发生过程得到4-项集不包括()
A、1,2,3,4
B、1,2,3,5
C、1,2,4,5
D、1,3,4,5
正确答案:
第21题,层次聚类的方法是()
A、聚合方法
B、分拆方法
C、组合方法
D、对比方法
正确答案:,B
第22题,关于多层感知机,()层具有激活函数的功用神经元。
A、输入层
B、隐含层
C、输出层
正确答案:,C
第23题,Apriori算法的计算杂乱度受()影响。
A、撑持度阈值
B、项数
C、业务数
D、业务均匀宽度
正确答案:,B,C,D
第24题,系统日志搜集的根本特征有()
A、高可用性
B、高牢靠性
C、可拓展性
D、高功率
正确答案:,B,C
答案来历:熊猫奥鹏(www.188open.com),聚类的首要方法有()。
A、区分聚类
B、层次聚类
C、密度聚类
D、间隔聚类
正确答案:,B,C
第26题,下面比如归于分类的是()
A、检测图画中是不是有人脸呈现
B、对客户依照借款危险巨细进行分类
C、辨认手写的数字
D、估量商场客流量
正确答案:,B,C
第27题,K-means聚类中K值选择的方法是()。
A、密度分类法
B、手肘法
C、大腿法
D、随机选择
正确答案:,B
第28题,数据科学具有哪些性质()
A、有用性
B、可用性
C、未意料
D、可了解
正确答案:,B,C,D
第29题,啥状况下结点不必区分()
A、当时结点所包括的样本全归于同一种类
B、当时特点集为空,或是一切样本在一切特点上取值一样
C、当时结点包括的样本集为空
D、还有子集不能被根本正确分类
正确答案:,B,C
答案来历:熊猫奥鹏(www.188open.com),有关性的分类,依照有关的方向能够分为()。
A、正有关
B、负有关
C、左有关
D、右有关
正确答案:,B
第31题,当练习集较大的时分,规范BP算法一般会更快的取得非常好的解。
T、对
F、错
答案联系QQ:3326650399 微信:cs80188 熊猫奥鹏(www.188open.com)
第32题,给定一个数据集,假如存在某个超平面S可以将数据集的有些正实例点和负实例点正确的区分到超平面的两边,则称该数据集是线性可分数据集。
T、对
F、错
正确答案:F
第33题,相关规矩能够用枚举的方法发生。
T、对
F、错
答案联系QQ:3326650399 微信:cs80188 熊猫奥鹏(www.188open.com)
第34题,具有双隐层的感知机足以用于处理任何杂乱的分类疑问。
T、对
F、错
答案联系QQ:3326650399 微信:cs80188 熊猫奥鹏(www.188open.com)
第35题,在数据预处理时,不管啥状况,都能够直接将反常值删去
T、对
F、错
正确答案:F
第36题,EDA能够最大化数据剖析者对数据集和数据集底层结构的洞悉力,而且为剖析者供给数据会集包括的各类信息。
T、对
F、错
答案联系QQ:3326650399 微信:cs80188 熊猫奥鹏(www.188open.com)
第37题,撑持度是衡量相关规矩重要性的一个目标。
T、对
F、错
答案联系QQ:3326650399 微信:cs80188 熊猫奥鹏(www.188open.com)
第38题,sigmoid函数归于阶跃函数,是神经网络中常见的激活函数。
T、对
F、错
正确答案:F
第39题,给定一组点,运用点之间的间隔概念,将点分组为若干簇,不一样簇的成员能够一样。
T、对
F、错
正确答案:F
第40题,K-means算法选用贪心战略,经过迭代优化来近似求解。
T、对
F、错
答案联系QQ:3326650399 微信:cs80188 熊猫奥鹏(www.188open.com)
第41题,探究性数据剖析的特色是研讨从初始数据下手,彻底以实践数据为根据。
T、对
F、错
答案联系QQ:3326650399 微信:cs80188 熊猫奥鹏(www.188open.com)
第42题,K均值(K-Means)算法是密度聚类。
T、对
F、错
正确答案:F
第43题,神经网络中差错精度的进步能够经过添加隐含层中的神经元数目来完成。
T、对
F、错
答案联系QQ:3326650399 微信:cs80188 熊猫奥鹏(www.188open.com)
第44题,跟着特征维数的添加,特征空间呈指数倍增加,样本密度急剧减小,样本稀少。
T、对
F、错
答案联系QQ:3326650399 微信:cs80188 熊猫奥鹏(www.188open.com)
第45题,为了尽能够正确分类练习样本,结点区分过程将不断重复,有时会形成决议计划树分支过少,致使于把练习集本身的一些特色当作一切数据都具有的一般性质而致使过拟合
T、对
F、错
正确答案:F
第46题,方差过小的特征对数据的区别才能强
T、对
F、错
正确答案:F
第47题,可信度是对相关规矩的精确度的衡量。
T、对
F、错
答案联系QQ:3326650399 微信:cs80188 熊猫奥鹏(www.188open.com)
第48题,获取数据的方法有多种,能够从网页、丈量、数据库、传统媒体、监控等等方法
T、对
F、错
答案联系QQ:3326650399 微信:cs80188 熊猫奥鹏(www.188open.com)
第49题,相关规矩能够被广泛地应用于通讯、金融、交通、安康医疗和Web用户行动剖析等范畴。
T、对
F、错
答案联系QQ:3326650399 微信:cs80188 熊猫奥鹏(www.188open.com)
答案来历:熊猫奥鹏(www.188open.com),决议计划树学习的算法一般是一个递归地挑选最优特征,并依据该特征对练习数据进行切割,使得各个子数据集有一个最佳的分类的过程,这一过程对应着特征空间的区分,也对应着决议计划树的构建
T、对
F、错
答案联系QQ:3326650399 微信:cs80188 熊猫奥鹏(www.188open.com)
试卷总分:100 得分:100
第1题,经过变量规范化计算得到的回归方程称为()。
A、规范化回归方程
B、规范化偏回归方程
C、规范化自回归方程
D、规范化多回归方程
正确答案:
第2题,数据质量查验的首要使命即是检查初始数据中是不是存在"脏数据",归纳性来说,脏数据不包含以下()
A、普通值
B、反常值
C、纷歧致的值
D、重复值
正确答案:
第3题,例如将薪酬收入特点值映射到[-1,1]或许[0,1]内归于数据变换中的()
A、简略函数变换
B、标准化
C、特点结构
D、接连特点离散化
正确答案:
第4题,为知道决任何杂乱的分类疑问,运用的感知机结构应至少包括()个隐含层。
A、1
B、2
C、3
D、4
正确答案:
答案来历:熊猫奥鹏(www.188open.com),设X={1,2,3}是频频项集,则可由X发生()个相关规矩。
A、4
B、5
C、6
D、7
正确答案:
第6题,BFR聚类是用于处理数据集()的k-means变体。
A、大
B、中
C、小
D、一切
正确答案:
第7题,在k近邻法中,挑选较小的k值时,学习的"近似差错"会(),"估量差错"会()。
A、减小,减小
B、减小,增大
C、增大,减小
D、增大,增大
正确答案:
第8题,变量之间的关系一般能够分为断定性关系与()。
A、非断定性关系
B、线性关系
C、函数关系
D、有关关系
正确答案:
第9题,以下哪一项不是特征挑选常见的方法()
A、过滤式
B、封装式
C、嵌入式
D、敞开式
正确答案:
答案来历:熊猫奥鹏(www.188open.com),使用最小二乘法对多元线性回归进行参数估量时,其方针为()。
A、最小化方差#最小化规范差
B、最小化残差平方和
C、最大化信息熵
正确答案:
第11题,以部属于相关剖析的是( )
A、CPU功能预测
B、购物篮剖析
C、自动判别鸢尾花种类
D、股市趋势建模
正确答案:
答案来历:熊猫奥鹏(www.188open.com),在一元线性回归模型中,残差项遵守()散布。
A、泊松
B、正态
C、线性
D、非线性
正确答案:
第13题,经过结构新的目标-线损率,当超出线损率的正常规模, 则能够判别这条线路的用户能够存在窃漏电等反常行动归于数据变换中的()
A、简略函数变换
B、标准化
C、特点结构
D、接连特点离散化
正确答案:
第14题,下面不是分类的常用方法的有()
A、K近邻法
B、朴素贝叶斯
C、决议计划树
D、条件随机场
正确答案:
答案来历:熊猫奥鹏(www.188open.com),某超市研讨销售纪录数据后发现,买啤酒的人很大约率也会采购尿布,这种归于数据发掘的哪类疑问?()
A、相关规矩发现
B、聚类
C、分类
D、天然语言处理
正确答案:
第16题,具有误差和至少()个S型隐含层加上一个()输出层的网络可以迫临任何有理数。
A、1,线性
B、2,线性
C、1,非线性
D、2,非线性
正确答案:
第17题,以下哪些不是缺失值的影响()
A、数据建模将丢掉很多有用信息
B、数据建模的不断定性愈加明显
C、对全体老是不发生啥效果
D、包括空值的数据能够会使建模过程堕入紊乱,致使反常的输出
正确答案:
第18题,BFR聚类用于在()欧氏空间中对数据进行聚类
A、高维
B、中维
C、低维
D、中高维
正确答案:
第19题,关于k近邻法,下列说法错误的是()。
A、不具有显式的学习过程
B、适用于多分类使命
C、k值越大,分类作用越好
D、一般选用大都表决的分类决议计划规矩
正确答案:
答案来历:熊猫奥鹏(www.188open.com),思考下面的频频3-项集的调集:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}假定数据会集只要5个项,选用 兼并战略,由候选发生过程得到4-项集不包括()
A、1,2,3,4
B、1,2,3,5
C、1,2,4,5
D、1,3,4,5
正确答案:
第21题,层次聚类的方法是()
A、聚合方法
B、分拆方法
C、组合方法
D、对比方法
正确答案:,B
第22题,关于多层感知机,()层具有激活函数的功用神经元。
A、输入层
B、隐含层
C、输出层
正确答案:,C
第23题,Apriori算法的计算杂乱度受()影响。
A、撑持度阈值
B、项数
C、业务数
D、业务均匀宽度
正确答案:,B,C,D
第24题,系统日志搜集的根本特征有()
A、高可用性
B、高牢靠性
C、可拓展性
D、高功率
正确答案:,B,C
答案来历:熊猫奥鹏(www.188open.com),聚类的首要方法有()。
A、区分聚类
B、层次聚类
C、密度聚类
D、间隔聚类
正确答案:,B,C
第26题,下面比如归于分类的是()
A、检测图画中是不是有人脸呈现
B、对客户依照借款危险巨细进行分类
C、辨认手写的数字
D、估量商场客流量
正确答案:,B,C
第27题,K-means聚类中K值选择的方法是()。
A、密度分类法
B、手肘法
C、大腿法
D、随机选择
正确答案:,B
第28题,数据科学具有哪些性质()
A、有用性
B、可用性
C、未意料
D、可了解
正确答案:,B,C,D
第29题,啥状况下结点不必区分()
A、当时结点所包括的样本全归于同一种类
B、当时特点集为空,或是一切样本在一切特点上取值一样
C、当时结点包括的样本集为空
D、还有子集不能被根本正确分类
正确答案:,B,C
答案来历:熊猫奥鹏(www.188open.com),有关性的分类,依照有关的方向能够分为()。
A、正有关
B、负有关
C、左有关
D、右有关
正确答案:,B
第31题,当练习集较大的时分,规范BP算法一般会更快的取得非常好的解。
T、对
F、错
答案联系QQ:3326650399 微信:cs80188 熊猫奥鹏(www.188open.com)
第32题,给定一个数据集,假如存在某个超平面S可以将数据集的有些正实例点和负实例点正确的区分到超平面的两边,则称该数据集是线性可分数据集。
T、对
F、错
正确答案:F
第33题,相关规矩能够用枚举的方法发生。
T、对
F、错
答案联系QQ:3326650399 微信:cs80188 熊猫奥鹏(www.188open.com)
第34题,具有双隐层的感知机足以用于处理任何杂乱的分类疑问。
T、对
F、错
答案联系QQ:3326650399 微信:cs80188 熊猫奥鹏(www.188open.com)
第35题,在数据预处理时,不管啥状况,都能够直接将反常值删去
T、对
F、错
正确答案:F
第36题,EDA能够最大化数据剖析者对数据集和数据集底层结构的洞悉力,而且为剖析者供给数据会集包括的各类信息。
T、对
F、错
答案联系QQ:3326650399 微信:cs80188 熊猫奥鹏(www.188open.com)
第37题,撑持度是衡量相关规矩重要性的一个目标。
T、对
F、错
答案联系QQ:3326650399 微信:cs80188 熊猫奥鹏(www.188open.com)
第38题,sigmoid函数归于阶跃函数,是神经网络中常见的激活函数。
T、对
F、错
正确答案:F
第39题,给定一组点,运用点之间的间隔概念,将点分组为若干簇,不一样簇的成员能够一样。
T、对
F、错
正确答案:F
第40题,K-means算法选用贪心战略,经过迭代优化来近似求解。
T、对
F、错
答案联系QQ:3326650399 微信:cs80188 熊猫奥鹏(www.188open.com)
第41题,探究性数据剖析的特色是研讨从初始数据下手,彻底以实践数据为根据。
T、对
F、错
答案联系QQ:3326650399 微信:cs80188 熊猫奥鹏(www.188open.com)
第42题,K均值(K-Means)算法是密度聚类。
T、对
F、错
正确答案:F
第43题,神经网络中差错精度的进步能够经过添加隐含层中的神经元数目来完成。
T、对
F、错
答案联系QQ:3326650399 微信:cs80188 熊猫奥鹏(www.188open.com)
第44题,跟着特征维数的添加,特征空间呈指数倍增加,样本密度急剧减小,样本稀少。
T、对
F、错
答案联系QQ:3326650399 微信:cs80188 熊猫奥鹏(www.188open.com)
第45题,为了尽能够正确分类练习样本,结点区分过程将不断重复,有时会形成决议计划树分支过少,致使于把练习集本身的一些特色当作一切数据都具有的一般性质而致使过拟合
T、对
F、错
正确答案:F
第46题,方差过小的特征对数据的区别才能强
T、对
F、错
正确答案:F
第47题,可信度是对相关规矩的精确度的衡量。
T、对
F、错
答案联系QQ:3326650399 微信:cs80188 熊猫奥鹏(www.188open.com)
第48题,获取数据的方法有多种,能够从网页、丈量、数据库、传统媒体、监控等等方法
T、对
F、错
答案联系QQ:3326650399 微信:cs80188 熊猫奥鹏(www.188open.com)
第49题,相关规矩能够被广泛地应用于通讯、金融、交通、安康医疗和Web用户行动剖析等范畴。
T、对
F、错
答案联系QQ:3326650399 微信:cs80188 熊猫奥鹏(www.188open.com)
答案来历:熊猫奥鹏(www.188open.com),决议计划树学习的算法一般是一个递归地挑选最优特征,并依据该特征对练习数据进行切割,使得各个子数据集有一个最佳的分类的过程,这一过程对应着特征空间的区分,也对应着决议计划树的构建
T、对
F、错
答案联系QQ:3326650399 微信:cs80188 熊猫奥鹏(www.188open.com)