- 1、本文档共200页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
大数据挖掘分析专业考试复习题库(含答案)
一、单选题
1. 以下哪些分类方法可以较好地避免样本的不平衡问题?
()
A、KNN
B、SVM
C、Bayes
D、 神 经 网 络
答案: A
2. ()算法是最广泛使用的聚类算法,算法简单,易于理解和操作。
A、gglomerative
B、C.URE
C、K-means
D、k-中心点算法
答案: C
3.贝叶斯决策是根据()进行决策的一种方法。
A、极大似然概率
B、先验概率
C、边际概率
D、后验概率
答案: D
4.回归分析的第一步是()
A、确定解释量和被解释变量
B、确定回归模型
C、建立回归方程
D、进行检验
答案: A
5.当所有观测值都落在回归直线上,则这两个变量之间的相关系数为()
A、1
B、-1
C、+1 或-1
D、0
答案: C
6. ()是进行项目投资效益评价的最终依据。
A、现金流量
B、盈亏平衡点
C、净现金流量
D、现金流入量
答案: C
7.被广泛用于购物篮分析的是()。
A、关联分析;
B、分类和预测
C、聚类分析
D、演变分析
答案: A
8.下面哪种不属于数据预处理的方法?()
A、变量代换
B、离散化
C、聚集
D、估计遗漏值
答案: D
9.下列不属于关联分析的关键要素的是()
A、支持度
B、置信度
C、满意度
D、提升度
答案: C
10.NoSQL 含义是指()
A、NO!SQL;
B、NomberSQL;
C、NotOnlySQL
D、NOLLSQL
答案: C
11.个人信息的收集、处理和利用应当遵循()的原则,不得违反法律、法规的规定
和双方的约定收集、处理和利用个人信息。()
A、正规、合法、必要
B、合法、正当、必要
C、合法、合规、正当
D、合法、合理、合规
答案: B
12.Tableau 能够对数据进行处理包括()。
A、将多个数据源数据拼接为一个宽表;
B、修改、删除、新增数据行;
C、对数据进行行列转换、重命名、格式修改;
D、对数据进行计算、合并生成新的数据列
答案:A
13. ()是数据仓库体系架构的重要组成部分,具备数据仓库的部分特征和OLTP 系
统的部分特征。
A、E.SB;
B、D.M
C、ODS
D、E. TL
答案:C
14.RFM 方法中的F 说明客户的()
A、兴趣度
B、粘性
C、当前价值
D、未来价值
答案: A
15.关于主成分数目的选取,正确的是()
A、保留多少个主成分取决于累计方差在方差总和中所占百分比
B、一般选择50%以上
C、选择前两个就可以
D、选择的数目和变量的个数一致
答案: A
16.下列关于数据重组的说法中,错误的是()
A、数据重组是数据的重新生产和重新采集
B、数据重组能够使数据焕发新的光芒
C、数据重组实现的关键在于多源数据融合和数据集成
D、数据重组有利于实现新颖的数据模式创新
答案: A
17.在SQL 中,创建数据库用的命令是()
A、CREATESCHEMA
B、CREATETABLE
C、CREATEVIEW
D、CREATEDATABASE
答案: D
18.当时间序列数据点的一阶差分近似为一常数,可配合以下哪种预测模型()
A、直线
B、二次抛物线
C、三次抛物线
D、指数曲线
答案: A
19.对于企业来说,数据使用的关键是()
A、数据收集
B、数据存储
C、数据分析
D、数据再利用
答案: D
20.线性回归算法寻找()与预测目标之间的线性关系。
A、属性
B、根因
C、表象
答案: A
21.下面不属于明细数据质量评价指标的是()。
A、接入率;
B、自动采集率
C、及时率
D、完整率
答案: B
22.资金的时间价值是()
A、同一资金在同一时点上价值量的差额
B、同一资金在不同时点上价值量的差额
C、不同资金在同一时点上价值量的差额
D、不同资金在不同时点上价值量的差额
答案: B
23.以下哪种方法不属于于监督学习模型()
A、决策树
B、线性回归
C、关联分析
D、判别分析
答案:C
24.在多元回归模型的检验中,目的是检验每一个自变量与因变量在指定显著性
水平上是否存在线性相关关系的检验是()
A、r检验
B、t检验
C、f检验
D、DW 检 验
答案: B
25.关于混合模型聚类算法的优缺点,下面说法正确的是()
A、当簇只包含少量数据点,或者数据点近似协线性时,混
合模型也能很好地处理。
B、混合模型比K 均值或模糊C 均值更一般,因为它可以使用各种类型的分布。
答案: D
C、混合模型很难发现不同大小和椭球形状的簇。
D、混合模型在有噪声和离群点时不会存在问题。
答案: B
26.大数据背景下,数据支撑业务的目的是()
A、建立数据科学
B、完成数据应用
C、配备数据硬件
D、吸纳数据人才
答案: B
27.
文档评论(0)