大数据挖掘分析专业考试复习题库(含答案).docx

大数据挖掘分析专业考试复习题库(含答案).docx

  1. 1、本文档共200页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
大数据挖掘分析专业考试复习题库(含答案) 一、单选题 1. 以下哪些分类方法可以较好地避免样本的不平衡问题? () A、KNN B、SVM C、Bayes D、 神 经 网 络 答案: A 2. ()算法是最广泛使用的聚类算法,算法简单,易于理解和操作。 A、gglomerative B、C.URE C、K-means D、k-中心点算法 答案: C 3.贝叶斯决策是根据()进行决策的一种方法。 A、极大似然概率 B、先验概率 C、边际概率 D、后验概率 答案: D 4.回归分析的第一步是() A、确定解释量和被解释变量 B、确定回归模型 C、建立回归方程 D、进行检验 答案: A 5.当所有观测值都落在回归直线上,则这两个变量之间的相关系数为() A、1 B、-1 C、+1 或-1 D、0 答案: C 6. ()是进行项目投资效益评价的最终依据。 A、现金流量 B、盈亏平衡点 C、净现金流量 D、现金流入量 答案: C 7.被广泛用于购物篮分析的是()。 A、关联分析; B、分类和预测 C、聚类分析 D、演变分析 答案: A 8.下面哪种不属于数据预处理的方法?() A、变量代换 B、离散化 C、聚集 D、估计遗漏值 答案: D 9.下列不属于关联分析的关键要素的是() A、支持度 B、置信度 C、满意度 D、提升度 答案: C 10.NoSQL 含义是指() A、NO!SQL; B、NomberSQL; C、NotOnlySQL D、NOLLSQL 答案: C 11.个人信息的收集、处理和利用应当遵循()的原则,不得违反法律、法规的规定 和双方的约定收集、处理和利用个人信息。() A、正规、合法、必要 B、合法、正当、必要 C、合法、合规、正当 D、合法、合理、合规 答案: B 12.Tableau 能够对数据进行处理包括()。 A、将多个数据源数据拼接为一个宽表; B、修改、删除、新增数据行; C、对数据进行行列转换、重命名、格式修改; D、对数据进行计算、合并生成新的数据列 答案:A 13. ()是数据仓库体系架构的重要组成部分,具备数据仓库的部分特征和OLTP 系 统的部分特征。 A、E.SB; B、D.M C、ODS D、E. TL 答案:C 14.RFM 方法中的F 说明客户的() A、兴趣度 B、粘性 C、当前价值 D、未来价值 答案: A 15.关于主成分数目的选取,正确的是() A、保留多少个主成分取决于累计方差在方差总和中所占百分比 B、一般选择50%以上 C、选择前两个就可以 D、选择的数目和变量的个数一致 答案: A 16.下列关于数据重组的说法中,错误的是() A、数据重组是数据的重新生产和重新采集 B、数据重组能够使数据焕发新的光芒 C、数据重组实现的关键在于多源数据融合和数据集成 D、数据重组有利于实现新颖的数据模式创新 答案: A 17.在SQL 中,创建数据库用的命令是() A、CREATESCHEMA B、CREATETABLE C、CREATEVIEW D、CREATEDATABASE 答案: D 18.当时间序列数据点的一阶差分近似为一常数,可配合以下哪种预测模型() A、直线 B、二次抛物线 C、三次抛物线 D、指数曲线 答案: A 19.对于企业来说,数据使用的关键是() A、数据收集 B、数据存储 C、数据分析 D、数据再利用 答案: D 20.线性回归算法寻找()与预测目标之间的线性关系。 A、属性 B、根因 C、表象 答案: A 21.下面不属于明细数据质量评价指标的是()。 A、接入率; B、自动采集率 C、及时率 D、完整率 答案: B 22.资金的时间价值是() A、同一资金在同一时点上价值量的差额 B、同一资金在不同时点上价值量的差额 C、不同资金在同一时点上价值量的差额 D、不同资金在不同时点上价值量的差额 答案: B 23.以下哪种方法不属于于监督学习模型() A、决策树 B、线性回归 C、关联分析 D、判别分析 答案:C 24.在多元回归模型的检验中,目的是检验每一个自变量与因变量在指定显著性 水平上是否存在线性相关关系的检验是() A、r检验 B、t检验 C、f检验 D、DW 检 验 答案: B 25.关于混合模型聚类算法的优缺点,下面说法正确的是() A、当簇只包含少量数据点,或者数据点近似协线性时,混 合模型也能很好地处理。 B、混合模型比K 均值或模糊C 均值更一般,因为它可以使用各种类型的分布。 答案: D C、混合模型很难发现不同大小和椭球形状的簇。 D、混合模型在有噪声和离群点时不会存在问题。 答案: B 26.大数据背景下,数据支撑业务的目的是() A、建立数据科学 B、完成数据应用 C、配备数据硬件 D、吸纳数据人才 答案: B 27.

文档评论(0)

165720323137e88 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档