大数据挖掘分析专业考试复习题库（含答案）.docx

下载文档

49
0
约2.98万字
约 200页
2023-07-12 发布于广东
举报
版权申诉
保障服务

大数据挖掘分析专业考试复习题库（含答案）.docx

1、本文档共200页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

大数据挖掘分析专业考试复习题库(含答案) 一、单选题 1. 以下哪些分类方法可以较好地避免样本的不平衡问题? () A、KNN B、SVM C、Bayes D、神经网络答案： A 2. ()算法是最广泛使用的聚类算法，算法简单，易于理解和操作。 A、gglomerative B、C.URE C、K-means D、k-中心点算法答案： C 3.贝叶斯决策是根据()进行决策的一种方法。 A、极大似然概率 B、先验概率 C、边际概率 D、后验概率答案： D 4.回归分析的第一步是() A、确定解释量和被解释变量 B、确定回归模型 C、建立回归方程 D、进行检验答案： A 5.当所有观测值都落在回归直线上，则这两个变量之间的相关系数为() A、1 B、-1 C、+1 或-1 D、0 答案： C 6. ()是进行项目投资效益评价的最终依据。 A、现金流量 B、盈亏平衡点 C、净现金流量 D、现金流入量答案： C 7.被广泛用于购物篮分析的是()。 A、关联分析； B、分类和预测 C、聚类分析 D、演变分析答案： A 8.下面哪种不属于数据预处理的方法?() A、变量代换 B、离散化 C、聚集 D、估计遗漏值答案： D 9.下列不属于关联分析的关键要素的是() A、支持度 B、置信度 C、满意度 D、提升度答案： C 10.NoSQL 含义是指() A、NO!SQL; B、NomberSQL; C、NotOnlySQL D、NOLLSQL 答案： C 11.个人信息的收集、处理和利用应当遵循()的原则，不得违反法律、法规的规定和双方的约定收集、处理和利用个人信息。() A、正规、合法、必要 B、合法、正当、必要 C、合法、合规、正当 D、合法、合理、合规答案： B 12.Tableau 能够对数据进行处理包括()。 A、将多个数据源数据拼接为一个宽表； B、修改、删除、新增数据行； C、对数据进行行列转换、重命名、格式修改； D、对数据进行计算、合并生成新的数据列答案：A 13. ()是数据仓库体系架构的重要组成部分，具备数据仓库的部分特征和OLTP 系统的部分特征。 A、E.SB; B、D.M C、ODS D、E. TL 答案：C 14.RFM 方法中的F 说明客户的() A、兴趣度 B、粘性 C、当前价值 D、未来价值答案： A 15.关于主成分数目的选取，正确的是() A、保留多少个主成分取决于累计方差在方差总和中所占百分比 B、一般选择50%以上 C、选择前两个就可以 D、选择的数目和变量的个数一致答案： A 16.下列关于数据重组的说法中，错误的是() A、数据重组是数据的重新生产和重新采集 B、数据重组能够使数据焕发新的光芒 C、数据重组实现的关键在于多源数据融合和数据集成 D、数据重组有利于实现新颖的数据模式创新答案： A 17.在SQL 中，创建数据库用的命令是() A、CREATESCHEMA B、CREATETABLE C、CREATEVIEW D、CREATEDATABASE 答案： D 18.当时间序列数据点的一阶差分近似为一常数，可配合以下哪种预测模型() A、直线 B、二次抛物线 C、三次抛物线 D、指数曲线答案： A 19.对于企业来说，数据使用的关键是() A、数据收集 B、数据存储 C、数据分析 D、数据再利用答案： D 20.线性回归算法寻找()与预测目标之间的线性关系。 A、属性 B、根因 C、表象答案： A 21.下面不属于明细数据质量评价指标的是()。 A、接入率； B、自动采集率 C、及时率 D、完整率答案： B 22.资金的时间价值是() A、同一资金在同一时点上价值量的差额 B、同一资金在不同时点上价值量的差额 C、不同资金在同一时点上价值量的差额 D、不同资金在不同时点上价值量的差额答案： B 23.以下哪种方法不属于于监督学习模型() A、决策树 B、线性回归 C、关联分析 D、判别分析答案：C 24.在多元回归模型的检验中，目的是检验每一个自变量与因变量在指定显著性水平上是否存在线性相关关系的检验是() A、r检验 B、t检验 C、f检验 D、DW 检验答案： B 25.关于混合模型聚类算法的优缺点，下面说法正确的是() A、当簇只包含少量数据点，或者数据点近似协线性时，混合模型也能很好地处理。 B、混合模型比K 均值或模糊C 均值更一般，因为它可以使用各种类型的分布。答案： D C、混合模型很难发现不同大小和椭球形状的簇。 D、混合模型在有噪声和离群点时不会存在问题。答案： B 26.大数据背景下，数据支撑业务的目的是() A、建立数据科学 B、完成数据应用 C、配备数据硬件 D、吸纳数据人才答案： B 27.