阿里助理工程师ACA考试真题题库七.pdfVIP

阿里助理工程师ACA考试真题题库七.pdf

  1. 1、本文档共76页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

试卷科目:考试

阿里助理工程师ACA考试真题题库七

说明:答案和解析在试卷最后

第1部分:单项选择题,共229题,每题只有一个正确答案,多选或少选均不得分。

1.[单选题]客户拿来10万条记录的号码清单,有重复数据同时也有错误数据,导入到MaxCompute的数据系统中,假设是导

入到表A,直接和系统的客户信息记录表B(无重复记录信息)用号码关联查询地址信息,要得到准确的信息,哪种处理最优

、效果最好?()

A)表A和表B直接以号码字段做join关联

B)表B用号码字段左连接A

C)表B用号码字段右连接A

D)先整理表A,再进行等关联

2.[单选题]日常数据分析过程中,影响数据质量的因素多种多样,如下描述中,哪种是统计口径引起的数据质量问题?()

A)上游数据源不完善或不规范,导致下游系统受到影响,出现数据质量问题

B)系统升级导致数据信息丢失

C)需求涉及的各个环节的人员配置不完善,或指责分工不明确,造成需求无法有效沟通或责任推诿现象

D)业务部i门在描述或定义指标口径时,存在许多不明确和不完善的地方,造成了指标口径的二义性

3.[单选题]DataWorks中关于调度依赖的描述中错误的是?()

A)一个工作流可以依赖多个上游工作流,同样,一个工作流可被多个工作流依赖

B)任务A可以配置依赖属性依赖任务B,也可以配置跨周期依赖依赖B,如此任务A既依赖任务B本周期也依赖任务B上周期

C)日调度任务中,今天需要执行的数据依赖本任务昨天执行的数据,那么可以配置依赖昨天任务的周期

D)日调度任务只能依赖于目调度任务,不能依赖时调度任务

4.[单选题]某公司在阿里云PAI机器学习平台上搭建一个产品销量预测方案以帮助其进行决策。该公司的产品数据每一

个月更新一次,为了每次更新后都能立刻使用新的数据进行分析预测,该公司可以在dataworks的()界面配置周期调度。

()

A)数据集成

B)数据开发

C)数据管理

D)运维中心

5.[单选题]分析师小王为公司预测某种产品销量,目标是将下个周期的预测误差控制在10%以内,并洞察价格和促销方法

对该产品销量的影响。小王使用了公司中-直再使用的预测模型后,发现预测非常不准,原来是因为该产品的促销周期跟

其他大多数产品不一样。正确的销售预测流程是确定目标》整理数据》选择方法》建立模型》编写报告。对于小王的疏

忽,最准确的描述是()

A)小王没有问清楚该项目的目标

B)小王没有分析和整理好原始数据

C)小王选择了错误的预测方法

D)小王的建模调参水平不行

6.[单选题]某公司在2016年底时根据历史的销量、价格、广告等所有数据中存在的因素来预测未来五年销量的变化,并

根据预测的销量制定公司的发展战略和每-年的KPI。销量预测有三个特点,连贯性、相关性和混沌性。根据上述内容,该

考试真题题1/

试卷科目:考试

公司预测和制定策略时没有充分考虑到销量预测的哪个特点?()

A)连贯性

B)相关性

C)混沌性

D)以上都是

7.[单选题]数据分析师小李想要在阿里云PAI机器学习平台上进行线性回归建模,为了实现线性回归、预测并评估模型

,正确的组件连接逻辑是。()

A)数据集-拆分(输出训|练集)-线性回归,拆分(输出测试集)-预测-回归模型评估

B)数据集-线性回归,拆分(输出测试集)-预测-回归模型评估

C)数据集-线性回归,拆分(输出测试集)回归模型评估-预测

D)数据集-拆分(输出训练集)-线性回归,拆分(输出测试集)-回归模型评估-预测

8.[单选题]MaxCompute表支持生命周期管理,即表中的数据从最后一次更新时间算起,在经过指定的时间后没有变动,则

此表将被MaxCompute自动回收。以卜说法中正确的是()。

A)对于某非分区表,-旦其lifecycle值指定的时间段内未更新,则该表将被自动删除

B)建表时可以指定lifecycle,其单位为小时,其取值必须为正整数

C)可以给不同的表或者不同的分区指定不同的生命周期lifecycle值

D)对于某分区表,一旦其lifecycl

您可能关注的文档

文档评论(0)

wangyuande + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档