- 1、本文档共18页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
中国移动通信
移动改变生活
“大云”大数据平台及应用
中国移动通信研究院郭磊涛
2013年11月
Tull
电信运营商具有更多的数据
移动互联网专业SNS博客消息
服务商
电商
图片
视频优惠券
新闻点评
地图问答SNs音乐
签到、微博
电信运营商
2G、3G、4G、W|F
革站側P
除了像移动互联网服务商那样关注“结果”,电信运营商还需要关注“过程”
典型的应用场景之一:大数据批处理系统
目标:针对海量结构化、非结构化数据的ETL操作。从各种数据源获取数据,并进
行清洗、转换、去重、缺值补充等操作。通常釆用 MapReduce等并行计算技术。
技术要求举例
针对海星数据实时离线批处理运
算(ETL),通常时间要求较为
日会数
月会收
宽松,如几个小时级别
日汇总
月江总
√数据运算种类多,灵活性强
Mapado
√数据通常需要导出到数据库、数
√需要灵活的调度的系统,便于系
要和其他业务系统混合部署
例图:分时段汇总的业务场景
典型的应用场景之二:大数据查询系统
目标:针对海量结构化、半结构化数据的精确定位、区段扫描等条件查询操作,用
于网络优化、帐详单查询、故障定位、搜索引擎等业务场景
技术要求举例
计1
计算2
人器
√针对海量数据实施交互式查询
返回时间在1秒钟左右。
√针对海量大数据规模实施查询
数据规模可以达到100TB-10PB
大数库
ˇ数据插入通常采用批处理方式
果数较少
ˇ系统具备较高的并发性,支持大
吾厅系
用户同时查询,依然可以在给
时间出口返回结果
业厅亍
ˇ数据具有很高的可靠性和可用性
例囹:帐详单查询系统
要求
典型的应用场景之三:大数据挖掘系统
目标:针对海量结构化、非结构化数据的行深度挖掘。通常需要根据业务需求设
计模型、训练集并选择算法(分类、聚类、关联、非结构化)。通常会使用各种分
布式数据挖掘工具和算法
DHDoBaBD
技术要求举例
ˇ针对海星数据实施全星数据挖掘
规模达到10TB-PB规模。
√处理时间没有严格要求,通常达
√需要支持各种并行计算模式,如
MapReduce、BSP等
ˇ数据挖掘系统需要较好的用户界
「人群1
面,用户通常具备业务知识,但
是未必具备开发经验
√系统可以和其他系统混合部署
其它人群
√数据具有一定的可靠性和可用性
要求
您可能关注的文档
- 外汇市场干预及其效率剖析.ppt
- 外研版 英语作文.ppt
- 外汇市场套利和套汇.ppt
- 外研版 必修二 Module1 单元复习和训练.ppt
- 外汇零售品营销之西联汇款的案例分析安华国.ppt
- 外研版中考英语语法互动介词与介词短语.ppt
- 外研版中考英语语法互动非谓语动词.ppt
- 外汇市场形态分析.ppt
- 外研版小学英语六年级.ppt
- 外研版八年级下册英语Module1阶段专题复习.ppt
- 企业人力资源管理师之四级人力资源管理师题库练习试卷A卷附答案.docx
- 企业人力资源管理师之一级人力资源管理师题库练习试卷A卷附答案.docx
- 注册环保工程师之注册环保工程师专业基础题库检测试卷A卷附答案.docx
- 咨询工程师之工程项目组织与管理题库综合试卷A卷附答案.docx
- 社会工作者之初级社会工作实务题库检测试卷A卷附答案.docx
- 中级银行从业资格之中级银行管理题库综合试卷A卷附答案.docx
- 中级银行从业资格之中级银行业法律法规与综合能力题库综合试卷A卷附答案.docx
- 中级银行从业资格之中级银行管理题库练习试卷A卷附答案.docx
- 初级经济师之初级经济师财政税收题库综合试卷A卷附答案.docx
- 税务师之税法一题库检测试卷A卷附答案.docx
文档评论(0)