- 1、本文档共46页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
尚硅谷大数据技术之Hadoop (入门)
—————————————————————————————
尚硅谷大数据技术之Hadoop (入门)
(作者:尚硅谷大数据研发部)
版本:V2.0
第1 章 大数据概论
1.1 大数据概念
大数据概念如图2-1 所示。
大数据概念
大数据(Big Data):指无法在一定时间范围内用常规软件工具进行捕捉、管理
和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程
优化能力的海量、高增长率和多样化的 资产。
主要解决,海量数据的存储和海量数据的 计算问题。
按顺序给出数据存储单位:bit、Byte、
KB、MB、GB、TB、PB、EB、ZB、YB、
BB、NB、DB。
1Byte = 8bit 1K = 1024Byte 1MB = 1024K
1G = 1024M 1T = 1024G 1P = 1024T
图2-1 大数据概念
1.2 大数据特点 (4V )
大数据特点如图2-2 ,2-3,2-4 ,2-5 所示
更多J a –大数据 –前端 –python 人工智能资料 ,可 :尚硅谷官网
尚硅谷大数据技术之Hadoop (入门)
—————————————————————————————
大数据特点
1、Volume(大量)
截至目前,人类生产的所有印刷材料的数据量是200PB,而历史上全人类总共
说过的话的数据量大约是5EB。当前,典型个人计算机硬盘的容量为TB量级,而
一些大企业的数据量已经接近EB量级。
图2-2 大数据特点之大量
大数据特点
2、Velocity(高速)
这是大数据区分于传统数据挖掘的最显著特征。根据IDC的“数字宇宙”的
报告,预计到2020年,全球数据使用量将达到35.2ZB。在如此海量的数据面前,
处理数据的效率就是企业的生命。
天猫双十一:2017年3分01秒,天猫交易额超过100亿
图2-3 大数据特点之高速
更多J a –大数据 –前端 –python 人工智能资料 ,可 :尚硅谷官网
尚硅谷大数据技术之Hadoop (入门)
—————————————————————————————
大数据特点
3、Variety(多样)
这种类型的多样性也让数据被分为结构化数据和非结构化数据。相对于以往便
于存储的以数据库/文本为主的结构化数据,非结构化数据越来越多,包括网络日志、
音频、视频、图片、地理位置
您可能关注的文档
- 2019中迅网校道路工程4-2基层、底基层材料技术要求.pdf
- 华大hc32l110系列数据手册.pdf
- 小班管理--纸押题.pdf
- iphone系列原理图iphone4原理图iphone4修复串号教程.pdf
- suc课程大纲电信ict训练营.pdf
- 62九龙峰水保报批九龙峰水保报批稿.pdf
- 6专题六城建税法、烟叶税法-税法.pdf
- 巨杉数据库multi-model多模数据库引擎设计与实现.pdf
- 68 -内饰wm 683019拆卸和安装前杯座.pdf
- 供暖和通风-送风机电机.pdf
- 仓库保管员述职报告 仓库保管员述职报告总结 (21篇).docx
- 教师高级职称述职报告 教师高级职称述职报告要求字数多少 (17篇).docx
- 加油站经理述职报告 加油站经理述职报告2023年 (17篇).docx
- 销售主管述职报告范文 销售主管述职报告范文大全 (17篇).docx
- 机修班长述职报告 机修班长述职报告 (20篇).docx
- 村干部半年述职报告 村干部半年述职报告 (17篇).docx
- 学生会组织部述职报告 (15篇).docx
- 教师职称评定述职报告 初中教师职称评定述职报告 (17篇).docx
- 信贷述职报告 信贷述职报告怎么写 (17篇).docx
- 入党述职报告范文 入党述职报告范文大全 (19篇).docx
文档评论(0)