- 1、本文档共7页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
我们自己终会成为大数据
从庞杂的数据背后挖掘、分析用户的行为习惯和喜好,找出更符合用户「口味」的产品和
服务,并结合用户需求有针对性地调整和优化自身,就是大数据的价值。
对于大数据在商业上的用途,这句话说得很清楚。前半句是重点,了解用户的行为习惯和爱好,这
就是大数据的核心价值。
1. 元数据( Metadata )的概念
简单说,元数据是对数据本身进行描述的数据,或者说,它不是对象本身,它只描述对象的属性。
比如,一幅画本身,是数据。而这幅画的作者、完成时间、尺寸、价格、类型等等,就是它的元
数据。
再比如,你妈逼你结婚,找了个男的让你相亲。你并不认识他,但你妈告诉你他的年龄、身高、
体重、体貌特征、家庭背景、收入、爱好特长,你心里也就对他有了印象。即便你还不认识他。
元数据的价值,第一是能够从侧面描述对象,第二点就是可以结构化、信息化。
什么意思呢?
比如,我们要判断一幅画的价值,除了专家直接通过画的艺术性来评价,还可以通过元数据来判断
。
这幅画是名家的还是二流画家的?这幅画是作者在他创作鼎盛时期的作品,还是在年轻时的作品?
这幅画是作者擅长的类型还是他不熟悉的?
用这些描述的信息,我们居然就能把这幅画的价值算得八九不离十。虽然肯定会存在误差,但同样
是科学合理的方法。
那用元数据而非数据本身描述对象的意义何在?
这就是在大数据上产生的价值了:对于非结构化的、非量化的对象本身,结构化的元数据可以用以
快速计算和判断。
比如,你妈拿了 100 个单身男的资料,你要是一个一个去仔细翻阅,那几天都翻不完。但你告诉
你妈,高学历的可能意味着素质很高,高收入的可能意味着能力很强,所以先把低学历低收入的
筛掉,剩下的再依据身高体重年龄这些信息排序,那效率就高得多了。
注意,这样的方法仍然会有失误的,说不定真爱就在被筛掉的人里。但这样的概率微乎其微。
相亲里似乎还不太明显,但大数据在真正产品应用中,产生的效果就天翻地覆了。
2. 大数据应用的第一阶段:辅助产品。
最初的应用比较简单,就是用以辅助产品人员和市场人员做判断。
过去的实体产品做一次调研很麻烦。比如饮料公司,调研人员要用各种方式观看他们喝饮料的场景
和步骤。
问卷是最常见的,但不准。所以会组织各种各样专业的现场试验,要搭建环境(一般是有单面玻璃
或摄像头的)、邀请志愿者,然后引导他们按照日常的习惯去完成一些操作。
比如这样的通过摄像头监视观察室。
(图片摘自: 0/jkx/newsdetail.asp?id=1038 )
显然这种办法非常笨重。
而现在的互联网产品则根本无须这么麻烦。用户所有的使用数据、行为,都是记录在案的,想知道
什么,瞬间就能分析出来。
过去想知道用户有没有做一件事,比如有没有用过这个功能?太难了。
现在呢,就问点击这个行为,点击了几下、点击在哪里,什么时候点的,甚至这是在什么地方点的
、点击之后又做了什么,一清二楚。
用户平时用不用这个功能、怎么用这个功能,也就一目了然。
对于产品设计者来说,这是至关重要的数据。而且,这是完整的数据!如果是互联网产品,那么我
知道的是所有用户的数据,不是过去传统行业产品的样本数据。
腾讯知道所有微信用户有多少用朋友圈、知道这些用户每天都发几条朋友圈、知道这些用户每天都
发了什么。每一个数据都是真实可用的。
(过去发行量再大的报纸也很难知道读者性别,然而现在再小的微信公众号也可以实时获取。)
在实体产品的行业,随着未来整个产品从生产到销售到使用的信息化,大数据也会渐渐起到更大的
作用。过去我卖的一瓶水,可能到某个超市就断掉了,我不知道这瓶水被谁买走了。但现在我在天
猫卖的一瓶水,我知道对方这个用户是每个月买十箱水的,他的地址是某个高档餐厅,那我就知道
这瓶水的目标受众是谁了。
这是元数据的价值所在。
所以说,大数据的第一阶段是:辅助产品设计者做判断、让产品制造者更好地满足用户。
这时候的大数据主要是来为产品提供支持,产品再应用于用户。
3. 大数据应用的第二阶段:创造价值。
在数据的数量和质量达到一定程度后,事情开始变化了。元数据将不仅作为产品的辅助,而是变成
了最有价值的产生本身。
很简单的,全中国最熟悉老百姓消费习惯的是工商局吗?是哪个协会吗?是哪个科研机构吗?都
不是,是淘宝。
拥有最全面的个人信用信息的,是人事局吗?是银行吗?是咨询公司吗?都不是,是支付宝。
道理也简单得很,所有行为(消费、交易)发生在了这个平台上,而这个平台又有所有数据的记录
,那这些数据就能产生巨大的价值。
你以为做医疗健康这方面的产品仅仅是关注你的健康吗?
您可能关注的文档
- 我和祖国共成长【推荐下载】.pdf
- 我很感激她作文500字4篇.pdf
- 我很重要教案.pdf
- 我回家最晚的一天初三作文800字.pdf
- 我会记得中考作文6篇.pdf
- 我家的吊兰作文5篇.pdf
- 我家的乌龟作文6篇.pdf
- 我家的小猫作文350字(精选8篇).pdf
- 我家的小猫作文400字.pdf
- 我家的小院作文400字7篇.pdf
- 山东省临沂市沂水县2023-2024学年高一下学期期中考试历史试题.docx
- 江苏省泰州市靖江高级中学2023-2024学年高二下学期4月期中考试物理试题(无答案).docx
- 新疆部分名校2023-2024学年高二下学期期中联合考试语文试题.docx
- 湖南省岳阳市岳阳县第一中学2023-2024学年高三下学期4月期中考试数学试题.docx
- 山东省烟台市2023-2024学年高二下学期4月期中生物试题(无答案).docx
- 江苏省靖江高级中学2023-2024学年高二下学期期中地理试题(无答案).docx
- 四川省甘孜藏族自治州某重点中学2023-2024学年高一下学期4月期中考试物理试题.docx
- 湖北省武汉市华中师范大学第一附属中学2023-2024学年高二下学期4月期中英语试题(无答案).docx
- 四川省成都市金牛区成都市实验外国语学校2024年高三三模考试生物试题.docx
- 浙江省宁波市北仑中学2023-2024学年高二下学期期中考试物理试题.docx
1亿VIP精品文档
相关文档
最近下载
- 2021年河北省中考语文试题及答案(版).pdf
- 2022江西数学中考试卷(含答案解析).pdf VIP
- 一种具有指纹识别功能的保温杯.pdf VIP
- 妇幼保健信息系统建设方案.pdf
- 食管癌合并糖尿病患者的围手术期护理.doc
- 备战2024年中考语文仿真模拟卷(上海专用)第四模拟-(原卷版+解析).docx VIP
- 2024年怀化职业技术学院招聘教师及辅导员33人笔试备考题库及答案解析.docx
- 2023年北京科技大学计算机科学与技术专业《数据结构与算法》科目期末试卷A(有答案).docx VIP
- ECS-700-系统工程师系列培训-系统组态.pdf
- pcb工艺规范及pcb设计安规原则.doc
文档评论(0)