我们自己终会成为大数据.pdf

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
我们自己终会成为大数据 从庞杂的数据背后挖掘、分析用户的行为习惯和喜好,找出更符合用户「口味」的产品和 服务,并结合用户需求有针对性地调整和优化自身,就是大数据的价值。 对于大数据在商业上的用途,这句话说得很清楚。前半句是重点,了解用户的行为习惯和爱好,这 就是大数据的核心价值。 1. 元数据( Metadata )的概念 简单说,元数据是对数据本身进行描述的数据,或者说,它不是对象本身,它只描述对象的属性。 比如,一幅画本身,是数据。而这幅画的作者、完成时间、尺寸、价格、类型等等,就是它的元 数据。 再比如,你妈逼你结婚,找了个男的让你相亲。你并不认识他,但你妈告诉你他的年龄、身高、 体重、体貌特征、家庭背景、收入、爱好特长,你心里也就对他有了印象。即便你还不认识他。 元数据的价值,第一是能够从侧面描述对象,第二点就是可以结构化、信息化。 什么意思呢? 比如,我们要判断一幅画的价值,除了专家直接通过画的艺术性来评价,还可以通过元数据来判断 。 这幅画是名家的还是二流画家的?这幅画是作者在他创作鼎盛时期的作品,还是在年轻时的作品? 这幅画是作者擅长的类型还是他不熟悉的? 用这些描述的信息,我们居然就能把这幅画的价值算得八九不离十。虽然肯定会存在误差,但同样 是科学合理的方法。 那用元数据而非数据本身描述对象的意义何在? 这就是在大数据上产生的价值了:对于非结构化的、非量化的对象本身,结构化的元数据可以用以 快速计算和判断。 比如,你妈拿了 100 个单身男的资料,你要是一个一个去仔细翻阅,那几天都翻不完。但你告诉 你妈,高学历的可能意味着素质很高,高收入的可能意味着能力很强,所以先把低学历低收入的 筛掉,剩下的再依据身高体重年龄这些信息排序,那效率就高得多了。 注意,这样的方法仍然会有失误的,说不定真爱就在被筛掉的人里。但这样的概率微乎其微。 相亲里似乎还不太明显,但大数据在真正产品应用中,产生的效果就天翻地覆了。 2. 大数据应用的第一阶段:辅助产品。 最初的应用比较简单,就是用以辅助产品人员和市场人员做判断。 过去的实体产品做一次调研很麻烦。比如饮料公司,调研人员要用各种方式观看他们喝饮料的场景 和步骤。 问卷是最常见的,但不准。所以会组织各种各样专业的现场试验,要搭建环境(一般是有单面玻璃 或摄像头的)、邀请志愿者,然后引导他们按照日常的习惯去完成一些操作。 比如这样的通过摄像头监视观察室。 (图片摘自: 0/jkx/newsdetail.asp?id=1038 ) 显然这种办法非常笨重。 而现在的互联网产品则根本无须这么麻烦。用户所有的使用数据、行为,都是记录在案的,想知道 什么,瞬间就能分析出来。 过去想知道用户有没有做一件事,比如有没有用过这个功能?太难了。 现在呢,就问点击这个行为,点击了几下、点击在哪里,什么时候点的,甚至这是在什么地方点的 、点击之后又做了什么,一清二楚。 用户平时用不用这个功能、怎么用这个功能,也就一目了然。 对于产品设计者来说,这是至关重要的数据。而且,这是完整的数据!如果是互联网产品,那么我 知道的是所有用户的数据,不是过去传统行业产品的样本数据。 腾讯知道所有微信用户有多少用朋友圈、知道这些用户每天都发几条朋友圈、知道这些用户每天都 发了什么。每一个数据都是真实可用的。 (过去发行量再大的报纸也很难知道读者性别,然而现在再小的微信公众号也可以实时获取。) 在实体产品的行业,随着未来整个产品从生产到销售到使用的信息化,大数据也会渐渐起到更大的 作用。过去我卖的一瓶水,可能到某个超市就断掉了,我不知道这瓶水被谁买走了。但现在我在天 猫卖的一瓶水,我知道对方这个用户是每个月买十箱水的,他的地址是某个高档餐厅,那我就知道 这瓶水的目标受众是谁了。 这是元数据的价值所在。 所以说,大数据的第一阶段是:辅助产品设计者做判断、让产品制造者更好地满足用户。 这时候的大数据主要是来为产品提供支持,产品再应用于用户。 3. 大数据应用的第二阶段:创造价值。 在数据的数量和质量达到一定程度后,事情开始变化了。元数据将不仅作为产品的辅助,而是变成 了最有价值的产生本身。 很简单的,全中国最熟悉老百姓消费习惯的是工商局吗?是哪个协会吗?是哪个科研机构吗?都 不是,是淘宝。 拥有最全面的个人信用信息的,是人事局吗?是银行吗?是咨询公司吗?都不是,是支付宝。 道理也简单得很,所有行为(消费、交易)发生在了这个平台上,而这个平台又有所有数据的记录 ,那这些数据就能产生巨大的价值。 你以为做医疗健康这方面的产品仅仅是关注你的健康吗?

文档评论(0)

tianya189 + 关注
官方认证
内容提供者

该用户很懒,什么也没介绍

认证主体阳新县融易互联网技术工作室
IP属地上海
统一社会信用代码/组织机构代码
92420222MA4ELHM75D

1亿VIP精品文档

相关文档