- 1、本文档共2页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
洞悉家庭购买先机家用电器零售商需要解决两个问题要点
洞悉家庭购买先机
家用电器零售商需要解决两个问题
所有的商业行为参与者,都希望自己能够是那个洞察先机者。企业希望自己能了解顾客
的精准需求,会购买哪些产品?会在什么时间购买?未来的需求点在哪里?而顾客则希望自
己能在企业提供的浩如烟海的信息中精准找到自己的需求点。
一家法国家用电器销售通过用一种解决方案来预测以往客户的产品购买行为,洞悉家庭
购买更多产品的可能性。该公司部署了 Cloudera Hadoop 分发版(CDH)获取和处理海量原
始客户数据,如购买历史、人口统计数据、服务请求等。
这家公司在寻求英特尔的帮助中,只提出了两个问题:如何识别最可能在未来 12 个月
内购买电器的头500个家庭?这些家庭最可能购买哪个产品线的产品?
而这两个问题,也是众多零售企业的需求共性。该公司联系英特尔以帮助满足其大数据
需求。根据英特尔的建议,他们决定使用运行 CDH 和 R 统计软件的 Hadoop 集群。该 CDH
集群可加载并处理九个来源的数据。在经过合并与聚合后,这些数据源的文件被用于创建
106 个变量,根据定义涵盖下列项目:客户基本信息、家庭信息、家庭细分、过去的购买行
为、服务和维护请求行为、家庭住房、政府户籍资料和当地人口统计数据、触发服务请求的
契机、居民活动。
表面上来看,这些信息和传统的调查问卷区别不大,但事实上,这些数据背后指向的精
准分析,才是企业需求的重点。
为确定和选择对客户购买习惯影响最大的变量,英特尔针对每个客户数据组应用了单独
的随机预测算法。该算法包含 1000 个不同的树。该分析的理论基础为贝叶斯推理,这种推
理统计方法可计算客户兴趣的后验概率。
基于 Cloudera 的全新解决方案可使用复杂的随机预测模型算法,从客户数据中创建
100 多个确定性变量,CDH 可利用贝叶斯流程将这些变量转变为可行的解决方案,以准确预
测客户的购买行为,帮助该公司根据数据做出明智的业务决策。
在处理九个来源的数据后,该解决方案创建了 106 个变量,以确定客户/家庭后续从各
个产品线中购买更多产品的可能性。该模型执行了 Hive 查询,将 Hive 表转换为 CSV 文
件,执行 R 脚本并以 CSV 文件格式保存结果。最后,该模型会根据概率似然得分将选择划
分为不同层级。
逻辑回归模型按照随机预测算法确定的重要性优先级基于变量而构建。每个客户具有
“购买/不购买” 标志,该标志表示家庭购买意向所受到的积极或消极影响。它还可帮助十
分准确地预测客户将会购买哪个产品线的产品。
根据模型计算,各家庭按照从高到低的购买可能性进行排序。该模型还可预测对于每个
家庭,哪个产品供应链具有最高的购买后验概率。
英特尔使用三个 HiveQL 脚本和九个 R 脚本,以及一个可有序执行 HiveQL 和 R 脚本
的 shell 脚本为该模型开发了代码,并生成了最终的分析结果。
为证明该逻辑回归模型的准确性和强大功能,英特尔验证了该模型,即使用 2015 年的
结果预测客户购买的可能性,并识别他们会购买哪个产品线的产品。在实际场景中测试了该
模型的功能,将预测结果与这年的实际购买结果进行了比较,发现预测准确率为 68%。一些
产品线的误预测率大幅高于平均值,但它们在测试组中仅占很小的比率。
英特尔帮助为该公司开发的回归模型可使用过去一年的购买数据验证模型函数的准确
性,并证明了其准确的预测能力。借助该模型,该公司现在可准确了解哪个家庭最可能在未
来 12 个月内购买大型家用电器,以及这些电器会选自哪些产品线。此外,该公司还可一目
了然地查看每个家庭的购买次数以及每次购买的平均时间间隔,更清晰地了解客户及其购买
习惯,从而制定更有效的计划。
在部署 CDH 之前,该公司的预测方法无法提供他们所要的答案。在英特尔和 Cloudera
的帮助下,该公司获得了高度一致的高级预测模型的优势。这款由英特尔和 Cloudera 联合
设计的解决方案优势明显,即可以为该公司提供从客户数据中创建变量的方法,以预测每位
客户的购买模式;还可以使用这些变量准确评估客户在过去一年的购买趋势,做出更准确反
映客户实际购买行为的预测。
您可能关注的文档
- 扬州扬杰电子科技新股估值分析报告.PDF
- 打造360MySQL服务.PDF
- 投标方应保证提供符合本规格书和.PDF
- 抗炭疽孕粤员缘单克隆抗体的制备及免疫学检测方法的建立.PDF
- 抗燃油中氯含量测定方法.PDF
- 把握新机遇树立新观念谋求新发展.PDF
- 拉杆锻件的辊锻制坯工艺研究与开发.PDF
- 招标编号SCWZDL-2O1512-YJQZY02.PDF
- 招标编号GW2015-JM056.PDF
- 按摩院牌照申请简介.PDF
- GB/T 34877.4-2024工业风机 标准实验室条件下风机声功率级的测定 第4部分:声强法.pdf
- 中国国家标准 GB/T 34877.4-2024工业风机 标准实验室条件下风机声功率级的测定 第4部分:声强法.pdf
- 中国国家标准 GB/T 5578-2024固定式发电用汽轮机规范.pdf
- GB/T 5578-2024固定式发电用汽轮机规范.pdf
- 《GB/T 5578-2024固定式发电用汽轮机规范》.pdf
- 《GB/T 4340.1-2024金属材料 维氏硬度试验 第1部分:试验方法》.pdf
- GB/T 4340.1-2024金属材料 维氏硬度试验 第1部分:试验方法.pdf
- 中国国家标准 GB/T 4340.1-2024金属材料 维氏硬度试验 第1部分:试验方法.pdf
- GB/T 43995-2024数字航天摄影测量 空中三角测量规范.pdf
- 中国国家标准 GB/T 43995-2024数字航天摄影测量 空中三角测量规范.pdf
文档评论(0)