- 1、本文档共20页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
技术
在民宿推荐中的应用
周文彪@
背景-民宿推荐&Embedding
方案-业务中Embedding如何落地
改进-落地时的摸索和技巧
后续-未来计划
2019 AI Pioneer
Conference
民宿个性化推荐特点
消费低频
商品特色数据不易标注
用户核心需求不好挖掘
背景-民宿推荐&embedding WWW.TUJIA.COM
个性化推荐方案比较
基于协同过滤的 基于embedding的
基于内容的推荐
item-to-item相似推荐 item-to-item相似推荐
依赖的数据:装修风格,位置交通,周边商圈, 依赖的数据:用户行为日志 依赖的数据:用户行为日志
性价比, 落地窗,图片美观度,有趣的特色…
特点: 不需要数据标注,从高层角度 特点: 不需要数据标注,从高层角度
特点:可覆盖新品,需要大量前序数据挖掘 进行推荐;无法覆盖新品, 进行推荐;无法覆盖新品,
和标注工作,但数据描述的全面性 在酒店民宿上应用会陷入 可以挖掘除了地标特征外
和准确性难保证 以地标相似为主的囧境。 的多维度相似性。
背景-民宿推荐&embedding WWW.TUJIA.COM
我们的 Embedding
Embedding场景 方案比较
房子用一个向量表示,相似的 Graphic Embedding 有顺序考虑,复杂度高
房子向量内积大 Rnn-Language Model有时序考虑,复杂度高
Skip-Gram Model 短时词袋模型,复杂度低
用户短时间内连续看过详情的房子
具有内在相似性
方案-业务中Embedding如何落地 WWW.TUJIA.COM
Skip-Gram Model
实现wordToVector 算法
的经典方法
利用词语在上下文中的 网络拓扑
共现现象,为每个词生成一个
高维向量表示 • 输入w(t)记为wi, 输出w(t+/-x)记为wo
• projection层参数:En×d
文档评论(0)