推荐系统简介精要.ppt

  1. 1、本文档共40页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
为了更细致地描述推荐系统发掘长尾的能力,需要统计推荐列表中不同物品出现次数的分布。如果所有的物品都出现在推荐列表中,且出现的次数差不多,那么推荐系统发掘长尾的能力就很好 马太效应:强者更强,弱者更弱 很多研究表明现在主流的推荐算法(比如协同过滤算法)是具有马太效应的 4、多样性 为了满足用户广泛的兴趣,推荐列表需要能够覆盖用户不同的兴趣领域,即推荐结果具有多样性 多样性推荐列表的好处用一句俗话表述就是”不在一棵树上吊死“ 多样性描述了推荐列表中物品两两之间的不相似性 5、新颖性 新颖的推荐是指给用户推荐那些他们以前没有听说过的物品 在一个网站中实现新颖性的最简单方法:把那些用户之前在网站中对其有过行为的物品从推荐列表中过滤掉 Oscar Celma在博士论文中研究了新颖度的评测 评测新颖度的最简单方法是利用推荐结果的平均流行度,因为越不热门的物品越可能让用户觉得新颖 如果推荐结果中物品的平均热门程度较低,那么推荐结果就可能有比较高的新颖性 但是,用推荐结果的平均流行度度量新颖性比较粗略,因为不同用户不知道的东西是不同的 要准确的统计新颖性需要做用户调查 6、惊喜度 惊喜度是最近这几年推荐系统领域最热门的话题 惊喜度和新颖性是有区别的: Guy Shani论文中的例子 如果推荐结果和用户的历史兴趣不相似,但却让用户觉得满意,那么就可以说推荐结果的惊喜度很高 推荐的新颖性仅仅取决于用户是否听说过这个推荐结果 提高推荐惊喜度需要提高推荐结果的用户满意度,同时降低推荐结果和用户历史兴趣度的相似度 7、信任度 度量推荐系统的信任度只能通过问卷调查的方式,询问用户是否信任推荐系统的推荐结果 提高推荐系统的信任度的两种方法: 增加推荐系统的透明度(如,提供推荐解释) 考虑用户的社交网络信息,利用用户的好友信息给用户做推荐,并且用好友进行推荐解释 8、实时性 物品(新闻、微博等)具有很强的时效性,需要在物品还具有时效性时就将它们推荐给用户 推荐系统的实时性包括两个方面: 推荐系统需要实时地更新推荐列表来满足用户新的行为变化 推荐系统需要能够将新加入系统的物品推荐给用户 9、健壮性 任何一个能带来利益的算法系统都会被人攻击,这方面最典型的例子就是搜索引擎(作弊和反作弊斗争) 推荐系统目前也遇到了同样的作弊问题,而健壮性指标衡量了一个推荐系统抗击作弊的能力 最著名的作弊方法:行为注入攻击 算法健壮性的评测主要利用模拟攻击 在实际系统中,提高系统的健壮性,除了选择健壮性高的算法,还有以下方法: 设计推荐推荐系统时尽量使用代价比较高的用户行为 在使用数据前,进行攻击检测,从而对数据进行清理 10、商业目标 很多时候,评价推荐系统更加注重网站的商业目标是否达成,商业目标和网站的盈利是息息相关的 最本质的商业目标是平均一个用户给公司带来的盈利 不同的网站具有不同的商业目标 电子商务网站,商业目标可能是销售额 基于展示广告盈利的网站,商业目标可能是广告展示总数 基于点击广告盈利的网站,商业目标可能是广告点击量 网站使用推荐系统的目的除了满足用户发现内容的需求,也需要利用推荐系统加快实现商业上的指标 评测维度 增加评测维度的目的就是知道一个算法在什么情况下性能最好 评测维度分为如下3种: 用户维度:主要包括用户的人口统计学信息、活跃度以及是不是新用户等 物品维度:包括物品的属性信息、流行度、平均分以及是不是新加入的物品等 时间维度:包括季节,是工作日还是周末,是白天还是晚上等 利用评测维度,可以找到一个看上去比较弱的算法的优势,发现一个看上去比较强的算法的缺点 谢谢大家! 推荐系统 戴 奇 * 推荐系统出现的原因 随着信息技术和互联网的发展,人们逐渐从信息匮乏的时代走入了信息过载(information overload)的时代。在这个时代,无论是信息消费者还是信息生产者都遇到了很大的挑战。 无明确需求 信息过载 推荐系统和搜索引擎的异同 相同点: 都是一种帮助用户快速发现有用信息的工具 不同点: 搜索引擎需要用户主动提供准确的关键词来寻找信息 推荐系统不需要用户提供明确的需求,而是通过分析用户的历史行为给用户的兴趣建模 从某种意义上说,推荐系统和搜索引擎对于用户来说是两个互补的工具 搜索引擎满足了用户有明确目的时的主动查找需求 推荐系统能够在用户没有明确目的的时候帮助他们发现感兴趣的新内容 推荐系统的概念和定义 定义:它是利用电子商务网站向客户提供商品信息和建议,帮助用户决定应该购买什么产品,模拟销售人员帮助客户完成购买过程”。 推荐系统有3个重要的模块:用户建模模块、推荐对象建模模块、推荐算法模块。 推荐系统把用户模型中兴趣需求信息

文档评论(0)

哆啦 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档