第三章:隐式评价和基于物品的过滤算法

原文:http://guidetodatamining.com/chapter3/

本章会从用户的评价类型开始讨论,包括显式评价(赞一下、踩一脚、五星评价等等)和隐式评价(比如在亚马逊上购买了MP3,我们可以认为他喜欢这个产品)。

内容:

  • 显式评价
  • 隐式评价
  • 哪种评价方式更准确?
  • 基于用户的协同过滤
  • 基于物品的协同过滤
  • 修正的余弦相似度
  • Slope One算法
  • Slope One的Python实现
  • MovieLens数据

第二章中我们学习了协同过滤和推荐系统的基本知识,其中讲述的算法是比较通用的,可以适用于多种数据集。

用户使用5到10分的标尺来对不同的物品进行打分,通过计算得到相似的用户。但是,也有迹象表明用户通常不会有效地使用这种度量方式,而更倾向于给出极好或极差的评价,这种做法会使推荐结果变得不可用。

这一章我们将继续探讨这个问题,尝试使用高效的方法给出更精确的推荐。