干货基于用户的协同过滤推荐算法原理和实现余弦|协同过滤算法_宠物用品

在推荐系统众多方法中，基于用户的协同过滤推荐算法是最早诞生的，原理也较为简单。该算法1992年提出并用于邮件过滤系统，两年后1994年被GroupLens用于新闻过滤。一直到2000年，该算法都是推荐系统领域最著名的算法。

基本思想

俗话说“物以类聚、人以群分”，拿看电影这个例子来说，如果你喜欢《蝙蝠侠》、《碟中谍》、《星际穿越》、《源代码》等电影，另外有个人也都喜欢这些电影，而且他还喜欢《钢铁侠》，则很有可能你也喜欢《钢铁侠》这部电影。

所以说，当一个用户A需要个性化推荐时，可以先找到和他兴趣相似的用户群体G，然后把G喜欢的、并且A没有听说过的物品推荐给A，这就是基于用户的系统过滤算法。

原理

根据上述基本原理，我们可以将基于用户的协同过滤推荐算法拆分为两个步骤：

1.找到与目标用户兴趣相似的用户集合2.找到这个集合中用户喜欢的、并且目标用户没有听说过的物品推荐给目标用户1.发现兴趣相似的用户

通常用Jaccard公式或者余弦相似度计算两个用户之间的相似度。设N(u)为用户u喜欢的物品集合，N(v)为用户v喜欢的物品集合，那么u和v的相似度是多少呢：

Jaccard公式：

余弦相似度：

假设目前共有4个用户：A、B、C、D；共有5个物品：a、b、c、d、e。用户与物品的关系（用户喜欢物品）如下图所示：

如何一下子计算所有用户之间的相似度呢？为计算方便，通常首先需要建立“物品—用户”的倒排表，如下图所示：

然后对于每个物品，喜欢他的用户，两两之间相同物品加1。例如喜欢物品a的用户有A和B，那么在矩阵中他们两两加1。如下图所示：

计算用户两两之间的相似度，上面的矩阵仅仅代表的是公式的分子部分。以余弦相似度为例，对上图进行进一步计算：

到此，计算用户相似度就大功告成，可以很直观的找到与目标用户兴趣较相似的用户。

2.推荐物品

首先需要从矩阵中找出与目标用户u最相似的K个用户，用集合S(u,K)表示，将S中用户喜欢的物品全部提取出来，并去除u已经喜欢的物品。对于每个候选物品i，用户u对它感兴趣的程度用如下公式计算：

其中rvi表示用户v对i的喜欢程度，在本例中都是为1，在一些需要用户给予评分的推荐系统中，则要代入用户评分。

举个例子，假设我们要给A推荐物品，选取K=3个相似用户，相似用户则是：B、C、D，那么他们喜欢过并且A没有喜欢过的物品有：c、e，那么分别计算p(A,c)和p(A,e)：

看样子用户A对c和e的喜欢程度可能是一样的，在真实的推荐系统中，只要按得分排序，取前几个物品就可以了。

园友推荐

1.计算10名与我兴趣最相似的园友

2.计算对推荐园友的兴趣度

这10名相似用户一共推荐了25名园友，计算得到兴趣度并排序：

排序昵称兴趣度1wolfy0.3730019232961262Artech0.3405026123034993CatChen0.3405026123034994WXWinter(冬)0.3405026123034995DanielWise0.3405026123034996一路前行0.315244162495647LiamWang0.315244162495648usharei0.315244162495649CoderZh0.3152441624956410博客园团队0.3152441624956411深蓝色右手0.3152441624956412Kinglee0.3152441624956413Gnie0.3152441624956414riccc0.3152441624956415Braincol0.3152441624956416滴答的雨0.3152441624956417DennisGao0.3152441624956418刘冬.NET0.3152441624956419李永京0.3152441624956420浪端之渡鸟0.3152441624956421李涛0.3152441624956422阿不0.3152441624956423JK_Rush0.3152441624956424xiaotie0.3152441624956425Leepy0.312771621085612

只需要按需要取相似度排名前10名就可以了，不过看起来整个列表的推荐质量都还不错！

THE END

干货基于用户的协同过滤推荐算法原理和实现余弦

干货基于用户的协同过滤推荐算法原理和实现余弦

python协同过滤算法coding

协同过滤算法

python协同过滤算法怎么实现问答

基于时间衰减的协同过滤推荐算法

协同过滤算法GuFeiyang

新闻推荐算法的问题及优化策略