机器学习:详解基于物品协同过滤(Itembased)的推荐算法

基于物品的协同过滤(item-basedcollaborativefiltering)算法是目前业界应用最多的算法。无论是亚马逊网,还是Netflix、Hulu、YouTube,其推荐算法的基础都是该算法。

Item-based算法会给用户推荐那些和他们之前喜欢的物品相类似的物品。如图所示,比如你之前购买过《C++Primer中文版》和《编程之美》,那么它会给你推荐《C++编程思想》或者《编程珠玑》。不过,Item-based算法并不利用物品的内容属性计算物品之间的相似度,它主要通过分析用户的行为记录计算物品之间的相似度。该算法认为,物品A和物品B具有很大的相似度是因为喜欢物品A的用户大都也喜欢物品B。

详细流程

相似度计算:计算物品的相似度;

构建推荐矩阵:根据物品的相似度和用户的历史行为给用户生成推荐列表。

1.相似度计算

i是用户已偏好的物品,j是目标物品,简单的物品相似度公式(1)可以这样计算:

这里,分母|N(i)|是喜欢物品i的用户数,而分子|N(i)∩N(j)|是同时喜欢物品i和物品j的用户数,所以该公式也可以理解为喜欢物品i的用户中有多少比例也喜欢物品j。

这里面有个假设,就是每个用户的兴趣都局限在某几个方面。如果用户之间的兴趣广泛且不相交,那么即使存在同时喜欢物品i和物品j的用户数多,那也不能代表物品i和物品j的相似度大,因为很可能两种物品所属领域非常不同。

2.构建推荐矩阵

下图为同时购买两种物品的次数:

其中对物品a计算相似度如下:

同理可求得相似度矩阵:

在得到物品之间的相似度后,Item算法通过如下公式计算用户u对一个物品j的兴趣:

这里N(u)是用户喜欢的物品的集合,S(j,K)是和物品j最相似的K个物品的集合,w_ji是物品j和i的相似度,r_ui是用户u对物品i的兴趣。(对于隐反馈数据集,如果用户u对物品i有过行为,即可令r_ui=1。)

该公式的含义是,和用户历史上感兴趣的物品越相似的物品,越有可能在用户的推荐列表中获得比较高的排名。

假设我们现在有用户v,他的偏好为:

所以u最终的推荐列表为[b,c,e]。

优缺点

Item-based算法原理是给用户推荐那些和他之前喜欢的物品类似的物品,在推荐方面更加个性化,反映了用户自己的兴趣传承。在用户有新行为时,一定会导致推荐结果的实时变化。

适用范围:长尾物品丰富,用户个性化需求强烈的领域。

优点:可以利用用户的历史行为给用户做推荐解释,可以令用户比较信服。比较适用在物品较少、物品更新速度不会很快、用户的兴趣比较固定和持久的情况下。

THE END
1.推荐算法——基于物品的协同过滤算法基于用户的协同过滤算法在用户增长的时候,相似度计算的计算会越来越困难。基于物品的算法给用户推荐他们之前喜欢的物品相似的物品。 算法步骤 计算物品之间的相似度 根据物品的相似度和用户的历史行为给用户生成推荐列表 相似度公式如下: wij=|N(i)∩N(j)||N(i)||N(j)|?...https://www.imooc.com/article/27099
2.协同过滤算法深入解析:构建智能推荐系统的核心技术然而,协同过滤算法也存在一些局限性。例如,冷启动问题(Cold Start Problem),当新用户或新物品加入系统时,由于缺乏足够的评分数据,协同过滤算法难以准确地推荐相关物品。此外,数据稀疏性(Data Sparsity)也是协同过滤算法面临的一个挑战,由于用户-物品评分矩阵中大部分元素都是缺失值,这可能导致预测准确性较低。 https://developer.aliyun.com/article/1267365
3.通过社交网络关系的图卷积协同过滤实现的产品推荐方法它是一种轻量级的gcn网络构建模型,它舍弃了传统gcn的特征变换和非线性 激活,并通过实验验证了这两种操作对协同过滤是无效的。lightgcn通过在用户-物品交互矩阵 上进行线性传播来学习用户和物品的嵌入,最后将所有层学习到的嵌入的加权和作为最终嵌入。 lightgcn的提出虽然解决了上述方法存在的问题,但是它只限于处理用户-...https://www.xjishu.com/zhuanli/55/202111235556.html
1.基于物品的协同过滤算法(ItemCF)原理以及代码实践从前面的讨论可以看到,在协同过滤中两个物品产生相似度是因为它们共同出现在很多用户的兴趣列表中。换句话说,每个用户的兴趣列表都对物品的相似度产生贡献。那么是不是每个用户的贡献都相同呢? 假设有这么一个用户,他是开书店的,并且买了当当网上80%的书准备用来自己卖。那么他的购物车里包含当当网80%的书。假设当...https://blog.csdn.net/a15835774652/article/details/136583397
2.从原理到落地,七大维度读懂协同过滤推荐算法上面一节简单介绍了协同过滤的思想,基于协同过滤的两种推荐算法,核心思想是很朴素的”物以类聚、人以群分“的思想。所谓物以类聚,就是计算出每个标的物最相似的标的物列表,我们就可以为用户推荐用户喜欢的标的物相似的标的物,这就是基于物品(标的物)的协同过滤。所谓人以群分,就是我们可以将与该用户相似的用户喜...https://cloud.tencent.com/developer/article/1487831
3.第二章:基于物品(模型)的协同过滤基于物品的协同过滤又称为基于模型的协同过滤,不需要保存所有的数据,而是通过构建一个物品相似度模型来获取结果。 修正的余弦相似度 我们使用余弦相似度来计算两个物品的距离。考虑到“分数膨胀”现象,我们会从用户的评价中减去他所有评价的均值,获得修正的余弦相似度。 s(i, j) 表示物品 i 和 j 的相似度,分子...https://www.jianshu.com/p/74adaf07fa14
4.改进的基于物品的协同过滤推荐算法协同过滤物品相似度用户-物品评分矩阵准确率 分类号: TP399(计算技术、计算机技术) 资助基金: 国家自然科学基金(61702368)国家自然科学基金(61170174)国家自然科学基金(91646117)天津市自然科学基金(17JCYBJC15200)天津市自然科学基金(15JCYBJC46500)国家科技重大专项(15ZXZNCX00050) ...https://d.wanfangdata.com.cn/periodical/tjlgxyxb201901006
5.GitHub一个基于SSM框架与物品的协同过滤算法(ItemCF)的简单电子书推荐系统. Contribute to Sicmatr1x/EMAN development by creating an account on GitHub.https://github.com/Sicmatr1x/EMAN/
6.系列学习——推荐算法综述基于物品的协同过滤和基于用户的协同过滤相似,它使用所有用户对物品或者信息的偏好(评分),发现物品和物品之间的相似度,然后根据用户的历史偏好信息,将类似的物品推荐给用户。基于物品的协同过滤可以看作是关联规则推荐的一种退化,但由于协同过滤更多考虑了用户的实际评分,并且只是计算相似度而非寻找频繁集,因此可以认为基...https://maimai.cn/article/detail?fid=242703356&efid=xCTosL0-evQLVNwAlACgEw
7.推荐系统系列之推荐系统概览(上)亚马逊AWS官方博客本质上是矩阵补全的思路,也正是因为基于矩阵的处理,只要用户或者Item有变化,甚至action有变化,可能需要重新计算或者重新训练(业界当前有一些方法做增量协同过滤或者近实时协同过滤)。基于协同过滤的召回策略,细分为如下三种方式:基于用户的协同过滤/UserCF;基于物品的协同过滤/ItemCF;基于模型的协同过滤。http://aws.amazon.com/cn/blogs/china/recommended-system-overview-of-recommended-system-series-part-1/
8.机器学习推荐算法之协同过滤(基于物品)案例+代码机器学习推荐算法之协同过滤(基于物品)【案例+代码】,目录协同过滤算法(基于物品)案例解说总结代码实操每文一语协同过滤算法(基于物品)基于用户的协https://blog.51cto.com/u_15172991/5428305
9.PythonDjango网页界面协同过滤推荐算法实现商品管理与推荐python这种算法通常分为两类:基于用户的协同过滤和基于物品的协同过滤。 基于用户的协同过滤:这种方法首先找出与目标用户兴趣相似的其他用户,然后根据这些相似用户的喜好来推荐物品给目标用户。 基于物品的协同过滤:与之相反,这种方法先找出与目标物品相似的其他物品,然后把这些物品推荐给那些喜欢目标物品的用户。 现在,让我们...https://www.jb51.net/python/305546cjo.htm