推荐策略产品经理必读系列—第三讲推荐系统的召回(一)

目前市场上所有的召回方法都可以归纳为3大类。如下图所示:

基于规则是最常用的召回策略,也是解释性最强的召回策略。常见的规则召回策略有:基于内容标签的召回,基于商品销量或者内容热度的召回,召回历史高点击率的物料,召回平台评价&质量分比较高的物料,召回用户经常购买的一些商品或者常看的物料;Part2将会针对这一部分详细展开介绍。

此种策略的优缺点:

协同过滤的召回算法可以说是推荐系统最经典的算法了,甚至可以说有了协同过滤算法才真正代表了推荐系统的诞生。协同过滤算法最经典的是以下两个算法:

I2I(Item-CF):

用户A喜欢的物料a,为用户A推荐和物料a比较相似的物料b;该算法的核心问题是如何计算物料a和其他物料b,c,d,e......的相似度;该算法最早起源于电商巨头亚马逊。

U2U(User-CF):

用户A和用户B很相似,为用户A推荐用户B感兴趣且用户A之前没有接触过的物料a,因为二者是相似的,所以我们认为用户B感兴趣的物料用户A也会感兴趣;该算法的核心是如何计算用户与用户之间的相似度。

其实无论是基于规则的召回,还是协同过滤算法。我们都是通过一定规则或者方法去计算物料与物料之间的相似度,用户与用户之间的相似度。协同过滤算法里面更多是一种基于统计维度的,而随着算法进步我们引入一种新的思想。基于向量去计算相似度。

上述模型我们会在后续专门介绍向量召回的篇章中进行详细介绍。

下面重点详细为大家介绍基于规则召回里常见的一些召回思路。

标签召回:推荐算法1.0时代都是基于内容的推荐,而基于内容的推荐基本上都是通过标签相似度来进行推荐。尤其是在电影&音乐网站上。比如你看过标签为“武侠”、“爱情”的电影,系统会基于这个标签给你召回相同标签的物料。

基于标签的召回核心是怎么给内容打标签,标签体系如何构建,这里面有大量的人工工作和业务经验。

热销召回:热销召回在电商领域比较多,基于商品的销量召回一些大家都比较喜欢,销量高的商品。这种召回策略应对冷启用户特别好用。同时扩展到内容领域逻辑也是一样,只是这里的“热销”可以换成“热度”。把销量的因素换成比如观看次数等等。

高点击率商品召回:推荐系统核心还是要不断提升场景里面的点击率,所以我们在召回时就需要有专门的路去召回那些历史物料中点击率比较高的商品。当然这一路需要和其他路进行融合,不然会造成非常强的马太效应。这里继续抛一个问题:点击率的统计周期多久的比较合适?

高质量分的物料:此类物料是最适合用于冷启,在电商领域当一个新的用户访问系统不知道为他推荐什么商品时,我们可以为他推荐历史评价、销量、收藏、点赞等都反响比较好的商品。我们会对商品综合考虑上述因素计算一个商品的质量分,然后为其推荐排名TopK的商品。

复购的物料:这一路在生鲜电商里面经常用,很多用户每天买的蔬菜肉类都比较相似,所以推荐系统会专门有一路召回为用户推荐他历史购买过的商品。但是复购这一路召回在综合性电商里基本不用,比如淘宝&京东?大家可以思考一下为什么?

以上就是为大家整体介绍了推荐系统召回的主流思想,本篇重点介绍基于规则的召回。下面两篇分别详细介绍基于协同过滤的召回和基于向量的召回,敬请期待。

THE END
1.基于协同过滤算法的推荐系统推荐系统有着广泛的应用,电影推荐,商品推荐等都用到推荐系统。本文介绍协同过滤算法的基本原理,进而理解推荐系统的实现原理。 推荐系统的描述 我们以电影推荐系统来看一下怎么样以机器学习的角度来描述推荐系统。我们记 $n_u$ 为用户的数量,$n_m$ 为电影的数量,$r(i,j) = 1$ 表示用户 j 对电影 i 进行过...https://www.jianshu.com/p/9b06ef8c79fa
2.基于协同过滤算法图书推荐系统的设计与实现.pdf论文题目:基于协同过滤算法的图书推荐系统的 设计与实现 摘要 随着网络和信息技术的飞速发展,电子图书资源的数量也在以惊人的速度增 长,越来越多的用户通过图书购买网站购买图书或在图书阅读网站上阅读电子书, 不管是网上购书还是网上读书都会面临一个相同的问题,如何从海量的图书资源 ...https://max.book118.com/html/2024/0217/7053136045006042.shtm
3.基于内容与PTUI协同过滤算法的个性化学习系统基于内容与PTUI协同过滤算法的个性化学习系统 项目类型: 创新训练项目 所属学校: 南昌工程学院 项目期限: 一年期(2022-05 至 2023-05) 所属一级学科: 工学 所属二级学科: 计算机类 立项时间: 2022-06-30 结题时间: 2023-11-16 项目成员: 姓名专业班级所在学院项目中的分工成员类型 ...http://jxdc.jxedu.gov.cn/cxcypt/Index/ItemDetail/e6051e10-240f-4ab7-992d-269eb49cb410
4.基于流形近邻的协同过滤算法AET关键词: 流形近邻;距离空间;协同过滤;视觉距离;最小最大距离;推荐系统 0引言 协同过滤是Web 3.0时代一个新颖的技术,被广泛应用于各类电子商务网站。通常协同过滤算法分为两大类:基于内存的协同过滤算法和基于模型的协同过滤算法[1]。基于内存的算法[2]首先找到k个近邻,然后根据近邻进行推荐。基于模型的算法[3 5]...http://www.chinaaet.com/article/3000016485
1.基于协同过滤算法的绿色食品推荐系统(10075)Java毕业设计基于ssm协同过滤算法的绿色食品推荐系统 q_1262330535的博客 1087 系统的开发离不开前期的需求分析,这个阶段就是让程序员知道自己该做什么事情,在进行需求分析的时候,着重点就是用户对系统的功能要求,这个阶段要是分析得很到位,系统开发出来投入使用时,用户就会发现系统的功能跟用户需求保持一致,程序稳定...https://blog.csdn.net/m0_72438098/article/details/143813340
2.基于协同过滤算法的论文推荐系统研究与设计基于上述问题,本文设计了一个论文推送系统。改进了传统基于用户的协同过滤算法,在计算用户与用户之间的相似度时加权融合了用户点击和搜索词的相似度,并且计算点击得分的时候会对点击文章的时间做衰减处理,进而更加精准地召回近邻用户。通过实验,本文选取多样性和准确率这两个指标来对本文所提出的论文推荐算法进行评价。https://cdmd.cnki.com.cn/Article/CDMD-10488-1018203115.htm
3.基于协同过滤算法的安规考核系统试题推荐方法研究本文主要完成了以下内容:1.研究了基于用户的协同过滤算法和基于物品的协同过滤算法,比较两者在不同推荐系统中的应用情况,比较其优缺点。结合安规考核系统的实际情况采用基于物品的协同过滤算法实现本课题的研究,根据需求在数据库中设计用于保存用户-物品评分矩阵和物品-物品相似度矩阵的数据表。2.学习中文分词技术,收集...https://wap.cnki.net/touch/web/Dissertation/Article/10079-1019233359.nh.html
4.推荐系统算法实战协同过滤CF算法(CollaborativeFiltering...协同过滤推荐(Collaborative Filtering Recommendation)。 仅仅基于用户行为数据设计的推荐算法一般称为协同过滤算法。学术界对协同过滤算法 进行了深入研究,提出了很多方法,比如基于邻域的方法(neighborhood-based)、隐语义模型 (latent factor model)、基于图的随机游走算法(random walk on graph)等。在这些方法中, 最著名...https://blog.51cto.com/u_15236724/5968286
5.从零开始学推荐系统一:基于邻域的算法腾讯云开发者社区本系列文章会从最简单的推荐系统到目前主流的推荐系统解决方案做总结。 1. 基于邻域的算法 基于邻域的算法是推荐系统中最基本的算法,在业界得到了广泛应用。基于邻域的算法分为两大类,一类是基于用户的协同过滤算法,另一类是基于物品的协同过滤算法。 1.1 基于用户的协同过滤算法(UserCF) ...https://cloud.tencent.com/developer/article/1694686
6.相似度算法(精选十篇)1.1基于语义资源的词语相似度算法 近年来, 一些诸如同义词词林、WordNet、知网这种大规模可量化的语言本体的诞生与发展, 为进行真实文本的语义分析和理解提供了强有力的资源支持。特别是最近几年“知网”等语义资源不断丰富发展, 中文语义研究方向逐渐增多。知网作为一个知识系统, 是一个网而不是树, 它主要反映概念...https://www.360wenmi.com/f/cnkeyytvb26n.html
7.基于时间和关系感知的图协同过滤跨域序列推荐受协同过滤思想启发,针对上述问题,提出基于时间和关系感知的图协同过滤跨域序列推荐(time and relation-aware graph collaborative filtering for cross-domain sequential recommendation,TRaGCF)算法.该算法主要包括3个模块:1)为获得用户行为序列中项目间高阶复杂的时序依赖关系,提出时间感知图注意力(time-aware graph atte...https://crad.ict.ac.cn/cn/article/doi/10.7544/issn1000-1239.202110545?viewType=HTML
8.希冀基于Apriori算法的投票模式挖掘 基于Apriori算法发现毒蘑菇相似特征 FP-Growth算法 基于FP-Growth算法Twiter数据挖掘 基于FP-Growth算法新闻网站点击流挖掘 数据降维 PCA算法 基于PCA算法的半导体制造数据降维 SVD算法 基于SVD的图像压缩 推荐系统 协同过滤算法 https://www.educg.com/ai.html