推荐策略产品经理必读系列—第三讲推荐系统的召回(一)算法top物料

编辑导语:推荐系统的7大环节中,其中非常核心的一环是召回,推荐系统中的召回策略是怎样的呢?本文重点介绍基于规则的召回,希望对你有所启发。

一、主流的召回方法

目前市场上所有的召回方法都可以归纳为3大类。如下图所示:

1.1基于规则的召回

基于规则是最常用的召回策略,也是解释性最强的召回策略。常见的规则召回策略有:基于内容标签的召回,基于商品销量或者内容热度的召回,召回历史高点击率的物料,召回平台评价&质量分比较高的物料,召回用户经常购买的一些商品或者常看的物料;Part2将会针对这一部分详细展开介绍。

此种策略的优缺点:

优点:策略逻辑清晰明了,业务意义明确,可解释性极强;缺点:个性化弱,千人一面,为每个用户推荐的商品比较类似。同时容易引起马太效应,头部的物料得到越来越多的曝光机会,尾部的物料曝光机会越来越少。1.2协同过滤

协同过滤的召回算法可以说是推荐系统最经典的算法了,甚至可以说有了协同过滤算法才真正代表了推荐系统的诞生。协同过滤算法最经典的是以下两个算法:

I2I(Item-CF):

用户A喜欢的物料a,为用户A推荐和物料a比较相似的物料b;该算法的核心问题是如何计算物料a和其他物料b,c,d,e……的相似度;该算法最早起源于电商巨头亚马逊。

U2U(User-CF):

用户A和用户B很相似,为用户A推荐用户B感兴趣且用户A之前没有接触过的物料a,因为二者是相似的,所以我们认为用户B感兴趣的物料用户A也会感兴趣;该算法的核心是如何计算用户与用户之间的相似度。

其实无论是基于规则的召回,还是协同过滤算法。我们都是通过一定规则或者方法去计算物料与物料之间的相似度,用户与用户之间的相似度。协同过滤算法里面更多是一种基于统计维度的,而随着算法进步我们引入一种新的思想。基于向量去计算相似度。

FM:FactorMachine-因子分解机,是在2010年由谷歌推荐系统的大佬SteffenRendle提出的。核心思想是通过对两两特征组合,引入交叉项特征;其次是通过引入隐向量(对参数矩阵进行矩阵分解),降低模型的高维灾难,完成对特征的参数估计;DSSM:DeepStructuredSemanticModels,深度语义匹配模型,微软于2016年提出,又叫“双塔模型”。分别构建用户的userembedding和物料的itemembedding,所以称为双塔。核心思想还是通过Embedding分别去表达User和Item的特征,然后再计算相似度。

优点:特征理解更加深刻,模型效果更优。缺点:模型可解释性差。

上述模型我们会在后续专门介绍向量召回的篇章中进行详细介绍。

二、基于规则的召回

下面重点详细为大家介绍基于规则召回里常见的一些召回思路。

2.1标签召回

标签召回:推荐算法1.0时代都是基于内容的推荐,而基于内容的推荐基本上都是通过标签相似度来进行推荐。尤其是在电影&音乐网站上。比如你看过标签为“武侠”、“爱情”的电影,系统会基于这个标签给你召回相同标签的物料。

基于标签的召回核心是怎么给内容打标签,标签体系如何构建,这里面有大量的人工工作和业务经验。

2.2TopSale

热销召回:热销召回在电商领域比较多,基于商品的销量召回一些大家都比较喜欢,销量高的商品。这种召回策略应对冷启用户特别好用。同时扩展到内容领域逻辑也是一样,只是这里的“热销”可以换成“热度”。把销量的因素换成比如观看次数等等。

2.3TopCTR

高点击率商品召回:推荐系统核心还是要不断提升场景里面的点击率,所以我们在召回时就需要有专门的路去召回那些历史物料中点击率比较高的商品。当然这一路需要和其他路进行融合,不然会造成非常强的马太效应。这里继续抛一个问题:点击率的统计周期多久的比较合适?

2.4TopQuality

高质量分的物料:此类物料是最适合用于冷启,在电商领域当一个新的用户访问系统不知道为他推荐什么商品时,我们可以为他推荐历史评价、销量、收藏、点赞等都反响比较好的商品。我们会对商品综合考虑上述因素计算一个商品的质量分,然后为其推荐排名TopK的商品。

2.5Rebuy

复购的物料:这一路在生鲜电商里面经常用,很多用户每天买的蔬菜肉类都比较相似,所以推荐系统会专门有一路召回为用户推荐他历史购买过的商品。但是复购这一路召回在综合性电商里基本不用,比如淘宝&京东?大家可以思考一下为什么?

以上就是为大家整体介绍了推荐系统召回的主流思想,本篇重点介绍基于规则的召回。下面两篇分别详细介绍基于协同过滤的召回和基于向量的召回,敬请期待。

本文由@KingJames原创发布于人人都是产品经理。未经许可,禁止转载。

THE END
1.人工智能基础与应用宋楚平课后习题答案(30页)A.提高数据处理速度 B.节省存储空间 C.方便算法计算 D.形成商品交易矩阵 二、亮一亮 1.协同过滤推荐与关联规则推荐的区别是什么?他们各自适用在哪些场合?参考答案:协同过滤 (Collaborative filtering),是指通过收集群体用户的偏好信息,自动化预测(过滤)个体用户可能感兴趣的内容。协同过滤基于如下基本假设:如果一个人...https://max.book118.com/html/2021/0824/8011073132003137.shtm
2.大数据时代试题综合题库7)在云生态环境中,用户需求相当于( 14 ),云数据中心相当于 ( 15 ),云服务相当于( 16 )。DCB A. 降水 B. 水滴 C. 水库 D. 阳光 8)尿布啤酒是大数据分析的( 17 )C A. A/B测试 B. 分类 C. 关联规则挖掘 D. 数据聚类 9)在GAPMINDER的Wealth & Health of Nations 中,中国在什么区域 ...https://www.360docs.net/doc/73fa81e4580102020740be1e650e52ea5418ce51.html
3.什么是智能推荐?智能推荐的原理是什么?4、基于关联规则的推荐 在电商领域应用较为广泛的另一种推荐算法是基于关联规则的推荐,从本质上讲它类似于协同过滤算法,只是它协同的是用户自己的购买记录。典型的故事是啤酒与尿不湿的故事,虽然该故事的来源已无从考究,但却是目前大众认知度最高的一个数据带来的收益的案例。故事的内容是:北美的超市经营者经过数据...https://www.niaogebiji.com/article-106383-1.html
4.智能4. 在《电力行业信息安全等级保护管理办法》中,电力信息系统建设过程中,运营、使用单位应当按照()等标准建设符合该等级要求的信息安全设施。 《计算机信息系统安全保护等级划分准则》 《信息安全技术信息系统安全等级保护基本要求》 《电力行业信息系统安全等级保护基本要求》 以上都是 5. ()是正确的IEC-60870-5-104报...https://www.wjx.cn/vm/tCqAK8U.aspx
5.融合用户属性信息的冷启动推荐算法AET(2)ut1~ut16(不同程度的新用户,见图2、图3):在用户评分极少的情形下,FP的性能显著优于另外两种算法;随着用户评分的增多,FP和simon的MF分解性能趋近。这表明,FP在适用于新用户冷启动的同时,能平稳地过渡到老用户暖启动的情形。 4 总结 本文提出了一种融合用户属性信息进行推荐的算法,提高了新用户情形下推荐预...http://www.chinaaet.com/article/3000073409
6....B.基于关联规则的推荐算法C.基于协同过滤的推荐算法D...应用范围最为广泛的推荐算法是()。 A. 基于内容的推荐算法 B. 基于关联规则的推荐算法 C. 基于协同过滤的推荐算法 D. 基于知识的推荐算法https://m.ppkao.com/wangke/daan/ee5458518f084048bdc7b0c32bd06f73
7.推荐系统专题单域推荐系统模型汇总(召回与排序算法)这里介绍的模型就是一些排序模型。简单来说,就是将问题转化为CTR预测任务,以概率来对需要推荐不同的商品进行排序。 以下资料是根据参考资料的浓缩摘抄,只针对我个人以后的温故知新,想了解详细细节可以看原论文与相关资料。 1. 协同算法测试 1.1 基于用户的协同过滤(UserCF) ...https://developer.aliyun.com/article/1077908
1.推荐系统前深度学习时代推荐算法(1):协同过滤(CF)混合推荐:结合了多种推荐方法(例如,协同过滤、基于内容的推荐等),以弥补单一推荐方法的不足。 ( 协同过滤推荐 和 基于内容的推荐 两者最明显的区别:它们所需的数据不同,最终的推荐效果也会因为用作推荐的依据不同而导致推荐的效果相差异,各自有各自的适用场景) ...https://blog.csdn.net/qq_58872188/article/details/143798469
2.BAT机器学习面试1000题系列11.为什么XGBoost要用泰勒展开,优势在哪里? @AntZ:XGBoost使用了一阶和二阶偏导, 二阶导数有利于梯度下降的更快更准. 使用泰勒展开取得二阶倒数形式, 可以在不选定损失函数具体形式的情况下用于算法优化分析.本质上也就把损失函数的选取和模型算法优化/参数选择分开了. 这种去耦合增加了XGBoost的适用性。 https://www.pianshen.com/article/156894578/
3.10月2011CWYAlpha如,在线购物中的商品推荐,热门网站的推荐,以及帮助人们寻找音乐和影片的应用。可以使用许多不同的方法来搜集兴趣偏好,如购买物品、评价信息。推荐系统的方法,主要有三种,基于关联规则,基于内容(匹配),基于协同过滤。本文主要介绍的是协同过滤方法,而这种方法也是目前非常流行的方法。https://cwyalpha.wordpress.com/2011/10/
4.R语言实现关联规则与推荐算法(学习笔记)腾讯云开发者社区所以三个指标的基本用法:冲销量、KPI会重点关注置信度大的;随机推荐用提升度。 2、网商时代关联规则背弃长尾效应 在实际案例运用过程中关联规则与协同过滤的区别在于, 关联规则推荐的是本来就很热门的产品,因为代表同时发生频率越高,关联性越强。在网商时代会背弃长尾效应,让差异扩大,2/8定律会一定程度上扩充至1/9...https://cloud.tencent.com/developer/article/1435768
5.基于关联规则和协同过滤的推荐算法研究与应用[4]王颖,王欣,唐万梅.融合用户自然最近邻的协同过滤推荐算法[J].计算机工程与应用.2018,(7).DOI:10.3778/j.issn.1002-8331.1702-0031. [5]周凯,顾洪博,李爱国.基于关联规则挖掘Apriori算法的改进算法[J].陕西理工大学学报(自然科学版).2018,(5).DOI:10.3969/j.issn.1673-2944.2018.05.008. ...https://d.wanfangdata.com.cn/thesis/D02162504
6.数据分析中的关联规则算法有哪些基于模式增长的关联规则算法的优点是:不需要多次扫描数据集和产生候选项集;缺点是:无法处理过大的数据集,而且对于包含大量冗余信息的数据集,生成的频繁项集和强关联规则可能非常庞大。 六、COFI算法 COFI算法是一种基于协同过滤的关联规则挖掘算法。它通过分析用户之间的相似度和商品之间的关系来挖掘频繁项集和强关联规...https://www.linkflowtech.com/news/1083
7.四步搞明白智能推荐的底层逻辑图4 AI技术 推荐算法包括基于内容推荐、基于协同过滤推荐、基于关联规则推荐、基于效用推荐、基于知识推荐等,如图5所示。在金融产品智能推荐应用中,推荐算法主要体现在以下几个方面。 图5 推荐算法类型 1)基于内容推荐算法。基于内容推荐算法是建立在贷款产品的内容基础上做出推断,即用机器学习的方法,从关于内容的特征描...https://www.51cto.com/article/702517.html
8.基于协同过滤及关联规则的个性化图书推荐基于协同过滤及关联规则的个性化图书推荐,协同过滤,TOP-N,属性特征,关联规则,相似度,目前高校图书馆的图书种类繁多,数量庞大,面对海量的图书信息资源,一方面学生需要花费大量的时间和精力来获取需要的图书,另一方面...https://wap.cnki.net/lunwen-1018063295.nh.html
9.机器学习推荐算法原理入门及算法介绍消费金融风控联盟5)基于人口统计信息的推荐:这一类是最简单的推荐算法了,它只是简单的根据系统用户的基本信息发现用户的相关程度,然后进行推荐,目前在大型系统中已经较少使用。 下面我们介绍两种主要的推荐算法:协同过滤和关联规则。 01 关联规则(AR) 概述 关联规则(Association Rules)是反映一个事物与其他事物之间的相互依存性和关联性...https://www.shangyexinzhi.com/article/7331518.html
10.基于改进RFM模型的直播平台用户细分及个性化推荐方法研究目前,主流算法大致可分为基于内容,协同 过滤,知识,关联规则,组合推荐这五种类别.其中,协同过滤推荐算法(CFR)是一种基于已知一组 用户的偏好去预测其他用户未知偏好的算法[2].该类 算法于1992年被首次提出[3],Breese等将其分成基于 记忆(memory-based)和基于模型(model-based) 37 竞争情报 两大类[4].根据比较...http://ci1st.istis.sh.cn/CN/PDF/954
11.留学推荐信推荐理由(精选6篇)三、电子商务推荐技术 目前,电子商务推荐系统中使用的主要推荐技术有基于内容推荐,协同过滤推荐,基于知识推荐,基于效用推荐,基于关联规则推荐,混合推荐等等。 1. 基于内容的推荐。 它是信息过滤技术的延续与发展,项目或对象通过相关特征的属性来定义,系统基于商品信息,包括商品的属性及商品之间的相关性和客户的喜好来向...https://www.360wenmi.com/f/filewe6wajr9.html