推荐策略产品经理必读系列—第二讲推荐系统的架构算法top物料

编辑导语:推荐系统是如何做到向用户推荐他感兴趣的物料的,这个取决于我们的推荐系统架构。作者对推荐系统的架构进行了详细的阐析,总结了7大搭建架构环节,希望对你有所帮助。

上一篇为大家介绍了作为一个推荐策略产品必须了解的行业里发生的大事以及行业整体未来的趋势,本篇就为大家详细介绍推荐系统的架构,推荐系统是如何把我们感兴趣的物料推荐到我们面前的。

一、整体架构

将推荐系统架构里面主要的部分整体如上图,用户打开APP看到为自己推荐的物料,正常都是需要经过5-6个环节。常见的流程从建立物料索引,再到召回、粗排、精排、重排到过滤层,最终展示在了APP前段,为用户推荐了感兴趣的物料。

二、物料索引

APP里有哪些物料是可以推荐给用户,会有一个总的物料池,物料池本身存储在数据库中。同时为了查询时更加方便快捷,我们需要提前构建好物料索引。尤其是很多召回路是基于一些标签进行召回的,更加需要提前构建好倒排索引。物料的清洗和索引的构建是推荐系统的第一步基础工作。

三、召回层

构建完物料索引后,推荐系统是如何挑选出用户感兴趣的物料了。推荐算法发展到现在,我们可以称之为4.0时代。4.0时代的推荐算法都是以预估用户的点击率(CTR)为核心,基于用户对于每个物料的预估点击率(Predicted-CTR)来进行排序,按照Predicted-CTR值进行倒排。以上介绍的是最理想的方式,但是实际却无法执行也没必要。

原因一:无法实现

物料库的量级太大,比如像淘宝这种平台物料几十亿商品,如果用户的每次请求都去预估几十亿商品的Predicted-CTR,需要大量的机器资源,同时时延会非常高。大家打开淘宝首页可能需要几十个小时,且不一定能加载出来。

原因二:没有必要

几十亿的商品,有很多商品是非常冷门商品,99%以上的商品和用户毫无关联,完全没有必要如此精细化去预估用户对于几十亿商品的兴趣度。

所以推荐系统演变成先通过召回层初步筛选出用户可能感兴趣的一些物料,比如800个。然后再进入粗排和精排,其他几十亿的物料直接在召回阶段就被过滤了。这样的架构设计大大降低了推荐系统的计算压力,同时也不影响推荐系统的整体效果。

而召回阶段,市面上最先进的模式就是针对不同的用户进行分层,然后不同层级的用户使用的召回路数不一样,核心都是多路召回,每一路召回返回的物料个数以及对应的权重都是和用户本身的分层有很大关系,实现非常精细化的用户和召回路数的管理。

四、粗排层

大家可以看到召回阶段会有非常多的召回策略,那我们如何将这些各路召回的商品汇总在一起进行一个统一排序了。比如热销路的召回,召回了Top100的商品;历史高点击的召回,同样召回Top100的商品。这两路召回的商品可能还会有重叠的。

在召回层里,每一路的召回都需要将物料的分数进行归一化。比如说热销路的召回,如何召回Top100的商品,首先需要计算每一个商品的热销分数,然后取Top100的商品。历史高点击的召回路也是一样,并且每一路的分数都需要归到【0,1】之间,这样各个路之间才能比较。

同时不同场景下每一路召回的重要性也完全不一样,可以再设置一个对应的系数。比如热销路召回为0.5,历史高点击路召回为0.7,假设商品A在热销路召回分数为0.8,历史高点击路召回分数为0.3,那么最终这个商品的总召回分数为:0.5X0.8+0.7X0.3=0.61。粗排层就需要将每一个召回的商品进行上述计算方式进行处理后,汇总得到一个总的List,然后选择TopK的商品给到精排层。

五、精排层

精排层的核心任务就是预估用户对于召回层返回的TopK商品的Predicted-CTR。召回和粗排只是选择出了用户可能感兴趣的物料,但是每一个物料具体的预估CTR是多少并不知道。

精排层就需要基于用户历史点击过的物料作为正样本,曝光未点击的物料作为负样本,然后构建CTR预估模型,预估用户对于每一个物料的Predicted-CTR。在精排层核心要做的几件事情:数据清洗构建正负样本,选择合适的排序算法,构建特征工程、模型训练与效果评估。

最终基于精排模型预估出的CTR对于召回的物料再重新进行一次排序。精排模型的预估是整个推荐系统中耗时最多的,因为特征十分复杂,特征维度很多。如果针对几十亿物料全部进行CTR预估,系统直接崩溃,这也是需要先进行召回的原因。

六、重排层

那是不是精排过的物料,直接按照精排后的顺序直接展示在了APP前端了。很多时候推荐系统仍然有一些其他业务规则进行干预。比如在电商推荐系统里面,就会有以下的一些策略:

1.类目打散

对于给用户推荐的商品如果类目集中度过高,会进行一定程度的打散。比如精排模型给用户返回的前10个商品全部都是鞋子,可能该用户偏好鞋子,但前10个商品全部是鞋子此种集中度还是过高了,重排层就会将后面其他类目的商品插入到这10个商品中。具体按照类目打散的规则每家不一样,核心是基于业务场景。打散不是目的,目的是为了提升推荐系统的点击率。

2.不同类型物料混合

比如淘宝,淘宝推荐场景里面有的内容类型有:店铺、活动、直播、商品、视频等等。那这些不同类型内容之间如何进行混合。能否可以出现连续4个全部都是直播,或者4个全部都是视频。为了降低用户的审美疲劳,很多时候针对不同类型的内容推荐系统也会进行重新打散。但同样打散不是目的,目的是为了提升推荐系统的点击率。

3.全局最优

重排层还有一个核心的逻辑就是实现全局最优。精排层是预估用户对于单个物料的CTR,这是一种局部最优的思想。但是用户在浏览时正常都会一次性浏览多个,怎么样的物料组合可以实现全局最优而不是局部最优。同样4个坑位,有可能精排排序在1,3,5,7的四个物料组合比精排排序在1,2,3,4的四个物料组合整体CTR更高。

总的来说重排层是推荐系统最后一道策略和模型的调整了。

七、过滤层

重排层调整完的物料顺序还会再进行一些业务规则和策略的干预,比如电商领域会进行以下的过滤:

1.未上架过滤

当前已经上架的商品不展示在APP前端。

2.缺货过滤

当前已经缺货的商品不展示在APP前端。

包括还有同图过滤等等策略。过滤层很多时候我们会做在了粗排和精排之间,确保进入到精排的物料后续都是能够直接在APP前端展示的,这样后续的精排和重排层的价值才更高。原本重排挑选出的最优组合,结果全部在过滤层被过滤了,那么整体推荐系统的效果就会大打折扣。

八、APP前端

本文由@KingJames原创发布于人人都是产品经理。未经许可,禁止转载。

THE END
1.Kangle想要做好产品推广方案,需要做到这几点:产品定位分析 用户肖像及受众分析 媒体及推广渠道 整体规划 推广策略 活动跟进/总结 无论做什么方案,都要结合公司的实际情况,做出来的方案才能更好的落实。 做好产品定位分析在开始做推广之前,一定要对产品进行分析,对产品有一个充分的了解。比如:产品的功能、产品使用效果、与...http://wenku.kangle.im/post/172546.html
2.品牌策划框架(一篇优秀的品牌宣传方案应具备的基本框架)?一篇优秀的品牌宣传方案应具备的基本框架 【商业合作请私信沟通】 一、品牌背景介绍 1. 品牌名称:详细介绍品牌名称的来源及含义。 2. 品牌定位:明确品牌在市场中的定位,以及品牌目标受众群体。 3. 品牌历史:介绍品牌的发展历程及所获得的荣誉。 二、品牌宣传目标 ...https://www.niaogebiji.com/article-642477-1.html
1.推广方案架构.pptx推广方案架构推广目标与定位产品或服务分析推广渠道选择推广内容创意推广活动执行推广效果评估与优化01推广目标与定位通过推广活动,增加品牌曝光度,提升品牌在目标受众中的认知度。提高品牌知名度扩大市场份额提升用户满意度通过营销策略,吸引更多潜在客户,增加销售量,提高市场占有率。优化产品或服务质量,提高用户体验,促进口碑...https://m.renrendoc.com/paper/311060735.html
2.产品推广和营销方案(李国凯:产品推广策略和推广方案的基本框架)以上是产品推广策略和推广方案的基本框架,具体的实施细节会根据产品的特点、目标受众和市场环境而有所不同。建议在制定推广策略和方案时,寻求专业的市场营销人员或团队的帮助,他们能够根据您的具体情况提供更加定制化和有效的建议。 一站式网络推广是指提供全方位、综合性的网络推广服务,包括网站建设、搜索引擎优化(SEO)...https://www.chuangyear.com/archives/69698.html
3.校园奶茶店推广营销方案(通用13篇)校园奶茶店推广营销方案(通用13篇) 为确保事情或工作顺利开展,常常需要提前制定一份优秀的方案,方案是计划中内容最为复杂的一种。那要怎么制定科学的方案呢?以下是小编收集整理的校园奶茶店推广营销方案(通用13篇),欢迎大家借鉴与参考,希望对大家有所帮助。 https://www.unjs.com/fanwenku/405019.html
4.人才培养方案集锦15篇二、专业人才培养方案基本框架的设计 1.总体设计原则:职业教育的培养目标是培养生产、建设、管理、服务一线需要的高素质技能型人才。建立以能力为本位的教育模式,体现以技术应用为主体的教学特色,形成教学、生产相结合的理论教学体系和实践教学体系。以校企合作办学模式为体制基础,以产学研结合人才培养模式为平台,以专业建...https://www.ruiwen.com/fangan/7587551.html
5.校企合作方案(通用18篇)二、专业人才培养方案基本框架的设计 (一)总体设计原则。校企合作培养目标是培养生产、建设、管理、服务一线需要的高素质技能型人才。建立以能力为本位的教育模式,体现以技术应用为主体的教学特色,构成教学、生产相结合的.理论教学体系和实践教学体系。以校企合作办学模式为体制基础,以产学研结合人才培养模式为平台,以专业...https://mip.oh100.com/a/202303/6491764.html
6.会展方案策划范文8篇(全文)3、展会执行方案分析 1)对计划举办的展会的基本框架进行评估,具体包括: (1)展会名称和展会的展品范围、展会定位之间是否有冲突。 (2)办展时间、办展频率是否符合展品范围所在产业的特征。 (3)展会的举办地点是否适合举办该展品范围所在产业的展会。 (4)在展会展品范围所在产业里能否举办如此规模和定位的展会。 https://www.99xueshu.com/w/file9z367tx8.html
7.课题研究方案合集15篇1)对合格新人的基本画像(明确重视新人筛选) 2)对半年内新人培养重要性的树立(强化七留的战略意义) 研究方案之基本框架 明确课题框架(纵横交错,各三点) 纵向:(内容) 1、七留概念与意义(不同角色的基本职责和协作——培训条线、主管推荐人、新人自身) ...https://www.wenshubang.com/fangan/3226649.html
8.展会的策划书14篇2、 提出展会的基本框架:包括展会的名称和举办地点、办展机构的组成、展品范围、办展时间、办展频率、展会规模和展会定位等。 3、 展会价格及初步预算方案。 4、 展会工作人员分工计划。 5、 展会招展计划 6、 展会招商计划。 7、 展会宣传推广计划。 https://www.yjbys.com/cehuashu/3729657.html
9.展会策划方案分享展销会策划案例→MAIGOO知识2、提出展会的基本框架:包括展会的名称和举办地点、办展机构的组成、展品范围、办展时间、办展频率、展会规模和展会定位等。 3、展会价格及初步预算方案。 4、展会工作人员分工计划。 5、展会招展计划 6、展会招商计划。 7、展会宣传推广计划。 8、展会筹备进度计划。 https://www.maigoo.com/goomai/137836.html
10.电子商务网站建设包括第4~9章,内容包括HTML语言、Dreamweaver设计网页的基本操作、VBScript脚本语言和数据库基础的简要介绍,以及ASP的内置对象,最后以网上书店为例介绍了电子商务网站的设计与开发方案。 第3篇为网站安全及运营管理。包括第10~11章,介绍了电子商务网站的安全、运营与管理、电子商务网站的推广以及网站的SEO优化技术等内容...https://baike.sogou.com/v5852534.htm
11.网站建设策划书(通用15篇)(1)信息查询系统:用户登录到网站信息查询系统,进行查询考试成绩、相关证书的考试结果以及用户的个人基本信息等的查询。 (2)学生管理系统: 3.4交互性和用户友好界面设计 3.5宣传推广方案 3.6 网站技术解决方案 网站建设策划书11 一、概述 随着互联网走向千家万户,人们对餐饮娱乐的选择更趋便捷化,只要在搜索引擎里轻轻一...https://www.9136.com/shiyongwendang/cehuashu/249240.html
12.如何写好一份策划案,5个万能方法!无论是做活动还是品牌推广、营销策划,都离不开一份最基本的策划案。 如何写好一份策划案是一个活动/推广顺利进行的前提,也是整个项目的核心。那么如何快速写好一份策划方案呢?本篇文章将结合BoardMix博思在线白板向大家介绍一种万能策划案模板,抓住策划方案的四个重点框架,快速输出一份优质策划案!以下内容整理来自抖...https://boardmix.cn/article/planningcasetemplate/
13.营销策划的基本框架(精选8篇)篇6:课题方案的基本框架 一、问题的提出(目的意义) 这部分主要要说明研究课题的设想从何而来,即选题的来源和背景,研究要达到的目的以及历史和现实的意义。这是研究方案设计和研究过程的宗旨所在。问题的提出应包含以下几方面的内容。 (一)选题论证,即课题的理论价值和实践意义。 https://www.360wenmi.com/f/filee6ktk313.html
14.我国生态保护补偿机制将全面铺开中工旅行2019年伊始,自然资源部、国家发改委等9部门联合印发《建立市场化、多元化生态保护补偿机制行动计划》(以下简称《行动计划》),明确了推进时间表和路线图,生态保护补偿机制政策框架基本建立并不断完善。近期,天津、湖南、重庆等多地生态保护补偿机制方案也在加速落地,加大补偿力度、完善补偿机制、提升长效机制成为着力点。https://www.workercn.cn/32883/201902/14/190214094541557.shtml