深度学习在计算广告中的应用随着机器学习特别是深度学习的不断发展,其广泛应用于计算广告投放流程的各个阶段。笔者最近对深度

2019年阿里巴巴推荐团队发表的论文《SDM:SequentialDeepMatchingModelforOnlineLarge-scaleRecommenderSystem》提出了SDM(SequentialDeepMatchingModel)算法,其在双塔模型的基础上,引入用户行为序列,挖掘其中长、短期兴趣信息,并融合得到用户兴趣表征,从而能够通过用户历史行为进行更加个性化的推荐。

损失函数使用交叉熵损失函数:

2019年阿里巴巴天猫团队发表的论文《Multi-InterestNetworkwithDynamicRoutingforRecommendationatTmall》提出了MIND(Multi-InterestNetworkwithDynamicrouting)算法,设计了多兴趣抽取层(Multi-InterestExtractorLayer),通过动态路由(DynamicRouting),自适应地聚合用户历史行为生成用户兴趣表征,将用户历史行为划分为多个聚类,每类的用户历史行为被转化为表征用于表示用户的某一类兴趣,因此,对于一个用户,MIND会输出多个用户表征,用于表达用户多样化的兴趣。

MIND的任务之二是将召回的目标商品的特征通过商品塔转化为商品表征:

《LearningTree-basedDeepModelforRecommenderSystems》是阿里妈妈算法团队于2018年发表的一篇论文,其中提出了TDM,创新性地将树结构索引和深度神经网络结合,在推荐系统召回阶段,通过树结构索引实现海量商品的快速检索和高效剪枝。

论文中还提到,召回过程中实际并不需要计算出概率真实值,只需要计算出各节点概率的相对大小即可,因此论文使用用户和商品交互这类隐式反馈作为样本,使用一个深度神经网络进行训练,用作各节点的分类器,即全局所有分类器共用一个深度神经网络。

对于树的构建和模型训练,论文的整体方案是,先采用一定的方法初始化树,再按以下的步骤循环多次:

最终得到线上服务使用的深度神经网络和树结构。

TDM方案存在以下不足:一是索引和模型的联合训练比较耗计算资源,二是树结构索引中的每个非叶子节点并不表示具体的某个商品(仅每个叶子节点表示具体的某个商品),因此在模型中,节点特征无法使用商品信息。而NANN解决了上述的两个不足:一是在模型训练和图搜索上进行优化减少计算量,二是图中的节点均表示具体商品,可以充分使用商品信息。

NANN的模型结构如下图所示:

对于图的构建,论文直接使用了HNSW算法,并使用商品向量的L2距离作为距离度量。基于HNSW算法进行分层遍历,如下所示:

多任务学习、多场景学习的主要区别如图25所示,多任务学习是对同一样本数据集的多个不同类型的任务进行联合学习,而多场景学习是对多个不同场景样本数据集的同一类任务进行联合学习。

在DeepGSP机制下,强化学习涉及的状态、动作和奖励定义如下:

2018年发表的论文《BudgetConstrainedBiddingbyModel-freeReinforcementLearninginDisplayAdvertising》提出了基于无模型强化学习的自动出价。

这里的无模型是指不对环境进行建模、不直接计算状态转移概率,智能体只能和环境进行交互,通过采样得到的数据进行学习,这类学习方法统称为无模型的强化学习(Model-freeReinforcementLearning)。无模型的强化学习又可以分为基于价值和基于策略的算法,基于价值的算法主要是学习价值函数,然后根据价值函数导出一个策略,学习过程中并不存在一个显式的策略,而基于策略的算法则是直接显式地学习一个策略函数,另外,基于策略的算法中还有一类Actor-Critic算法,其会同时学习价值函数和策略函数。

论文具体使用DQN算法,该算法将强化学习中基于价值的算法和深度学习相结合。另外,论文在该算法的基础上,针对自动出价场景的特点进行优化。

论文使用带约束的马尔科夫决策过程(ConstrainedMarkovDecisionProcess,CMDP)对自动出价问题进行建模,如图31所示,其分为离线训练环境和在线预测环境。

自动出价目标可由下式表示:

基于上述约束条件的统一表示,论文给出带约束自动出价问题的统一表示:

论文进一步推导出上述线性规划问题取得最优解时,每次展现的出价可由下式表示:

上一节已提到无模型的强化学习分为基于价值和基于策略的算法,基于价值的算法主要是学习价值函数,然后根据价值函数导出一个策略,学习过程中并不存在一个显式的策略,而基于策略的算法则是直接显式地学习一个策略函数,另外,基于策略的算法中还有一类Actor-Critic算法,其会同时学习价值函数和策略函数。USCB具体使用了Actor-Critic算法中的DDPG算法。DDPG算法使用Actor网络和Critic网络分别拟合策略函数和价值函数。DDPG算法在和环境的交互中,先使用Actor网络根据状态得到动作,再使用Critic网络根据状态和动作得到动作价值。USCB中DDPG算法的实现与原始DDPG算法基本一致,其中几处细节是:

和USCB类似,PerBid首先对带约束自动出价问题进行建模:

和USCB类似,PerBid也推导出最优出价公式:

之前所介绍的各自动出价方案,均先离线与仿真竞价系统交互进行训练、再在线与真实竞价系统交互进行预测,因此存在一个共性问题是如何保持仿真竞价系统和真实竞价系统的一致性,而真实竞价系统存在复杂的拍卖机制、激励的出价竞争,仿真竞价系统难以精确模拟真实竞价系统,而如果不能保持两个系统的一致性,则可能导致仿真竞价系统下所训练的自动出价方案在真实竞价系统中非最优。

阿里妈妈在2023年发表的论文《SustainableOnlineReinforcementLearningforAuto-bidding》,其提出的SOLA框架,将离线强化学习和在线安全探索相结合,同时解决了训练依赖仿真竞价系统和在线探索出价安全性的问题。

粗排和精排均可以认为是排序(LearningtoRank,LTR)问题,而排序问题的求解一般有3种方式:

这三种方法从上到下,从只考虑序列中元素自身、到考虑序列中两两元素相互关系再到考虑序列中所有元素相互关系,考虑的信息更加全面,但问题求解的样本空间也逐渐增大,从所有元素构成的样本空间、到所有元素两两配对构成的样本空间、再到所有元素组合序列构成的样本空间。

《COLD:TowardstheNextGenerationofPre-RankingSystem》由阿里妈妈于2020年发表,介绍了其粗排模型基于Pointwise类型的排序方法,从简单的后验统计、到浅层模型、再到深层模型的演进历程,并主要介绍了其深层模型COLD在模型结构和工程实现上的优化思路,从而在保证在线系统性能要求的前提下,在模型准确度上取得较好的提升。

降低精度。网络前向传播中的运算主要是矩阵相乘,而Float16相对Float32在矩阵相乘上有更高的性能,因此,可以使用Float16替代Float32。

令真实的训练样本集,IP(ImmediatePositive)表示立即发生转化的正样本,DP(DelayPositive)表示延迟发生转化的正样本,其等价于FN(FakeNegative),即假负样本,RN(RealNegative)表示未发生转化的真负样本。

对于上述反馈延迟问题,业界已经有比较多的理论研究和业务实践,其中一个思路是保持模型不变,但针对反馈延迟导致的样本标记分布偏差,通过在损失函数中进行正负样本的加权来纠偏。

对于点击延迟,论文在处理样本时并不会等待其相应的点击发生,而是直接将样本标记为负样本,待点击发生后,再将原样本复制成一条新样本,并将新样本标记为正样本。

论文通过推导,损失函数最终可写成:

通过复制,训练样本集除包含真实样本集中的Positive、FakeNegative和RealNegative外,还包含复制样本集中的真正样本和真负样本,真实样本集和复制样本集除部分样本的标记不同外,其余均一致。

前述论文均是基于重要性采样,并不断优化权重计算方式,但均存在一个问题,即FakeNegative样本在训练时被错误地标记。阿里妈妈于2022年发表了论文《AsymptoticallyUnbiasedEstimationforDelayedFeedbackModelingviaLabelCorrection》,提出了DEFUSE(DElayedFeedbackmodelingwithUnbiaSedEstimation)算法,采用两阶段优化来解决上述问题,首先预测FakeNegative样本的概率,然后再进行重要性采样。

基于规则的归因算法包括但不限于:

基于数据的算法最早于2011年在论文《Data-drivenMulti-touchAttributionModels》中被提出,其中使用Logistic回归模型进行各触点归因权重分析,而随着深度学习的发展,近几年来不少论文探索基于深度学习的多触点归因算法。

2018年发表的论文《DeepNeuralNetwithAttentionforMulti-channelMulti-touchAttribution》提出了DNAMTA算法。论文指出其首次在业界将深度学习应用于多触点归因中。

即将转化路径中属于该渠道的触点的归因权重求和。

将各个渠道的ROI作为其权重,从总预算中分配该渠道的预算:

CAMTA的整体网络结构如图48所示,其包含三部分。

2021年的论文《CausalMTA:EliminatingtheUserConfoundingBiasforCausalMulti-touchAttribution》提出了CausalMTA,其和CAMTA相比,将用户偏好这一混杂因子,进一步区分为不变的静态属性和变化的动态特征,对于静态属性,其使用变分循环自编码器作为渠道序列生成模型获取其无偏分布,然后基于无偏分布和逆概率加权方法对每个转化路径重加权,从而消除静态属性引起的选择偏差,而对于动态特征,其和CAMTA类似,也是借鉴CRN,通过循环神经网络和域对抗训练,生成用户历史的无偏表征,从而消除动态特征引起的选择偏差,得到无偏的转化率预估模型。最后,基于转化率预估模型,采用反事实分析计算各渠道的夏普利值作为归因权重,即对各渠道,使用转化率预估模型分别预估有无该渠道时的转化率,因引入该渠道带来的转化率提升即该渠道对转化的边际期望增益,也就是该渠道的夏普利值,被作为该渠道的归因权重。

CausalMTA整体解决方案模型如图50所,其包含三部分。第一部为转化路径重加权(JourneyReweighting),其对于静态属性,使用变分循环自编码器作为渠道序列生成模型获取其无偏分布,然后基于无偏分布和逆概率加权方法对每个转化路径重加权,从而消除静态属性引起的选择偏差。第二部分为因果转化率预估(CausalConversionPrediction),其对于动态特征,借鉴CRN,通过循环神经网络和域对抗训练,生成用户历史的无偏表征,从而消除动态特征引起的选择偏差,得到无偏的转化率预估模型。第三部分为归因权重计算(Attribution),其基于转化率预估模型,采用反事实分析计算各渠道的夏普利值作为归因权重,即对各渠道,使用转化率预估模型分别预估有无该渠道时的转化率,因引入该渠道带来的转化率提升即该渠道对转化的边际期望增益,也就是该渠道的夏普利值,被作为该渠道的归因权重。

上一节介绍的MMoE采用多个专家网络对各任务的知识进行挖掘和共享,并对每个任务设计其专有的门控网络,每个任务的门控网络对各专家网络的输出进行加权求和作为该任务专有网络塔的输入。

综上,PLE构建多层抽取网络,在CGC网络区分任务专有专家网络和共享专家网络、分别挖掘专有和共享知识的基础上,进一步通过共享门控网络逐层从所有专家网络中抽取共享知识,从而实现各任务专有信息和所有任务共享信息的逐层抽取和深层挖掘。

THE END
1.2024.3.15胖栗MOD2.1.6全职业大量新技能,全新隐藏关卡高...RE: 【2024.3.15】【胖栗MOD2.1.6】全职业大量新技能,全新隐藏关卡高难度挑战,养猫系统,全新...https://bbs.3dmgame.com/thread-6312720-366-1.html
2.SDM汽车车友交流这车值么 不论丰田普拉多/陆巡卖得怎么样,这个车型的热度还是在的。[喵喵] 日前,丰田普拉多(国内称“霸道”)换代车型“陆巡250”发布,基于GA-F平台,车身尺寸4,925x1,980x1,870毫米,轴距2,850毫米。 车身扭转刚度提高30%,轮胎接地性能提高,新增SDM前防倾杆断开结构,多地形系统功能加强。 2.4T混动配8速自动...https://www.dongchedi.com/tag/ugc/9876147
3.多功能动物驱赶器驱猫驱狗驱鸟广东省生产商AN-B010 奥讯 中国, 多功能驱赶器 该装置能根据不同环境需求调试功能转换键而发出:超声波;强闪光;高分贝声波,来驱赶动物(如猫,狗,鸟,鼠等) 适用范围: 超声波驱猫/驱狗/驱鸟/驱鼠器适用于:花园,庭院,家庭或者公寓,餐馆,农场等. 技术参数: 1.供电:9伏叠层电池或者9伏适配https://aosion.diytrade.com/sdm/444766/2/pd-2470614/20648883-2597319/%E5%A4%9A%E5%8A%9F%E8%83%BD%E5%8A%A8%E7%89%A9%E9%A9%B1%E8%B5%B6%E5%99%A8%E9%A9%B1%E7%8C%AB%E9%A9%B1%E7%8B%97%E9%A9%B1%E9%B8%9F.html
4.告知不幸的黑猫不幸を告げる黒猫SDM※ 本站提供的卡片图片只保证外观和主要信息方面的一致。有些图片存在没有卡片密码,编号和说明不一致等现象,请大家见谅。 中文名称 : 告知不幸的黑猫 英文名称 : A Cat of Ill Omen 日文名称 : 不幸を告げる黒猫 卡片编号 : SDM-011 卡片种类 : 效果怪兽 / 反转怪兽 属性: 暗 种族: 兽族 星: ...http://www.qi-wmcard.com/card/5840/
5.河堤上的猫加盟费用河堤上的猫加盟多少钱河堤上的猫加盟介绍 河堤上的猫是在广州鑫谷维餐饮咨询管理有限公司旗下运营的时尚饮品品牌,综合各方面优势,河堤上的猫奶茶店十分适合小资们钟意的创业。一家河堤上的猫奶茶店,一份慢下来的事业和生活,有情调有格调的河堤上的猫奶茶店会满足你对生活的更多期待。 http://www.91jm.com/hedisdm/jiamengfei/
1.猫咪全面降检查:必备体检项目及细节解读在猫咪的体检过程中,还会进行血常规检查五分类、血涂片、猫艾滋病毒检测等高级项目。全身临床检查、腹腔B超、X光检查、内分泌等方面的检测也是全面体检的重要组成部分。费用方面,根据地区和医院的不同,体检费用可能在200-500元之间。 四、 宠物医生在检查猫咪时,会根据猫咪的个体反应和医生的技巧,整个检查过程需要2到10...https://m.tijian8.com/post/2e37617AB006.html
2.米来数据科技有限公司/安卓(最新/收藏网)米来数据科技有限公司/安卓(最新/收藏网) 猫咪成长记官方介绍: 记录猫咪的日常,饮食,驱虫,洗护等和每项支出。当你不知道买米来数据科技有限公司哪种猫粮和罐头的时候,可以看看其它人的记录,大家相互学习把主子养的胖胖哒~备案号:n6e58n49n43n50n5907n31n31n30n31n31n35n37n33n53f7n2dn36n41 猫咪成长记 猫咪成长...http://tgbus.com/caipiaonewsca614/
3.讨论猫咪肌酐指标高(给大家再次避雷瑞鹏宠物医院)来自: 两只猫 2020-11-13 16:24:29 已编辑 今天因为不放心,始终觉得昨天那个医生开的药和诊断结果不清楚,重新换了一家医院再次做了全套检查,结果出来医生说确实肌酐高了,但是也只是比正常的多了一点,要考虑到空腹没喝水的情况,所以这个后期只要多喝水,保证饮水量一个月后再去复查就可以,sdma指标和磷指标都正常...https://m.douban.com/group/topic/200966249/
4.软件简介河内5分彩开奖号码,永乐年间瓷器大概值多少钱,欧洲杯网址大全,永利彩票网最新版本更新内容,河北彩票11选5开奖沙巴地区是指什么地方,泰国东芭乐园门票,永乐国际勇往直前尤文官网,海外皇冠2022款最新款,武乡缺砍麻将下载每日白菜优选app,永利www官方网址,江湖app官网,正规网络棋牌平台,沙巴体育娱乐网址比较大的棋牌软件,...http://m.ofgpbsc.cn/NCM/detail/CZdqvkasSsh.html
5.games.sina.com.cn/zhuanqu/dino2/photo/55.shtml提交答案: 您认为《恐龙危机2》中蕾吉娜的生活形象是属于美艳性感,对蕾吉娜生活形象的描述除了靓女,没得好讲! 如果获奖,您选择:1000元现金 第54049号 用户名:againstwar 提交答案: 您认为《恐龙危机2》中蕾吉娜的生活形象是属于另类前卫,对蕾吉娜生活形象的描述女强人。 https://games.sina.com.cn/zhuanqu/dino2/photo/55.shtml
6.?入口抢先专属网站?♂?大阳城pg,广东二站,优发国际官网是多少,鼎盛app官方下载干嘛的,导师带赚平台澳门新葡京娱乐手机版,买六香港和彩哪个软件好,聚欢阁登录,金牛棋牌官网打开即玩码农.官网备用5.中国,腾龙app安卓版加拿大基诺彩官网开奖,加拿大3.2预测在线预测最准,猫先生,下载注册就能领10元红包的软件,www.http://8329ck.cc/南遇官网...http://m.hbzgcct.cn/BAE/detail/HAOxDVNRzn.html
7.登录?.?网站独家网站冠亚和值2.38以上信誉平台 双彩走势图表 哪些是正规彩票平台 聚宝盆娱乐城 香港最近20期开奖号码 六台至尊网站 最新电子AG捕鱼王 买马网站入口 天博体育滚球官网 下载体育app客户端 天天德州为什么玩不了 王煤通App官方最新版本更新内容 乐享体育app 逍遥阁观看入口网站 下载猫宝哪个是正确的 新澳门免费资料大全 永宝...http://m.suxingrui1.cn/ALX/detail/YmESISDUhBK.html
8.平台?.?登录链接下载分类:单机/ 冒险解谜 大小:233.3MB 授权:免费游戏 语言:中文 更新:2024-11-17 07:45:15 等级: 平台:Android 厂商:小波BoBo二维码股份有限公司 官网:暂无 权限:查看 允许程序访问网络. 备案:湘ICP备2023018554号-3A 标签:买球靠谱的平台www.sdmdmy.cn最新版免费npv中文版 ...http://m.syajjl.cn/HIF/detail/KBDrtHyTn.html
9.家中有怀孕的妇女养猫好不好【简答题】由于铁不能通过乳腺进入乳汁,一般情况下,乳母也没有因月经失铁,所以哺乳期妇女不需要补充含铁较高的膳食。() 查看完整题目与答案 【单选题】好发于青年妇女的乳房疾病是 A. 乳痈 B. 乳漏 C. 乳癖 D. 乳核 E. 乳岩 查看完整题目与答案 参考解析: 答案:不好。 AI解析 重新生成最新...https://www.shuashuati.com/ti/3acc9cdb5934457d86f7a1eb29894513.html?fm=bd5e831e2d4813db462c70ae68c6db1620
10.?登录网站?独家网站米兰高赔最长出了多少期,极速赛车信誉app平台,玩彩网是合法的吗,亿万app下载,老版炸金花皇家AAA一号网投站,正规网络真人游戏平台介绍,台湾4星彩官网,韩国彩票lotto开奖,皇冠网改单黑客足球香港盘ip网址,新浦京乐城,澳门·威斯尼斯下载,澳门彩官方app下载,www.gc5.comwww.uuzx.lol,体彩平台app下载苹果版,关于...http://m.tgrwjmp.cn/UOH/detail/DWMu.html
11.国内30个区块链APP,带你全面体验区块链应用世界13.360区块猫 360区块猫是一个基于区块链技术的电子宠物养成平台,360区块猫由360官方发行,这款360区块猫玩法与以太猫和莱茨狗类似,360区块猫中初代区块猫限量5万只,360区块猫用户可通过互相繁殖来产生后代,当然,其价值也会随着繁衍次数而受影响。 14.谜恋猫 ...https://maimai.cn/article/detail?fid=610888947&efid=hQtTF4ILgzM3lR6e8W1S6w
12.水电猫APP师傅端水电猫师傅版v1.4.4安卓版在使用过程中有任何疑问,请联系我们 微信公众号:搜索水电猫微信公众号,进行留言 在线客服:进入水电猫师傅版APP->我的->联系客服 更新内容 1.认证流程优化 2.修复Bug厂商名称:铼鹏科技发展(重庆)有限公司 包名:com.lypom.sdm.servicer MD5值:6586cd4a69a6bffad5fe8440cea1a21e相关应用直通宝...https://m.qqtn.com/q/750756