快手因果推断与实验设计

导读:理解和识别用户行为指标的相互关系是实验分析的目标。在社区氛围下,影响用户行为的因素更为复杂,关系识别更为困难,如何使用各种学科的方法,对社区进行宏观或微观的建模分析,系统性的评估各种策略的长期生态影响,是所要解决的重要问题。

在快手我们主要会遇到这四类问题:用户激励设计、推荐策略评估、产品功能迭代以及预估产品和方向的长期价值。

遇到这些问题我们通常有几种方式来解决:

基于观测数据的因果推断,即从已有实验和非实验数据中提炼因果关系;

在产品设计上构建正确的AB实验,合理计算指标,度量产品功能和迭代的影响;

通过经济模型、机器学习算法和数据、实验的结合构造反事实推理来回答长期效应问题。

解决这些问题的核心是使用因果推断方法。

因果推断的核心是在数据中存在关联关系的前提下,考虑数据之间的因果关系。任务是在给定的假设中,选择模型框架,将因果关系从关联中分割,对因果分析的大小作出正确的估计,并且通过统计推断的方法,验证推断的正确度,并回答推断结果存在多大波动。

在因果推断中,我们通常应用以下两种框架:

Rubin虚拟事实模型(PotentialOutcome)的核心是寻找合适的对照组。通常情况下,我们想要度量用户是否被实验影响到的两者差异是多少,而对于同一个用户,我们只能观测到被影响/不被影响一个状态,因此需要寻找合适的对照组,估计无法被观测到的影响。我们通常会构造一些识别实验,比如,经济学上通过RCT实验,互联网常使用AB实验,或者根据观测数据使用恰当的方法来寻找对照组。

Pearl因果图模型(CausalGraphModel)使用有向图描述变量之间的因果关系。通过计算因果图中的条件分布,获得变量之间的因果关系。有向图指导我们使用这些条件分布来消除估计偏差,其核心也是估计检验分布、消除其他变量带来的偏差。

Pearl框架和Rubin框架有一些关联,简单图中,PotentialOutcome模型中通过工具变量和匹配法消除估计偏差和Pearl的框架思想是一致的。

但是Pearl的框架可以处理多个变量之间相互作用的复杂关系。

总结来说,PotentialOutcome和CausalGraph是两种互补的推测虚拟事实的方法,目的都是为了计算存在混淆变量时,干预变量时对结果的影响,都需要对因果关系作假设,以及控制带来偏差的变量;不同点在于Rubin框架估计的因果效应主要是干预前后的期望差值,而Pearl框架下,我们估计的是干预前后的分布差异,Rubin框架解决的问题是因果效应的估计和统计推断,Pearl框架更偏向于因果关系的识别。

从这两种框架延伸,在不同情景下,快手会使用不同工具解决实际问题,AB实验帮助我们观测策略或产品变动影响,在一些不能做实验或者多个实验相结合的场景下,会有一些其他的方法,下面会对具体方法展开介绍。

1.产品功能的评估:DID及其拓展案例

当treatment施加到一个群体或者地区上时,很难找到单一的对照组,这种时候采用合成控制方法构造虚拟对照组进行比较,原理是构造一个虚拟的对照组,通过treatment前的数据上学习的权重,拟合实验组在实验开始前的数据,模拟实验组用户在没有接受实验情况下的结果,构造合成控制组,实验开始后,评估实验组和合成控制组之间的差异。

2.推荐策略的评估:因果推断与机器学习

因果分析与机器学习存在一些差异点。因果分析的语言,核心在于因果关系的识别,即合理的估计处理前和处理后现有条件期望的差异,也可以是一种处理缺失数据的问题,在因果推断上我们非常关心的是如何准确的估计结果以及结果的方差。而在机器学习中,我们使用准确度来衡量机器学习模型的好坏,其目标是在训练集上估计一个条件期望,使得测试集上MSE最小。机器学习可以通过cross-validation(模型参数)的方法去数据驱动的选择一个最佳模型形式,与传统计量经济学方法相比不需要复杂的假设,例如functionform的假设,从这种意义上机器学习能够更准确的预测。

但是在因果推断问题上,机器学习的局限性在于,无论用什么机器学习方法,因果识别的条件都不能被放松;同时在机器学习模型通常使用的正则化和过拟合处理,会带来有偏估计,因此我们需要消除这种估计的偏差;在统计推断上,机器学习的局限性在于,有些模型不能直接计算方差,并且有时即使可以计算,方差的收敛速度也未必能够达到预期,所以针对这些问题,下面介绍了几种方法。

①双重机器学习模型

双重机器学习假设所有混淆变量都可以被观测,其正则化过程能够达到高维变量选择的目的,与Frisch-Waugh-Lovell定理相似,模型通过正交化解决正则化带来的偏差。

除了上面所描述的,还有一些问题待解决,比如在ML模型下存在偏差和估计有效性的问题,这个时候可以通过SampleSplitting和CrossFitting的方式来解决,具体做法是我们把数据分成一个训练集和估计集,在训练集上我们分别使用机器学习来拟合影响,在估计集上我们根据拟合得到的函数来做残差的估计,通过这种方法,可以对偏差进行修正。在偏差修正的基础上,我们可以对整个估计方法去构造一个momentcondition,得到置信区间的推断,从而得到一个有良好统计的估计。

②因果随机森林模型

我们通常探究策略对于不同用户异质性的影响,即哪些用户更容易被影响以及影响有多大,传统做法是多维分析,但是效率低,容易犯错。这时可以结合机器学习的方法,这里选择了决策树方法,因为决策树的分桶特性能够帮助解决异质性问题,相对于传统方法因果树做了两点改动:

把数据分成训练集和估计集,一部分训练集去构造树,另一部分估计集去估计因果效应和方差;

在树的分区方式上,使用各个节点的方差对目标函数加以修正。

通常情况下,我们结合实验来做分析。比如在实验中,通过因果树得到因果效应的分布,然后挑选出来那些实验效果显著的用户,去分析他们的特征,以及找到敏感用户,帮助我们了解策略的影响,作出下一步迭代。

③Meta-LearnerforUpliftModeling

Uplift-modeling是另一种定位敏感人群的方法,和因果树的步骤有差别。核心是利用实验数据对实验结果变量建模,利用得到的模型估计条件平均处理效果。Uplift-modeling具有不同的学习方式,主要有S-Learner、T-Learner和X-learner。和因果树相比,Meta-Learner是一种间接建模方式,实现快但一些场景下误差较大。

3.用户行为链路的研究:因果图

我们通常通过因果图来进行用户行为链路的研究。Rubin流派常用来估计变量之间的一度关系,但当我们面对一些未知问题时,我们想了解的是有哪些变量真正影响我们关心的结果变量,以及变量之间的相互影响和用户行为链路是什么,有效过程指标是什么,这些时候我们用到因果图的方法。

在生成因果图中,常遇到的限制是算法层面的,比如我们在优化目标函数的时候,需要遍历所有的因果图,是一个NP-hard问题,我们需要有效的算法得到想要的估计,市面上的算法大概分为两类:

Constraint-basedAlgorithms

Score-basedAlgorithms

1.双边实验设计

在双边实验中,同时进行了主播侧和观众侧的分流,主播侧一部分是上了挂件,观众侧一部分能看到一部分看不到,双边实验的优点是可以同时检测两端的效果,同时可以帮助检测到组间的转移和溢出。在了解到组间溢出和干扰下,通过双边实验我们可以更加准确的测算处理效应,在挂件场景下,我们认为N3是代表完全没有处理过的效果,Y代表处理后的结果,N3和Y进行差分,计算产品功能推全后的影响,而且,双边实验能够更好的帮助我们归因。

实验总周期选择

最优设计的核心假设是:

Outcome有一个绝对上界

Q:DID和ABtest有什么区别?什么时候用DID不用ABtest?

A:两种不同维度的方法,ABtest是说,在实验对象上做出一些随机的对照,然后进行比较,即便是这种AB实验,我们遇到AB效果比较大的时候,也可以用DID来进行,DID不一定基于实验来进行,可以比如根据不同用户群来比较。

Q:双重机器学习和PSM的结果有什么区别?

A:两种不同维度的方法,PSM的核心假设是,我们先去估计了propensityScore,基于propensityScore我们认为propensityScore相似的情况下treat与control组可以计算因果效应,双重机器学习是说,我们针对于混淆变量对于treatment的影响和混淆变量对于outcome的影响的functionform是未知的,涉及到高维变量选择的问题,同时需要两步的估计,来得到我们想要估计的因果变量,是主要的差异。

Q:CIA假设往往不能满足,应该如何降低影响?

A:现在很多的包括双重机器学习等方法都有很多的扩展,比如当有些合适的工具变量会有些合适的拓展的工具方法,另外可以通过一些matching的方法去构造些满足条件的样本,但是这个东西也不是完全精确,很多时候需要靠人为的逻辑判断。

Q:因果图的结构是预设的还是模型结构输出的?

A:主要是模型输出的,但是在算法中我们可以限定哪些变量是父节点,哪些是子节点,如果最后结果与假设相悖,会发现假设的父节点下是没有任何子节点的。

Q:如何评价因果图判断的准确性?

A:①通过模拟数据看准确性;②通过实验数据,在有限的检验方式下,我们发现其结论是比较Robust,当然理论上可能还需要些证明。

THE END
1.数据分析报告:直播带货分析与优化(考虑退货)在直播带货领域赋能是我们的目标,为了实现这一目标,我们需要通过数据分析深入了解直播带货的现状,并制定优化策略。本报告将详细介绍我们的分析思路、具体的分析过程以及最终的结论和优化方向。 2. 思路 为了实现直播带货的赋能,我们将从以下几个方面展开分析: ...http://www.pnsm.cn/news/51707.html
2.关于因果分析图法,下列说法错误的是()。【简答题】已知信号f(t)是因果信号其拉氏变换为F(s)=1/S2,试求f(0)=? 查看完整题目与答案 参考解析: 几个相似的质量特性或质量问题可使用一张图分析 AI解析 重新生成最新题目 【单选题】如果将人眼比作照相机的话,则相当于暗盒的是( )。 查看完整题目与答案 【单选题】道德是人类社会生活中依据社会舆...https://www.shuashuati.com/ti/d488c7dddd684b3f8655bd7ea823a4cc.html?fm=bdbdse8c46073833049a3e52e7160c0042e31
3.2小时快速学习10大质量管理工具(2)因果图,柏拉图等(一)因果分析图概念因果分析图(Causeandeffectdiagram)又叫石川馨图(由日本专家石川馨首先提出)、特色要因图、树枝图、鱼刺图等。因果分析图是以结果为特性,以原因作为因素,在它们之间用箭头联系起来,表示因果关系的图形,因果分析图能简明、准确表示事物的因果关系,进而识别和发现问题的原因和改进方法。 https://www.jianshu.com/p/cec284ae849a
4.服务业因果图分析时,“4P”指的是人员程序政策和()。关于"服务业因果图分析时,“4P”指的是人员、程序、政策和()。"的答案很多朋友不是很清楚,接下来小编就为介绍一下改题答案吧。 服务业因果图分析时,“4P”指的是人员、程序、政策和()。 A.环境 B.测量 C.场所 D.方法 正确答案:C 阅读全文 关注公众号“ 多特资源库 ”查看更多信息...https://m.duote.com/tech/tiku/265703.html
5.2020一级造价工程师《造价管理》章节考点:工程项目目标控制的方法『答案解析』本题考查的是工程项目目标控制的方法。选项BCDE均可以进行质量控制,排列图法、因果分析法和直方图法属于静态分析方法,控制图法是动态分析方法。参见教材P105。 【2014考题·单选题】下列工程项目目标控制方法中,可用来掌握产品质量波动情况及质量特征的分布规律,以便对质量状况进行分析判断的是( )。 https://www.exam8.com/gongcheng/zaojia/fudao/llfg/202004/4585515.html
6.4大方法,因果关系分析的总结,都在这了因果关系推断,可以说是数据分析领域最难的问题之一,争吵很多年也没有定论。经常同学们被问到:“到底这个问题的原因是什么!”都会觉得分析起来很挠头,今天我们系统讲解下。 1 常见方法1:拆解法 最常见的用来求因果关系的方法,是拆解法。把一个结果指标,从多个角度拆解,找到影响它的原因。举例:昨天有4个推广渠道,一...https://www.51.la/news/data/4hu1Ck1612338662
1.直播数据变化趋势:洞察行业动态的关键直播的魅力在于其互动性。观众通过弹幕、点赞、分享等方式与主播进行实时互动,这些互动数据也成为了我们分析观众喜好、优化直播策略的重要依据。我发现,当互动数据出现异常波动时,往往意味着观众对直播内容产生了强烈的共鸣或不满,这时我们就需要及时调整策略,以满足观众的期待。 https://www.batmanit.cn/blog/k/51029.html
2.直播推荐图,引领营销新时代的关键利器技术咨询案例分析 随着互联网的普及和直播行业的飞速发展,直播推荐图作为一种新型的营销手段,正逐渐成为各大电商平台、社交媒体和直播间的标配,它通过生动形象的图片展示,结合直播间的实时互动,有效地吸引了消费者的眼球,提高了商品的曝光率和销售量,本文将详细介绍直播推荐图的概念、特点及其在营销中的应用。 http://m.zjcbkj.cn/post/431.html
3.AI直播攻略:让技术实现与高效运营并驾齐驱在当今数字化时代,直播已成为企业营销、教育普及、娱乐互动等多个领域不可或缺的一部分。随着人工智能(AI)技术的飞速发展,AI直播正逐步改变着传统直播行业的面貌,实现了内容创作、观众互动、数据分析等多方面的智能化升级。本文将深入探讨AI直播攻略,旨在帮助企业和个人充分利用AI技术,实现技术实现与高效运营的并驾齐驱...https://blog.csdn.net/keh0814/article/details/143788535
4.结构重要度的因果图分析方法结构重要度的因果图分析方法 重庆师范大学 | 马超开通知网号 因果图理论的研究主要是为了对故障进行诊断,尤其是对复杂系统的故障诊断等提供了方法。近年来关于因果图的应用也得到了广泛的研究,无论是工业方面还是在许多重大的安全事故方面都得到了广泛的研究,在复杂系统的故障诊断中,如何快速找出故障原因,尽快采取补救以...https://wap.cnki.net/touch/web/Dissertation/Article/1016140842.nh.html
5.2017年一建通信与广电真题答案及解析一级建造师5、绘制光缆接头损耗大的因果分析图? {#page#} (三) 背景材料:某施工单位承接了一项PTN传输设备安装工作,合同90万,采用包工不包料的方式,其中A中继段光纤长度100km,光纤衰减系数0.2dB/km,设备平均发送光功率为0dBm,最小过载光功率为2dBm,ODF至设备接口衰减0.5dB/条,系统冗余为3dB。 https://www.educity.cn/jianzaoshi1/2106369.html
6.2020选调生高分答题技巧河南选调生技巧1.阅读理解中重点掌握五种关联词和五种行文脉络的标志和用法,务必做到背得住、认得出、用得准。并注意在分析文段时,关联词须和行文脉络结合使用。 2.逻辑填空题量通常占据整个言语的50%,难度又是行测中烧脑之最。掌握词语辨析方法,准确把握语境中照应信息的提示作用,将逻辑填空错题控制在3题以内的目标并不遥远...https://ha.huatu.com/zt/2020xdsqf
7.吉林长春市五中田家炳实验中学高三2018—2019学年度第三次调研测试...从“我国1982~2007年土地城市化和人口城市化对比关系图”中可以看出,1982~2007年我国城市人口年增长率虽然有波动,但始终为正值,说明城市人口始终在增加,故答案A错误,土地城市化与人口城市化变化趋势并不是完全相反,故答案B错误,从城市人口和城市面积年增长率来看,城市化水平增速一直较快,故答案C错误,分析图中城市...https://blog.sina.com.cn/s/blog_5a18c50f0102yu9c.html
8.因果链分析的基本原理理想股票技术论坛因果链分析是一种研究方法,旨在探究事件或行为之间的因果关系,并揭示其内在逻辑联系。通过分析和解读因果关系的过程,了解事件发生的根本原因及其产生的后果,进而做出科学决策。 ,理想股票技术论坛https://www.55188.com/tag-09018384.html
9.中国法院网网上直播为宣传法制、警示社会,促进社会、家庭、人际的和谐发展,二中院专门对近三年审理的严重危害群众生命安全的重大犯罪案件进行了梳理分析。 [10:03:09] [崔杨]: 一、二中院审理的严重危害群众生命安全的重大犯罪案件基本情况 自2012年12月21日至2015年9月20日,我院共审结各类严重危害群众生命安全的重大犯罪案件255件,...https://www.chinacourt.org/chat/chat/2015/11/id/42874.shtml
10.湖南土建初中级职称市政公用工程《专业知识》考试大纲因果分析图的概念及绘制方法 排列图的概念及绘制方法 (5)市政工程质量事故的处理 常见的质量事故原因 工程质量事故的分类 工程质量事故处理程序 质量事故调查报告的主要内容 6.工程质量验收和竣工验收 (1)市政工程施工质量验收层次划分 单位、分部、分项工程和检验批划分的原则 ...https://www.examw.com/tujian/dagang/922472/