基于事件感知的聚类增益网络在飞猪保险创意排序的应用人工智能

保险的创意推荐面临的挑战,可以总结为三大类:

第三类是跨行业的创意冷启动。飞猪保险横跨了多个行业,在启动新行业的介入的时候,如何复用已有领域的知识,比如将行业A效果好的一些创意迁移到行业B,也是我们后面要去解决的问题。

再简单介绍一下业界现状。

针对创意数据稀疏问题,我们的解决方案是当新素材上线时在线上做随机曝光。

另外一个问题是跨行业创意冷启动。比如我们发现对于天气事件的因素,不管是在各个行业里,其实大家的偏好都比较相似的,尤其是在汽车票或者火车票业务下,大家的购买习惯很相似,所以一些创意的推荐知识是可以通过刚刚提到的标签化和体系化的理解和标签关联进行迁移的。通过将不同的行业在同一知识体系下进行标签对齐,通过图卷积模型的泛化能力对知识进行一些泛化迁移。

刚刚提到的体系化理解和标准化打标主要分为三块:

一块是在用户侧,我们会去做一些场景和事件的理解;另外一块是在用户的基础属性上去做一些理解;最后是在创意这里,对一些图文的素材进行理解。最后将三者都统一标准化到标签体系之下,有助于帮助后面去建立图的关联关系。

上图为比较显性的图。其中三角符号是用户侧的一些属性,比如女性或者老人;圆形符号是对事件或者上下文的理解进行分类,比如打雷或者是晚间出行;方块符号是素材的分类。

刚刚提到的第三个挑战是样本当中存在反事实的现象,解决该问题我们想到的是用uplift思想,因果推断是用群体在不同的营销素材下的平均转化率去预估个体的偏好。

上图是保险创意图文推荐流程框架。

首先,前文已提到,在创意模块,我们对险种的排序或者价格的排序是不进行干预的,创意图文的排序是作为链路的最后排序逻辑。当用户请求进来时,会做四个理解。事件层面的理解,比如现在是否在下雨;场景理解,比如现在用户是多个人带着小孩,还是带着老人;还有用户基础属性的理解。在素材库也是进行刚刚提到的这种标签化的打标之后,进行素材的标签召回以及后续的素材创意的排序,在排序侧会分出一部分流量去做线上的均匀曝光。

另外一块去做创意优选的工作。创意优选工作分两路:

一路是以图片素材进行召回和粗排,另外一路是以文案的素材进行粗排,最后进行笛卡尔组合出来我们想要的类似创意文案的展示,最后再通过ECUNet去进行优先。

根据刚刚提到的三种解决思路,设计了ECUNet的解决方案。主要分为三个部分:

第一部分是基于事件感知图向量提取,主要是在离线侧进行预训练的过程,去给每个用户侧的信息、上下文信息或者是创意的信息进行图向量的提取;第二部分是自适应的聚类增益网络,这部分解决的问题是结合uplift思想去利用群体智慧解决个体问题;第三部分是将用户和场景、用户事件以及创意三部分的特征,通过图向量提取得到的综合向量去做两两之间的Co-Attention,目的是为了提取他们相互之间的特性,最后去做打分。

异构图的构建主要分两部分:一部分是节点构建,一部分是边构建。

节点构建主要是当用户样本进来之后,可以映射到三类节点:用户节点、事件节点和创意节点。当映射到三类节点之后,可以在节点和节点之间去进行边的构建。

边代表的是a节点因为b的原因导致保险转化的重要性。比如说学生节点a在天气恶劣节点b的权重会高于学生节点a在正常天气节点权重。

根据上述方法,构建了异构图。基于该图,通过比较常规的Nodeembedding去提取每个节点的三个场景的节点表征。

主要是通过图的自监督学习的边预测的任务,loss使用margin-based的lossfunction,最后学习得到的是特定场景的,比如机/火/汽三个场景的节点表征。

但为了迁移不同行业的知识去融合运用到另外的一些场景行业中,我们做了share-domainembedding节点表征学习。比如火车票和汽车票比较相似,如果现在某条用户样本是来自于汽车票,那么火车票的场景的embedding也可以被加权共享给用户去使用。基于这样的假设,做了share-domain的表征学习。主要是将三类场景的节点表征,通过注意力机制的加权去得到specificembedding。

通过这样的EAGTNetwork我们可以提取到三大类的节点表征。每个样本都可以得到三个大类的节点表征后,再类内取平均值,可以得到用户、事件、创意的三个节点表征,最后将用户事件联合表征和每个创意文案联合表征输入到第二部分——自适应的聚类增益网络。

利用群体智慧去预估个体的偏好,流程是以batch内的操作去进行的。在每个batch内,通过可学习的分类器将每个batch内用户分到k个大类里,希望相似的用户可以被分到同一类。在随机样本采样机制的保障之下,可以在内类的用户进行类似创意文案的投票得到内类用户到底对哪些创意文案比较感兴趣。最后用内类群体的喜好去代表个体用户的偏好,之后再对每个样本进行re-lable。比如G1对第三个创意比较敏感,G2对第二个比较敏感,内类的用户都去重新re-lable一次。得到re-lable的样本之后,再进行MLP的预测得到预测值。

我们在Training的LossFunction也进行了一些设计。一共设计了四个LossFunction。

第一个LossFunction是intraloss。主要是在聚类块,为了使得群体分类器能够输出一个非均匀分布的值。从这个公式可以看到我们希望让相似的用户能在某一个类上去得到一个峰值表达,而在其他的类上是比较低的表达。

第二个是用交叉熵做聚类增益网络的Loss。

第三个是全局Loss,也是交叉熵。

最后将三个Loss融合到一起去做一个融合Loss。

从实验数据中可以看到,我们这个网络结构设计之后,在AUC上有一定的提升。其中多视角的网络提升比较明显,其次是增益网络,然后是异构图网络的结构。

我们也在线上去捞了一些Case,可以学习到用户的一些场景侧的东西。比如天气信息或长短图等场景。

在这个工作当中,主要有两方面创新:

事件感知的图提取器:当前业内对于事件感知较少去考虑,尤其是在创意推荐这个模块,我们的工作是比较创新的。通过将一些跨场景的信息,比如用户对某些险种、某些图文的偏好,或者是对于事件在跨场景之间的迁移。同时将这个事件作为一个影响节点,以图的形式将用户和创意进行关系建模。

自适应聚类增益网络:相比较于传统的排序问题,创意推荐是一个Top1的问题,面临着一些因果推断中遇到的反事实的现象。我们通过群体增益学习,也能比较好的缓解。

A1:事件理解这块主要是跟运营进行了合作。我们会在数据当中去挖掘一些,事件它其实有时候是一些不可预知的。可预知的话可以被沉淀成一个标签体系,那不可预知的话就需要我们去做一些异常检测去挖掘。

场景理解,比如在搜索场景是可以通过Query里面的一些意图去分析到用户这次想要去买什么,但是在保险推荐中很难在上下文信息当中获取到用户到底想要买什么保险。因此场景理解更多的是通过推理,首先是一个数据分析洞察,然后再通过一些特征,上面我们可以看到哪些场景之下对用户购买保险或者用户购买创意有一个转化效果,之后再融合到标签体系当中,主要是在标签打标这边去做一些事情。

A2:主要是以推荐的这种形式去做的,多模态在这个工作当中没有体现,我们在别的工作当中有一些工作。Embedding刚刚也提到了主要是比如说一些ID类表征,或者是一些统计的表征,然后这些表征都会在这个图网络里面,最后去进行一个图节点的Embedding。图节点Embedding的一个好处是可以将比如说某一类用户对一些创意文案他是有敏感的,那用户和创意文案之间,可能有一个相似的事情。

A3:关于边,我们主要是去做了一个类似于条件转化概率的处理。比如一个学生节点在天气恶劣情况之下的转化率可能会高一点。有些情况下会去做边的裁剪操作。边的表征学习没有涉及到,这块主要是在节点的学习处理。

THE END
1.基于智能算法的保险用户推荐系统的设计基于智能算法的保险用户推荐系统的设计 项目类型: 创业训练项目 项目类别: 重点支持领域: 所属学校: 哈尔滨石油学院 项目实施时间: 2020-05-01 至 2021-11-01 所属学科门类: 工学 所属专业大类: 计算机类 立项时间: 2020-09-02 项目成员: 姓名年级学号所在院系专业联系电话E-mail是否主持人 ...http://gjcxcy.bjtu.edu.cn/NewLXItemListForStudentDetail.aspx?ItemNo=618874
2.重磅!终于要来了!人脸、指纹信息泄露? 全国人大代表 杨元庆:建议一般商家、私人机构等不得收集个人生物敏感信息 向网络过度弹窗说不! 全国政协委员 魏世忠:建议将过度弹窗运营商纳入失信名单 平台算法推荐太殷勤? 全国人大代表 任贤良:建议尊重网民自主选择的权利,允许用户关闭个性化推送 ...http://m.xgnews.cn/p/153273.html
3.信泰倍爱传承终身寿险5年交保终身每年三万的算法以上算法仅供参考,具体情况还需要查看产品的条款或咨询信泰倍爱的专业保险规划人员。保险产品的费率和保障条款可能因个人情况而有所不同。 信泰倍爱传承终身寿险的5年交保终身每年三万的算法提供了一种保费灵活的选择,使保险持有人可以在前五年内每年支付三万元的保费,之后终身享受保险保障。然而,具体的保费计算和保险...https://m.xyz.cn/discover/detail-zhongshenshouxian-3270434.html
1.保险产品推荐机器学习第六章保险产品推荐根据以上数据,可将用户分为购买移动房车险和不购买移动房车险两个类别,看作一个 分类问题,前85个字段作为用户特征, 使用决策树分类算法来分析购买该保险的用户特征,决策树主要通过一个数据的熵值来表示数据的稳定或复杂程度,熵值越大说明数据越复杂,纯度越低;反之说明数据纯度越高,熵值的变化为信息增益。如果将一个...https://blog.csdn.net/2301_78464040/article/details/139952323
2.中国人民人寿申请一种保险推荐方法等专利,使推荐的保险产品更精准...金融界 2024 年 10 月 24 日消息,国家知识产权局信息显示,中国人民人寿保险股份有限公司申请一项名为“一种保险推荐方法、装置及存储介质”的专利,公开号 CN 118799028 A,申请日期为 2024 年 7 月。 专利摘要显示,本发明公开了一种保险推荐方法及装置,该方法包括,获取保险产品的历史购买数据,并对历史购买数据进行...https://m.jrj.com.cn/madapter/finance/2024/10/24134144379921.shtml
3.生成一份保险计划书只用30秒,保险公司争相试水大模型应用信美3.0是信美人寿相互保险社(以下简称“信美”)在不久前正式发布的“大模型保险垂直应用3.0”——信美Chat-Trust3.0,这是业内首批落地的能够精确进行专业计算的大模型保险垂直应用。 为啥能得到这么多询问?因为确确实实能够提高效率。举个例子,如果投保人希望得到一份个性化的保险计划书,代理人自己进行计算、归类、制...https://export.shobserver.com/toutiao/html/761464.html
4.太平保险集团用户隐私条款根据《中华人民共和国民法典》《中华人民共和国个人信息保护法》《中华人民共和国保险法》等相关法律法规要求,太平金融服务有限公司(以下简称“太平金服”)尊重您的个人信息权利并且深知遵循合法、正当、必要和诚信原则处理您的个人信息的重要性。《太平通用户隐私政策》(以下简称本“本政策”)旨在向您介绍太平通处理您...https://ecustomer.cntaiping.com/static/agreement/privacyAgreement.html
5.江苏省工伤保险待遇新算法江苏省工伤保险待遇新算法 江苏省实施《工伤保险条例》办法经过修改,于2015年6月1日正式实施,该办法对工伤保险待遇进行了全面修改,现根据新的办法,将工伤保险待遇归纳如下,供理赔时进行参考。 等级一次性伤残补助金伤残津贴一次性工伤医疗补助金一次性伤残就业补助金...https://www.66law.cn/laws/126343.aspx
6.“潮平两岸阔,风正一帆悬”——2022年金杜网络安全与数据合规治理...2022年3月1日,国家网信办、工信部等联合发布的《互联网信息服务算法推荐管理规定》(下称“《算法管理规定》”)正式施行,由此开启中国算法治理的元年。《算法管理规定》首次明确了算法分级分类安全管理制度,建立健全企业主体算法安全责任制度,推动算法公开透明,并要求具有舆论属性或者...https://www.kwm.com/cn/zh/insights/latest-thinking/2022-kwm-annual-legal-observation-on-cybersecurity-and-data-compliance-and-governance.html
7.分红型保险中途退保怎么算有两种算法分红型保险也是属于一种商业保险,保单持有是可以分享保险公司经营成果的,通常情况下保单持有人每年都有权获得建立在保险公司经营成果基础上的红利分配。那么分红型保险若是中途退保要怎么算?一起来了解一下。 分红型保险中途退保怎么算? 分红型保险在中途退保有两种情况,一种是犹豫期内退保,另一种则是在犹豫期之后退保...https://www.cnq.net/baoxianzhishi/83444.html
8.《人民法院报》2023年17月民商事案例裁判要旨汇总保险人对保险条款中释义部分是否应当尽到提示说明义务,关键在于判断该释义是否属于实质意义上的免责条款以及是否不当扩大了免责范围。对自燃的释义,若并未超出通常理解,也未对免责条款中的自燃情形进行扩大解释,仅是对自燃的进一步补充说明,并未额外增加免赔的情形,则该释义并非保险人履行提示说明义务的内容。 https://www.thepaper.cn/newsDetail_forward_24291172
9.3月新规来袭,涉及信用的竟然有这么多!《银行保险机构关联交易管理办法》自2022年3月1日起施行。 《互联网信息服务算法推荐管理规定》 《互联网信息服务算法推荐管理规定》自2022年3月1日起施行。 第四条 提供算法推荐服务,应当遵守法律法规,尊重社会公德和伦理,遵守商业道德和职业道德,遵循公正公平、公开透明、科学合理和 诚实信用的原则。 https://qhcredit.gov.cn/detail.do?contentId=babeda66fa87464894d852044e1f4da1
10.九次著名的统计分析和人工智能灾难2019 年,发表在《科学》(Science)杂志上的一项研究显示,美国各地的医院和保险公司用来识别需要 “高风险护理管理”项目的患者的医疗预测算法,不太可能将黑人患者纳入其中。 高风险护理管理计划为慢性病患者提供训练有素的护理人员和初级保健监测,以预防严重并发症的发生。但与黑人患者相比,该算法更倾向于推荐白人患者参...https://www.51cto.com/article/770912.html
11.8个提问看透“你”!保险中介押宝智能推荐平台凭借大数据算法,智能推荐系统已在多家保险中介平台上线,精准匹配用户需求,并向用户推荐个性化的专属保险产品。智能推荐系统的运作,往往始于8个由专家论证而来的“精华”问题。这8个问题,其实包含了几十个关于用户的细节。 在东方财富看资讯行情,选东方财富证券一站式开户交易>> ...https://finance.eastmoney.com/a/20180125825481084.html
12.2022年我国网络安全法规一览《规定》明确,应用算法推荐技术,是指利用生成合成类、个性化推送类、排序精选类、检索过滤类、调度决策类等算法技术向用户提供信息。 2、中央网信办等四部门印发《2022年提升全民数字素养与技能工作要点》,加强个人信息和隐私保护 3月2日消息,中央网信办、教育部、工信部、人力资源社会保障部近日联合印发《2022年提升...https://www.trustauth.cn/?p=44265
13.重塑保险新生态:加强保险深度和密度粤港澳大湾区(广东)数字金融...同时,保险作为数字金融算法的重要应用场景之一,为充分发挥新闻媒体、研究智库在保险转型发展上的积极作用,南方财经全媒体集团拟依托大湾区数字金融算法委员会,成立“粤港澳大湾区(广东)数字金融算法委员会——保险专家委员会”。 保险服务地方经济社会发展大局取得新成效 ...https://static.nfapp.southcn.com/content/202207/21/c6708362.html
14.2023年重大网络安全政策法规盘点《办法》明确监管统计工作归口管理要求,对监管统计管理机构归口管理部门职责作出界定,对银行保险机构归口管理部门职责予以明确。 十六部门联合印发《关于促进数据安全产业发展的指导意见》 为贯彻落实《中华人民共和国数据安全法》,推动数据安全产业高质量发展,提高各行业各领域数据安全保障能力,加速数据要素市场培育和价值释放...https://www.eet-china.com/mp/a273064.html