美团搜索中查询改写技术的探索与实践

在搜索场景中,由于用户搜索词Query和检索文本Document之间存在大量表述不一的情况,在文本检索框架下,此类文本不匹配导致的漏召回问题严重影响着用户的体验。对这类问题业界一般有两种方案:用户端拓展用户的查询词——即查询改写,或Document端拓展文档关键词——即Document标签。本文主要介绍前一种解决漏召回的方案:查询改写(QueryRewriting,或称为查询扩展QueryExpansion)。查询改写的应用方式是对原始Query拓展出与用户需求关联度高的改写词,多个改写词与用户搜索词一起做检索,从而用更好的表述,帮用户搜到更多符合需求的商户、商品和服务。

在美团的搜索场景下,查询改写主要用于解决以下四类语义鸿沟导致的漏召回问题:

搜索是在用户搜索词以及供给两方面约束下尽可能提高用户触达效率以及商业化指标,而美团的搜索场景增加了“地域”第三个约束。具体的行业对比如下图所示:

通过对比行业内搜索场景可以发现,美团的搜索场景下用户需求和服务商家大多是面向本地,而生活服务领域业务非常细碎,相对用户对生活服务某个领域的需求而言,本地化供给相对较少。

①对用户的查询面临着复杂的需求场景

②对平台的供给需要兼顾供给建设特点和发展阶段

下面,我们将从离线到在线全面的介绍查询改写任务下的各模块技术的迭代。

高质量的数据可以显著改善头部流量的改写效果,并且决定了后续模型性能的天花板。在候选集生成方面,基于搜索日志的挖掘、基于翻译思想、基于图计算、基于Embedding都是工业界和学术界常用的方法;在候选集过滤判别方面则有句间关系分类、Embedding相似度计算等方法。我们结合美团搜索场景总结了各个方法的优缺点,并在每个挖掘算法组件都结合了用户行为和语义两方面信息,下文将对离线语料挖掘做具体介绍。

搜索日志挖掘是工业界常用的同义词获取手段,挖掘的主要方向有:

BERT[8]自提出以来深刻改变了自然语言处理领域的研究应用生态,我们尝试了一些使用BERTEmbedding的方法,其中比较有效的是通过Fine-Tuning的Sentence-BERT[9]或SimCSE[10]模型获取词向量。

BERT计算语义相似度是通过句间关系下游任务完成的,方法是用特殊字符将两个句子连接成一个整体做分类,带来的问题是使用时需要两两组合造成大量冗余计算,因此不适合做语义相似度搜索或无监督聚类任务。Sentence-BERT借鉴了孪生网络模型的框架,将不同的句子输入到两个参数共享的BERT模型中,获取到每个句子的表征向量,该向量可以用于语义相似度计算,也可以用于无监督的聚类任务。

我们实践的方法基本与Sentence-BERT思想大致相同,使用下图中左图的方法构造有监督的改写对训练数据,用右图的方法在不同意图类型的历史搜索Query进行向量计算。

相比于前面的方法,双塔结构BERT的方法捕捉语义的能力更强,并且有监督训练的方式结合一些模型结构上的调整,能够减少各类漂移严重的Case。此外Sentence-BERT不依赖统计特征和平行语料,在任何业务上均可以比较方便的迁移和Fine-Tuning,对一些冷启动的业务场景非常友好。在此基础上利用Faiss[11]向量检索方法构建离线检索流程,能够支持在亿级别候选池中高效检索,通过该方法构建的改写候选能达到千万甚至亿级别数据量,且实测准确率较高。近几年的对比学习等方法在文本表示领域不断刷新榜单,从向量构建和向量交互方式等方面均可做持续的探索。

从以上多个途径的挖掘方法中可以得到千万级别的相似词对,但仍然有大量语义漂移的Case,其中近义词漂移问题最为严重。原因是Embedding基于相同上下文的假设太强,而近义词的上下文很相似,包括在商户和商户类目的上下文(一个商家通常会提供多种服务)以及用户Session换词的上下文相似(用户在某一类意图下多次浏览意图下的概念),因此很容易挖掘出“大提琴”→“小提琴”这种同位词Case,并且加大了从用户点击行为或意图分类等其他维度过滤恶劣Case的难度。

而图方法由于侧重于关联性而忽略了语义漂移问题,在一些搜索量小的Query节点上边关系较少,导致比较如“电动车上牌”→“电动车专卖”等Case,并且相似度分数没有绝对意义。为了从语义维度过滤类似的疑难Case,我们通过引入BERT的语义信息来解决这类问题。BERT使用预训练+微调的思路来解决自然语言处理问题,模型特点除网络更深外,双向语言模型的设计思路可以更好的利用上下文信息避免同位词漂移问题。下面介绍查询改写任务中对BERT句间关系任务做的一些探索。

在BERT提出之初,我们用挖掘数据和少量人工标注数据在美团场景语料预训练的MT-BERT[12]做句间关系任务的两阶段Tuning。而在实践中发现在现有挖掘数据上训练得到的模型在某些Case区分度不高,如我们之前提到的“大提琴”→“小提琴”以及“葡萄酒”→“葡萄”这类字面编辑距离不大的Case。因此如何构建高质量的正负例数据是逼近BERT在查询改写任务性能上限的关键。

整个协同训练的流程是:

在实际实验中,协同训练在迭代3轮后收敛,在人工构建的Benchmark集合上前两轮BERT和NMT效果提升明显,最终的效果明显好于直接使用训练样本+人工标注数据Tuning。

协同训练可以有效解决“葡萄酒”→“葡萄”等字面文本相似度较高的Case,但噪声数据频率较高的“马琴”→“二胡”这类字面匹配不明显,上下文比较相似的同位词Case仍然存在。这里使用了关系抽取的方法针对性的挖掘了这类疑难Case。例如针对同位词负例的挖掘使用了一些Pattern的方法,挖掘UGC中提到“如A、B、C等”类似的句式,经过过滤后构造高质量的同位词负例数据。经过负例数据的优化,模型准确率得到进一步提升。

最终,BERT语义判别模型的训练过程分为四个阶段:①无监督:使用美团场景的语料在BERT模型基础上进行ContinueTrain;②半监督:使用算法挖掘的数据进行Co-trainingTuning;③样本增强监督:使用人工挖掘的高质量负例Tuning;④使用人工标注的数据做最终的Tuning。最终模型的准确率达到了94%以上,解决了大量语义漂移Case。

随着美团业务场景的丰富,电商类型的搜索和供给流量占比开始变高,商品领域的误改写问题开始增多。通过分析用户Query和改写的Case发现上述模型不能很好的迁移到商品领域中,主要的原因除了训练数据的覆盖外,商品搜索场景下用户搜索商品对应改写的要求是同一事物,对改写的准确率要求更高,而是商户场景用户表达的是需求,对应改写的要求是表述需求相同即可。此外从Document角度看,商品召回字段较单一,不存在商户搜索时一个商户对应多种服务的问题,场景简化后算法空间是比较大的。因此单独对商品领域的改写判别模型做了优化:

通过以上几种挖掘手段,结合判别模型进一步提高准确率后能够得到数据量约千万级别的高质量改写对。但线上词典的应用方式泛化效率低下,下文会阐述如何通过线上模型进一步提高查询改写的整体效果。

美团查询改写线上有以下几种方案:(1)高精度的词典改写;(2)较高精度的模型改写(统计翻译模型+XGBoost排序模型);(3)覆盖长尾Query的语义NMT(神经网络翻译模型)端到端生成改写;(4)覆盖商户名搜索流量的在线向量化检索。

词典改写是业界通用的方法,需要注意的是同义词替换需要结合上下文信息,比如“百姓”和“平民”单独看是可以同义的,但在“百姓大药房”和“平民大药房”中则是一个严重漂移的改写,在对词典改写类型分类后结合实体识别信息设计策略可以解决大部分此类问题。下面的篇幅将对美团搜索查询改写的后三种在线模块分别做介绍。

通过离线挖掘改写Query的方式存在的问题是覆盖不足,但是一个Query里包含的短Term可以进行改写,例如生活服务领域常见的例子:“XX坏了”=“维修XX”。从这个角度思考可以将查询改写任务抽象为一个典型的机器翻译任务。可设定$f$为用户搜索词,$e$为目标改写词,SMT整体可以抽象为一个噪声信道模型,根据贝叶斯公式求解SMT公式推导:

最终,线上的整体框架类似业界经典的的LearningtoRewriting框架[17-18],模型上线后对线上的有改写流量覆盖占比有近12%的提升,在QV_CTR等指标上获得了非常可观的收益。

在线上引入同义词替换、SMT统计翻译改写后,线上有改写的流量覆盖率接近70%。但在中长尾Query中仍然有覆盖不足的情况,主要由以下两类问题导致:

从以上问题出发,需要一个不依赖候选的生成式改写模型,我们考虑使用深度语义翻译模型NMT来解决这类问题。

2016年年底Google公布的神经网络机器翻译(GNMT)[19]宣告了神经网络机器翻译性能超过1989年的IBM机器翻译模型(SMT,基于短语的机器翻译模型)。推动这一巨大发展就是引入Attention机制[20]的SequencetoSequence(Seq2Seq)的端到端模型。但在实际的使用中发现,NMT生成的改写词存在不符合语义(生僻或不通顺)以及改写有语义漂移两个问题,导致在线上新增改写的有效比例低,甚至会导致严重的漂移Case。因此要引入NMT做改写必须结合搜索的使用场景对以上两个问题做优化,目标是生成无意图漂移、能够产生实际召回影响的改写词。基于以上问题分析和思考,通过引入环境因素引导NMT生成更高质量的改写是大方向目标,从这个角度出发我们调研了强化学习的方法。

强化学习的过程是一个智能体(Agent)采取行动(Action)从而改变自己的状态(State)获得奖励(Reward)与环境(Environment)发生交互的循环过程。我们希望借助强化学习的思想,将预训练的NMT改写模型作为Agent,在强化学习迭代的过程中其生成的改写(Action)通过搜索系统(Environment)产生最终的曝光和点击(Reward)来指导NMT优化模型参数(State)。

下面详细介绍算法模块设计和流程:

Step0预训练NMT生成器

Step1原词改写词输入环境计算反馈

Step2打分器对环境产生的反馈做权重加和。

根据环境给的反馈分数基于权重叠加后生成归一化的Reward,这里根据业务场景和实际问题做了多轮迭代,设计了加权的反馈打分器,分别给搜索、用户行为、语义判别、字面匹配度几个方面不同的权重,最终归一化到0-1之间作为最终的反馈。

Step3迭代打分器结果到生成器继续训练的loss中。

根据打分器的分数将Reward叠加在NMTFine-Tuning的模型Loss中,这里对比了几种方法,其中Google用Batch的平均句子长度对加和平均的Loss做归一化叠加方式效果最好。

通过上线后的效果分析,引入强化学习的NMT可以解决语义类型改写(挑筋→拨筋,劳动争议→劳动纠纷,柴火烧→柴火灶),生僻的简写(法甜店→法式甜点,足指→足部指甲),输入错误导致的简写(瑜教练→瑜伽教练,桑洗浴→桑拿洗浴),自然语言类型Query去词(染发剂哪里买→染发剂,祛斑哪家医院好→祛斑医院)。

向量化召回随着Sentence-BERT,SimCSE等向量表示方法近期在学术界的刷榜,逐渐有越来越多的公司开始尝试大规模应用起来,如Facebook[23]、淘宝搜索[24]、京东[25]等。得益于预训练模型表达能力强等特点,对比传统的DSSM等方法有更好的泛化能力和准确度。

在改写场景使用向量召回还有两个优点:一方面Query和改写词较短且长度相近,并且语义和类型较一致,参数一致的双塔即可保证一定的准确率;另一方面改写词从候选池中检索出来而不是生成,可以控制改写词的有效性以及限制语义类型。通过分析美团搜索的漏召回问题发现商户名精搜漏召回问题较大,此外考虑到美团场景下,商户提供的服务丰富、Document端文本较长意图较分散的问题,我们先在商户意图下文本不匹配导致的少无结果问题中尝试了向量化召回(下文称为“模糊改写”)并取得了非常好的效果,下面将进行详细介绍。

首先对这类Case做归纳总结,认为模糊改写要解决的问题是:用户有明确商户意图时,因文本不匹配,或NER切分错误导致无结果、漏召回问题,这类Case用户意图明确但Query表述模糊。例如:搜索“九匠和牛烧肉”未召回POI“九匠精酿烤肉”、搜索“宁波莱斯小火车”未召回POI“宁波火车来斯主题公园”。这类问题混合了多种文本变体,难以在现有结构化召回框架内解决。确定问题的边界后,总结这类Case有以下特点:(1)Query是多变的,但商户名召回池是有限且确定的;(2)Query和商户名文本长度较短,非常适合向量化召回算法;(3)可以摆脱现有布尔检索召回框架的限制,避免简单文本匹配导致漏召回。因此我们制定了以向量召回为基础的模糊改写流程:

下面会着重介绍模糊改写的核心模型以及线上服务处理流程两部分。

向量Pooling:根据BERT模型各层越远离下游任务泛化能力越强的特性,经过多次实验验证使用倒数第二层向量做AvgPooling后输出的结果有更高的准确率和召回率。

Loss函数:Loss选用了BinaryCross-Entropy的PointwiseLoss函数,原因是对于有标准商户名Label的情况下,模型预测改写商户名“绝对正确”的性能好于Pairwise预测“相对正确”的改写商户名。在实际的对比实验结果中也体现了这一点。

线上服务搭建:如图12所示,线上分为前置流量划分模块、Query端的在线文本向量化、ANN向量检索以及后置规则四部分。

模糊改写项目上线后,对“九匠和牛烧肉”未召回POI“九匠精酿烤肉”这类目标Case解决很好,在用户搜索商户名时出现换字、多字、少字的情况泛化能力很强,并且训练数据中加入同义词替换后也解决部分同义字、同义词替换的漏召回问题。从线上效果看,QV_CTR、无结果率以及长尾BadCase等指标上均有较大收益,有效改善了这部分流量的用户搜索体验。

本文介绍了美团场景下查询改写任务上的探索和实践经验,在垂直领域搜索召回这一课题上结合实际业务场景和用户需求探索了语义判别模型、语义检索模型、图模型等前沿算法技术,积累了生活服务领域短语关联认知数据。其中在离线数据部分介绍了策略、统计翻译、图方法和Embedding等多种技术角度的挖掘方法,并对总结了各个方法在实践过程中的出发点、效果和优缺点。在线模型方面结合垂直领域搜索的结构化检索特点,设计了高精度的词典改写、较高精度的模型改写(基于SMT统计翻译模型和XGBoost排序模型)、覆盖长尾Query的基于强化学习方法优化的NMT模型、针对商户搜索的向量化召回四种线上方案。

如何更好地连接用户和平台上的服务、商家、商品是一个需要长期和多方面投入解决的问题。我们未来可能会进行以下几个方向的迭代:

THE END
1.秋隐宠物生活专营店欺骗消费者,虚假宣传黑猫投诉已分配商家 美团客服小美 黑猫消费者服务平台审核通过 洞察喵发起投诉11-24 18:29:14 我于2024年10月20日在美团名为“秋隐宠物生活专营店”买了一盒宠物避孕药。商家标注“不避孕可退款”,并且没有在商品主页标注避孕概率。我就下单了,在商品到货后我第一时间按照说明书的指示给狗狗按次按量喂了避孕药。(可以保...https://tousu.sina.com.cn/complaint/view/17377808573/?sld=315ff3c492bf2bf42ad7ba49120759f7
2.鄙视包图片下载鄙视包设计素材鄙视包图片大全主题:12月元素不限主题2 标签: 黄色小人黄色表情包黄色小人可爱表情包素材装饰素材可商用简约无语难过鄙视开心笑图标元素 4、 小汪可爱卡通动物微立体微信手机表情包 主题:卡通形象-表情包(要求辨识度高、微带立体感) 标签: 可爱卡通动物小狗粉色乖巧喜欢爱你淫荡冷汗亲亲在吗/小汪狗狗开心高兴鄙视闭嘴伤心难受嘤嘤嘤无...https://www.58pic.com/zt/211829.html
3.直径:临沂兰山泄火的(临沂兰山侦破一起命案积案)暗号2024111、八宝豆豉:简称豆豉,始产于清嘉庆年间,距今已有200余年的历史。1983年被评为省优质产品,1992年获全国博览精品金奖,1995年获中国名优精品金奖。糁:即肉做的羹,因其香辣可口、肥而不腻、祛风除寒、开食健胃为众人所喜爱,早晨喝糁是临沂传统食俗。 https://www.nikka-metal.com/product/proList.aspx
1....扒皮那个实体后院商家千喵,那些说只是美容店给猫猫狗狗洗澡...【讨论】扒皮那个实体后院商家千喵,那些说只是美容店给猫猫狗狗洗澡眼睛被糊住的看清楚了。 最初我私聊管理只是觉得实体后院混进组开团购太膈应了。结果群里一堆迷惑发言?你们放心我已经退群了我家猫也不差这一口吃的。说我是抢不到恼羞成怒才捅出去的,说实话我还真看不上你们的手速嘻嘻。https://www.douban.com/group/topic/160907404/?type=rec
2.美团团购视频美团团购高清原创视频下载美团双旦团购美团团购省贵人的端午美团团购黄渤美团团购创意脑洞房地美三维宣传片美团病毒美白特效美白三件套美团花为美行动美业北京美红宝石美白美广告美白化妆品美美剧片头三渲二美漫美拉德产品殴美广告美团团购母亲节美团团购的宣传片美妆团购美团闪购红星美凯龙家具团购美妆全球购美团团团美团团团季美谷美购美甲团购 ...https://www.xinpianchang.com/search/397005
3.ljfl.gxmzkj.com/apfccd/600220.shtml为扭转颓势,星巴克采取了一系列变相降价策略,包括发放优惠券及参与美团、抖音团购等。促销过后,部分饮品价格下调至20元以下。尽管如此,高管层面仍想保持高调,并不承认星巴克加入了"价格战","我们不是在进行折扣战或价格战。我们的业务是基于社区,用高质量的咖啡创造人文联结,并创造一种体验。"创始人舒尔茨说道。 http://ljfl.gxmzkj.com/apfccd/600220.shtml
4.dijieyiren.52deepjoy.cn/apfccd95464582.shtml遇见小面顺势推出20元以下的打工人套餐,并且强调每天不重样,在美团、大众点评等渠道中,不少门店更是放出了11.9元的产品团购;陈香贵也曾多次推出9.9元一碗面的促销活动;在美团、抖音等平台,张拉拉一碗拉面的价格已经降到了13.9元。 此外,马记永、陈香贵、张拉拉都齐齐推出了"无限续面"的服务。 面馆赛道的客单价,...https://dijieyiren.52deepjoy.cn/apfccd95464582.shtml
5.www.hjclean.com/mokaka83003.html除了到店即买即提之外,消费者通过美团等渠道在线下单,最快30分钟就能用上新家电。针对大家电送装,在“旧机免费回收,送新取旧一站完成”基础上,消费者还可享受“中央空调10免服务,明装采暖24小时急装,指定热水器免安装材料费”等服务权益,省心满足冬日取暖需求。https://www.hjclean.com/mokaka83003.html
6.www.58co.cn/newxr50391822/28358470.htm这两年大量的餐饮品牌倒下,又有大量的新品牌进场,唯一不变的是迎合消费者看重“性价比”的消费心理,开始打价格战——高端餐饮推出低价套餐,快餐和外卖推出价格更低的爆品团购。信息技术:-/ 网民就是想找个人攻击,发泄对自己失败人生的不满,无所谓是谁。:&;! 2...http://www.58co.cn/newxr50391822/28358470.htm
7.m87.bjzjxf.com/newxr59490636高频需求入口让美团成为餐饮商家构建品牌线上阵地的必然选择。今年暑假,麦当劳联合美团探索"321"增长模型,打造3个直播场与2个分销场的精细化运营,在一个营销周期内实现门店美团团购交易额同比增长151%。,|$ 极客公园:你们现在在工业领域有哪些落地?_@| 而对于年龄约束的原因,济南一位房屋租赁中介认为,这种现象普遍...https://m87.bjzjxf.com/newxr59490636
8.竞品分析报告(10篇)1)美团网美食、电影等团购内容日趋成熟,略有欠缺的是积分体系,仅仅通过订单评价获得与消费额相等的积分,如果增加每日打卡,用户互动等功能可以有效鼓励用户每日登陆,增加用户黏度,增强用户荣誉感。 2)增加点餐功能。现在很多团购用户,包括非团购用户到店点餐时,点完餐需要很长的等待时间才能上菜,导致用户等待时间太长...https://www.ruiwen.com/fenxibaogao/6306515.html
9.垫江萌宠咖宠物店(桂冠花园店)电话,地址,价格,营业时间(图)该条评论来自美团 2024-09-01 16:29 匿名用户 垫江猫猫狗狗洗澡洗得比较好的一家店了,环境不错。店员对宠物也很温柔,手脚轻,不会吓到猫咪,整个过程都是温温柔柔的,猫咪一点儿应激反应都没得,很不错! vc_pet_tag_module: dotSource: vc_pet_breed_module: ...https://www.dianping.com/shop/131184632
10.网红汉堡ShakeShack开业数周热度锐减,中国西式快餐的本土化之路走到...网红博主们通过精美的照片及有声有色的视频介绍,再配上相关文字描述,可以对消费者造成视觉冲击,引起消费欲望。网民在哪,流量就在哪,因此,西式快餐品牌的营销需要紧跟潮流,在消费者活跃的地方布局营销,通过折扣券组合、会员卡打折、赠送礼品、节日优惠、团购优惠、明星代言等方式吸引新用户,留存老顾客。https://www.iimedia.cn/c460/85593.html
11.mhfx.menhoo.cn/apfccd92508670/496577.shtml老人洗澡自拍xxx互摸 台湾三圾片 64.75MB 47%好评93人) BBrB干BBBBBBBBw 国模拳交 尻妣打炮 49.19MB 65%好评48人) 女人自熨全过程 狗狗进去的时候很涨 小东西我们3个一起C好不好 22.00MB 48%好评197人) 小草影视在线观看 美女内射AⅤ 含羞草最新版本 20.07MB 37%好评319人) 麻豆免...http://mhfx.menhoo.cn/apfccd92508670/496577.shtml