用户画像学习笔记Iris^

一个比较成熟的画像系统会有成百上千的标签,这些标签的生产不是一次完成的,而是随着业务的发展需要,逐步补充完善,最终呈现在大家眼前的就是一棵庞大的标签树。

图11-2用户画像整体架构示例

1.基本属性

基本属性是指一个用户的基本社会属性和变更频率低的平台特征,例如真实社会年龄、性别、婚姻状况、昵称、号码、账号、IBS等标签。这些标签类型多为直采型,可从用户基本信息表中直接获取,不需要统计或者算法挖掘。示例:社会性别_女。

2.平台属性

平台属性是用户在平台上表现出的基本属性特征,是利用用户行为进行算法挖掘,标识用户真实属性的标签。

典型的平台属性标签有平台年龄标签,这里你可能有个疑问,为什么在用户的基础属性中已经有年龄标签,但在平台属性中又有一个呢?这就涉及两者之间的差别。设想一个真实的场景,一个用户的社会年龄为20岁,但他喜欢中年人的穿衣风格,在使用App购物的时候,表现出的真实偏好是30~40岁的。对于这类使用产品时表现出的用户心智和真实年龄不相符合的用户,如果只采用用户上传的基本属性来为其推荐产品,是不是很难命中个体用户的兴趣呢?

两种不同的标签,本质上是用户自己上传信息的随意性和挖掘信息的权威性差异,是用户社会属性和真实属性差异。我们仔细分析一下两者在数据源、计算逻辑、标签格式、标签值和应用场景等方面的差异,如下。

(1)数据源与计算逻辑方面基本属性直接利用用户自行上传的、存储在用户基本信息表里的数据,平台属性则利用客户端或者服务端埋点上报采集的用户行为数据进行挖掘计算生成。基本属性是典型的直采型标签,平台属性是典型的算法挖掘型标签。

(2)末级标签和输出标签值方面以性别为例,基本属性代表用户真实的社会身份,是确定的事实,典型标签形式为“性别_女”,而平台属性则代表用户在性别维度的偏好概率,典型形式为“性别_女_0.80”,其中“女”为末级标签,“0.80”则代表用户在平台的女性身份上表现出的倾向程度。

3.行为属性

4.产品偏好

产品偏好是对用户使用某些产品、产品核心功能或者其他渠道的偏好程度的刻画,属于挖掘型标签,其中产品的选取可以包括自家产品、竞品;功能和渠道既包括站内产品功能,也包括push、短信、开屏、弹窗等几大运营和产品法宝。示例:搜索模块偏好、直接竞品_京东偏好、短信偏好。

5.兴趣偏好

兴趣偏好是用户画像内非常重要的维度,以电商产品为例,用户对商品的喜爱程度是用户最终的信息之一,兴趣偏好是对用户和物品之间的关系进行深度刻画的重要标签,其中最典型的是品牌偏好、类目偏好和标签偏好。示例:品牌偏好_优衣库_0.91、类目偏好_美妆_0.80、标签偏好_红色_0.70。

6.敏感度

在做营销活动时,我们留意到有些用户不需要优惠也会下单,而有些用户一定要有优惠券刺激才会下单,而且优惠券的额度会影响其下单的金额。这种情况下,如何识别出对优惠敏感的用户并为其发放合理券额的优惠券,保证优惠券不浪费,从而使促销活动的ROI最大?其中一个很重要的标签就是用户的敏感度标签。敏感度代表用户对平台活动或者优惠的敏感程度,也是典型的挖掘类标签。示例:热点敏感度、折扣敏感度。

7.消费属性

8.用户生命周期及用户价值

用户生命周期是用户运营的重要法典,一个用户从进入产品到离开,通常会经历“新手”“成长”“成熟”“衰退”“流失”这5个典型阶段,每个阶段对用户的运营都存在策略差异,画像在其中的作用是明确标记用户所处生命周期的阶段,便于后续业务人员落地。用户价值是体现用户为产品贡献价值高低的标签,最经典的是通过RFM模型获得交易维度标签,此外,也应该看到用户的其他价值,例如为产品贡献活跃度,通过裂变拉来新用户,这些都可设计相应的标签。示例:新手、成长、成熟、衰退、流失、高价值用户、VIP等级等。

二、用户画像从1到100的构建思路

用户画像的主要目的有以下3个:

·用于用户信息的统计,建立对产品、对用户的基本认知;

·用于用户定向营销,利用人群圈选投放物料;

·用于算法,沉淀用户特征,供模型使用。标签的完善也可以按照这3个维度不断丰富。

1.用于统计,对产品、对用户的基本认知

每个产品功能策略的完善,都需要建立在对产品、对用户的充分认知基础上,也就是说,用户是谁,有何特点,基本情况如何,这些是用户画像需要回答的重要问题。

思路拆解:既然要了解用户的基础信息,就需要将用户基本属性进行拆解,包括年龄、性别、居住城市(几线)、家庭结构(婚否、孩否)等。为了盈利考虑,还需要了解基本的收入水平、消费能力等。将拆解的维度抽象,构建对应标签,然后进行分布统计,便能生成一份基本的用户认知报告。

标签结果:年龄、性别等。

2.用于定向营销和精细化运营

运营人员作为画像的重要业务适用方,每天都会通过标签圈选人群,做定向的用户、活动、内容精细化运营,以及各app每天都在进行的促销活动。这些运营和活动的场景分布在产品的各个渠道和各个资源位,对场景和人群的精细程度要求都很高。

举一个日常工作中最常见的需求,通过一次数据分析发现,产品的流失用户占比提升,经过讨论,大家认为一次结合利益点的push推送是召回流失用户的有效且快速的手段;同时push作为各个业务都在争取的有限资源,希望可以提高使用效率,确保push这个资源渠道的整体roi。以上需求希望画像可以支持。

思路拆解:从这个需求背景中,我们做一次关键词提取,不难发现,关键词是“流失用户”“利益点”“push”“效率”。其中“流失用户”是用户身份识别,“利益点”是用户优惠敏感度,“push”是产品渠道资源,“效率”意味着要尽可能确保圈选人群精准,不能为了覆盖率牺牲准确率。

具体落地步骤如下:

第一步,确定流失用户的口径和标签。这里需要用到用户生命周期的划分,从中识别并标识出流失用户。

第二步,分析对流失用户拉回效果最好的利益点。例如优惠券、折扣、礼品或其他内容。这一步需要运营和数据开发人员根据日常经验和数据分析完成,对于画像的要求是基于分析结论,挖掘不同用户对于优惠折扣的敏感程度,这一点在前面介绍敏感度标签时有论述,最终目的是确保将每一分钱都花在刀刃上。

第三步,确定拉回的明确目标。是拉回规模还是准确率。通过需求分析可以确定,本次拉回在资源有限的情况下,需要提升人群识别的准确率。画像实现准确率的方法有两个,一是提升画像算法的准确率,这部分主要依赖算法本身,无法一蹴而就,因此这里选择第二个方法,即增加人群圈选的条件,也就是新增标签,供圈选求交。

根据背景分析,我们可以增加流失用户关于push渠道打开意愿的标签,提高push资源的使用效率。

经过上述分析,需要生产的标签如下:

·用户生命周期_流失

·用户折扣优惠敏感度

通过以上需求分析和思路拆解,画像的建设过程应该比较明确了,这里再留一个思考的案例,可以尝试分析如何落地:平台新上一款商品,初期需要在某模块展示给目标用户做推广,同时尽量不打扰非目标用户,且不降低该资源位的整体转化效率。思路拆解:商品的目标用户——商品可以按照哪些维度拆分关键信息?模块位置——用户的模块功能使用偏好是什么?准确率的要求——如何提升画像应用的准确率?回答好以上问题,这个需求的标签便能顺利获得。

思路拆解:召回的作用是粗筛,帮助推荐系统计算第一道用户兴趣池。这里用户对物品的兴趣可拆解为对商品品牌、类目和商品标签的兴趣,这就转化为前面介绍的内容了,用户标签中有品牌偏好标签、类目偏好标签和标签偏好标签,只需要在所有品牌、类目、标签下维护一个按照商品质量或者热度降序排列的列表,这样只要获取到用户标识,便能从用户画像中获取偏好的品牌、类目和标签。再从品牌、类目和标签下的商品列表中召回相应的商品,根据候选集大小的设计,做topk截断召回。这样,这部分商品就完成初步的召回,为进入下一个流程进行粗排和精排做好了准备。

三、单个用户标签的做法

1、用户标签的生产流程

(1)标签定义:给出标签的定义,即发生什么行为的用户可以打上这个标签。

一个用户标签是由用户的不同历史行为组合而成的,可以写成y=∑fn(x),其中fn(x)是单个的用户行为。所以标签的定义主要是指这个标签包括哪些用户行为,这些用户行为以什么方式组合计算。

(2)用户行为获取:探究不同的用户行为的获取难度,包括怎么获取数据、怎么处理数据。

因为获取到的用户行为是给算法或者规则计算用的,所以获取的用户行为五要素中,内容要经过结构化后才算是获取了一条有用的数据。

商品结构化后,会有商品标签;促销方式结构化后,会有促销标签。

2)数据质量检查。数据从采集到使用的过程中会出现各种数据质量问题。在获取数据时,要先做数据质量的检查和改善,需要注意以下几点:

·人工标注的数据质量;

·中间过程中使用算法计算的环节会有准确率的问题;

·如果是用户人工填写/选择,也会有错误、不全等问题;

·数据处理流程中的无效、失效数据。

3)基础数据获取。内容结构化和数据质量检查可能需要一些新数据,而这些数据需要开发新功能才能获取到,这个开发新功能获取新数据的过程就叫基础数据获取。

(3)模型设计:经过分析,确定了哪些行为之后,就可以进行模型的设计。

(4)标签计算:对原始用户行为数据进行计算,生成标签。

(5)标签评估:对生产的标签进行评估,看准确率、覆盖率等指标是否达到预期。

图11-3用户标签的生产流程

四、算法标签的一般生产流程

1、标签定义分析

示例如下:

用户标志_偏好_类目偏好_衣服_0.83

用户标志_偏好_类目偏好_帽子_0.12

这里的“0.83”和“0.12”就是我们需要计算的标签属性值。

2、用户行为获取(特征探查)

用户行为获取的难点和重点有两个:新用户行为如何获取,是否用户的全部行为都需要参与计算。

(1)新用户的行为如何获取新用户行为的获取方式有以下两种。

(2)是否全部行为都需要参与计算

这个问题的答案一定是否定的,尤其是画像建设初期,不宜一次加入过多特征训练,因为结果很难把控。行为特征选择依据,可以参考两个标准。

·该行为是不是影响用户决策的核心因子。

·该行为是否稀疏。很多行为虽然重要,但因为操作门槛高,数据稀疏,一样影响模型的训练,初期可以不引入。

3、模型设计

(1)标注数据

(2)训练集建模

1)明确哪些特征属于重要特征

仍以电商为例,特征一共分为4个维度:用户的特征、物品的特征、用户—物品的多维特征和环境特征。在每一个维度内,最能影响业务表现的特征是什么,这是产品经理要明确的问题。

例如某个以GMV为优化目标的商品列表场景,影响最终收入的因素如下。

·用户侧:用户的年龄、性别、经济能力、客单价和历史订单GMV等,这些都属于影响用户付费的重要因素。

·物品侧:除了物品的文本、图片信息外,价格和近期价格变动以及优惠程度也是重要特征。

这些重要的业务特征,都需要产品经理通过数据分析和日常经验的积累,转化为模型的特征,帮助算法更好地输出符合需求的结果。

2)评估特征的权重值是否符合业务认知人工提供有效特征是建模前的步骤,算法在训练完成后,也会输出各特征所对应的真实权重,当算法输出特征和对应权重的时候,产品经理一方面需要根据自己的经验,判断这些权重的合理性;另一方面,需要从这些特征中抽象出真实有效的决策信息,沉淀为自己的经验,便于建立更完整的业务认知。

(3)测试集验证

除了auc等离线测试算法的指标以外,具体还需要在线上进行a/b测试。

(4)画像加工

1)确定衰减方案

2)更新频率

3)数据归一

经过以上步骤,便可以得到一个动态的、不断更新的、准确的偏好标签了。

五、加入内容标签的用户标签生产流程

比如,要定义标签“宠物行业偏好”,可以拆为以下用户行为。

用户行为三:购买宠物类别的商品。

用户行为五:……

另外,最好把用户历史行为数据找出来验证,看看自己的定义对不对。

2、内容标签制作

(1)内容标签制作方法

1)直采型

·b端用户输入;

·c端用户输入;

·公司职能部门输入

2)规则型

3)算法型

·直采型:人工标注团队输入;

·直采型:客户输入;

3、用户标签模型设计

·直采型

·统计型

·挖掘型

六、用户画像的效果验收

线上部分:a/b测试

离线部分:算法指标验收、分布验证、交叉验证和抽样评测四种方案。

1、算法指标验收

算法指标是对算法能力的评测,例如机器学习,常用指标为AUC、AUC提升率、召回率及准确率四大指标。AUC是算法的常用指标;提升率则是跟之前的迭代对比,评估本次的提升幅度;召回率和准确率是算法基础指标,用以评估标签的覆盖情况和准确情况。

2、分布验证

分布验证是算法标签的过程验证方法,一个算法标签做完,输出结果是海量的“用户标识–分值”对,如何验证这些“用户标识–分值”和合理性呢,方法是选取待校验的标签和标签值,再选取最能影响用户在该标签分值的一个单点行为,比较分值和行为在用户轴上的分布情况。

以类目偏好标签为例,如图119所示,第一个分布图横坐标是用户,纵坐标是类目偏好的分值;第二个分布图横坐标也是用户,纵坐标则选取最能代表用户对类目偏好程度的下单行为——用户订单量。将两者进行对比。

图11-9标签用户分布与真实行为分布对比

可以看到,用户和具体标签值分布呈现“L”型,用户和用户订单量呈现“S”型,两者存在较大的差异。这里值得一提的是,分布验证是过程验证方法之一,不是衡量线上最终效果的唯一指标,有些情况下不能一概而论,认为标签错误,但是可以作为标签的一个重要优化方向。

3、交叉验证

交叉验证的前提:用已经验证过的正确标签和新标签做交叉,得到较为综合的用户特征,再根据经验判断新标签是否合理。

4、抽样评测

例如在用户兴趣偏好标签输出后,统计用户3个月内不同类目标签的点击次数(点击行为比较能够代表用户的意愿),如果兴趣分值高但实际点击次数非常低,则认为标签是有问题的。没有问题的数据占比即是抽样评测的准确率。

七、标签系统注意事项

1、做好mvp测试机制

MVP是指最小可行性产品,本质是为了加快迭代速度,以便获取认知。

THE END
1.宠物行业用户画像分析综上所述,宠物行业的用户画像显示出一个年轻、女性化,且具有较高消费能力和追求高品质生活的特征。宠物主人重视宠物的健康和舒适生活,愿意为宠物投入更多的时间和金钱。同时,他们通过社交媒体平台获取信息和做出购买决策,这为宠物行业的品牌营销提供了新的机会和挑战。 https://www.sgpjbg.com/task/2725741.html
2.抖音商机与用户画像平台内容类型及实操步骤解析平台上推广的产品和项目。公司LOGO推广项目更受抖音用户欢迎: 1、潮流品牌鞋服、奢侈品箱包、珠宝玉石、手表、护肤化妆品、魔术道具、指尖陀螺、照片拼图、手机键盘等个性化玩具以及手柄、旋转笔、个性化打火机等; 2、活体宠物及宠物周边设备; 3、女性个人护理、减肥、丰胸、增高、祛斑、美白等; 4、民宿、青年旅社、...http://www.xm8168.com/h-nd-335892.html
3....行业2023.9月份月报内含宠物行业搜索热点用户画像等【小红书】宠物行业2023.9月份月报 | 内含宠物行业搜索热点、用户画像等 发布时间:2023-10-24发布人:宠老板上一篇:宠老板教您注册认证服务号 常见问题 视频教程 宠老板教您注册认证服务号 门店营销_(7.0版本 · 手机... 打印设置_(7.0版本 · 手机... 系统设置(7.0版本 · 手机端... 如何添加店员_(7.0版本 ·...https://www.chonglaoban.cn/question/910.html
4.北斗卫星赋能,宠物定位新篇章—追踪宠物,不再是难题摘要:在宠物定位方面,北斗卫星系统的介入则是一次技术革新。传统的宠物追踪多依赖于射频识别(RFID)技术或蓝牙等短距离无线通信技术,这些技术虽然有其便利性,但定位范围有限,一旦宠物跑出设定的范围,便很难再次定位到精确位置。而北斗卫星定位技术具有的高精度和全球覆盖的特点,为解决这一难题提供了可能。 https://www.qxwz.com/zixun/884111833
1.2024宠物经济行业市场发展现状及消费者画像分析2024宠物经济行业市场发展现状及消费者画像分析 近年来,中国宠物经济行业市场规模持续扩大。随着社会经济的发展,人均收入水平逐渐提高,使得宠物成为越来越多家庭的成员,宠物数量不断增长。从全球来看,人均宠物数量与GDP呈现正相关,美国人均GDP最高,人均宠物猫和狗数量也为全球最高。对比成熟市场,国内宠物数量还有很大的增长...http://bolg.vip0797.com/post/37490.html
2.AI养宠:如何重塑宠物照护的未来用户界面:开发移动应用,使用户能够与智能设备互动,接收宠物健康和行为的实时更新。 13.安全技术 数据保护:确保宠物和宠物主人的数据安全,防止数据泄露。 这些AI技术的结合使用,使得智能养宠行业能够提供更加个性化、高效和科学的宠物护理解决方案。随着技术的不断进步,未来智能养宠行业将能够提供更多创新的服务和产品。https://blog.csdn.net/linzi_a1/article/details/143632087
3.那些跨界到宠物赛道的巨头们,混的咋样了?宠吾代近日,美的集团旗下全资宠物电器公司浙江美新宠物科技有限公司进行了简易注销。 然而这一举动并非突如其来。早在2023年的时候,便传出美的将退出宠物业务的消息,其官方旗舰店宣布闭店,如今仅在家用电器官方旗舰店附带销售少量宠物款电器。 追溯过往,美的早于京东平台设立了宠物用品旗舰店,推出了包括宠物饮水机、空气净化...https://www.shangyexinzhi.com/article/23121266.html
4.2024年中国宠物行业研究报告界面新闻·JMedia人工智能、物联网、大数据等技术的快速发展,为传统宠物用品的智能化提供了技术支持。这些技术的应用不仅提升了产品的功能性,也增强了用户体验。宠物智能用品通过解决宠物主在时间、健康监测、安全、娱乐、便利性等方面的痛点,提高了养宠的质量和便利性,同时也推动了宠物用品市场的创新和发展。2024年,中国宠物智能用品市...https://www.jiemian.com/article/11967023.html
5.宠物洗护赛道热点洞察,探寻3000亿蓝海市场新机遇1.宠物洗护电商渠道分析:国内宠物行业消费市场规模逐年增长,2024年国内宠物消费市场规模预计为3000亿元。 2.重点品类市场分析:2024年1月至9月,狗狗沐浴露总销售额达2.85亿元,1月-6月需求增长明显。 3.消费者行为洞察:日常基础护理依然是消费者选购宠物洗护用品的核心驱动力,功能成为消费者关注重点。 https://www.lanhaiqingbao.com/suibi/36261.html
6.产品研究68款宠物APP产品分析:宠物行业的巨浪淘沙通过对用户地域分布以及用户属性各方面的分析,最终得出有关养宠主的用户画像,将养宠主分成三种不同的人群并代入详细的用户情景中,得出养宠主基本是为了陪伴,并且都是把当做自己的亲人甚至是孩子,正因为如此,基本上养宠主也会对自己的宠物格外的呵护,愿意花费时间和金钱去陪伴它们。 https://maimai.cn/article/detail?fid=1368921073&efid=jmMz1_nUCqB92B3wjI5FXg
7.美国Mac用户画像:2023年57%新购用户来自PC等其它平台IT之家 3 月 14 日消息,市场调查机构 CIRP 调查了 2023 年美国笔记本电脑和台式机的购买情况,发现去年购买 Mac 的用户群体中,57% 来自 PC、Chromebook 等其它系统。 35% 的 Mac 新用户来自 PC,这比安卓用户转用 iPhone 的比例(13%)高出近 3 倍。 https://i.ifeng.com/c/8Xw5kG9huEU
8.私域用户过百万波奇宠物自有商城年销售额达数亿!零售二、波奇宠物的私域用户画像 见实:波奇宠物私域是从什么时候开始布局的? 周宇:在2013年时,我们就做了几十个QQ群,愿景也比较简单,给用户提供一个可以交流任何养宠问题的地方,当然我们也会在群内进行商品售卖。商品来源主要是我们的pc端自有商城,其次也会推送三方平台的链接,如天猫。当时并没有分层运营,管理相对简单...https://www.ebrun.com/20211210/465655.shtml
9.宠物类app用户画像分析案例资讯随着人们生活水平的提高和生活方式的改变,越来越多的人开始养宠物。宠物成为许多人生活中不可或缺的一部分,为了更好地管理和照顾宠物,宠物类app应运而生。而了解用户画像对于开发宠物类app以及提供个性化服务至关重要。本文将以一个宠物类app用户画像分析案例为例,探讨不同类型用户的特点和需求。 https://www.appzzgs.cn/newsinfo.php?id=736
10.宠物用品海外市场调研与分析详细指南4.2 用户画像: 制作详细的用户画像,了解目标市场宠物主人的特点和购物行为。 1.用户调查数据分析:分析用户调查数据,确定目标市场宠物主人的年龄、性别、偏好等关键信息。 2.社交媒体分析工具:使用社交媒体分析工具,如Facebook Insights或Twitter Analytics,了解宠物主人的在线行为。 4.3 SWOT分析: 分析您的产品在目标市场...https://m.cifnews.com/article/155054
11.2018年宠物行业市场及用户画像报告主要内容:宠物市场的总体概况;用户画像;饲养不同种类宠物的人群对比;未来宠物市场的需求分析。 随着居民意识和消费能力的提高,我国宠物产业成为新的“潜力股”,从1990年到2018年,宠物行业由萌芽期进入了快速发展期。 作为宠物行业的从业者,或者即将进入宠物行业的外来新生力量,你必须了解整个宠物行业所处的阶段以及你面...https://www.jianshu.com/p/9587272b4a2f
12.2020中国宠物经济发展现状用户画像及趋势分析(附报告下载)2020中国宠物经济发展现状、用户画像及趋势分析 空巢老人、空巢青年等社会结构的改变,以及家庭养宠观念的进步,都令宠物的情感价值得到提升,成为驱动宠物经济发展的重要力量。 2015-2020中国宠物经济发展规模数据分析 iiMedia Research(艾媒咨询)数据显示,中国宠物市场规模在2019年达到2212亿元,预计2020年将达2953亿元,年...https://www.iimedia.cn/c1020/72174.html
13.医美产业拥抱双11,医美消费生意要怎么做?线下医美机构更基于目标消费者群体在互联网医美平台上的检索行为、页面停留时间、浏览轨迹等用户行为数据进行整体分析,反哺医美机构的经营管理,提供精准的用户画像。 仍以上文所述的新氧为例,其在昨日双十一发布的《2018年双11医美消费城市榜单》,通过消费金额、居住地、性别、年龄范围和所消费的医美项目,描绘了2018年双11...https://www.iyiou.com/news/2018111485410
14.抖音反诈能力测试怎么答?抖音反诈能力测试答案大全手机软件A.短密码、常见密码、宠物名称 B.生日、结婚纪念日、电话号码等个人信息 C.工作中用到的专业术语、职业特征等 D.以上均属于弱密码类型,很容易被黑客利用密码字典破解掉 正确答案:D 5、《信息安全技术个人信息安全规范》中的“接用户画像”是指: A.使用来源于特定自然人的个人信息以外的个人信息,如其所在群体的...https://www.jb51.net/softjc/788322.html
15.哪些领域私单多?2024八大新消费趋势嘲发布优设网1. 用户画像 「爱宠之家」 他们与爱宠相依为命,生活因此变得丰富多彩,也充满了责任与关爱。他们不仅要打理好自己的生活,更要确保宠物的每一个需求都得到满足。出门在外时,智能助手成了他们最得力的帮手,帮忙照顾宠物的饮食起居。但无论多忙,他们总会抽出时间,亲自陪伴宠物,享受那份独特的情感交流带来的满足和幸福...https://www.uisdc.com/2024-consumer-trends