用户画像学习笔记Iris^

一个比较成熟的画像系统会有成百上千的标签,这些标签的生产不是一次完成的,而是随着业务的发展需要,逐步补充完善,最终呈现在大家眼前的就是一棵庞大的标签树。

图11-2用户画像整体架构示例

1.基本属性

基本属性是指一个用户的基本社会属性和变更频率低的平台特征,例如真实社会年龄、性别、婚姻状况、昵称、号码、账号、IBS等标签。这些标签类型多为直采型,可从用户基本信息表中直接获取,不需要统计或者算法挖掘。示例:社会性别_女。

2.平台属性

平台属性是用户在平台上表现出的基本属性特征,是利用用户行为进行算法挖掘,标识用户真实属性的标签。

典型的平台属性标签有平台年龄标签,这里你可能有个疑问,为什么在用户的基础属性中已经有年龄标签,但在平台属性中又有一个呢?这就涉及两者之间的差别。设想一个真实的场景,一个用户的社会年龄为20岁,但他喜欢中年人的穿衣风格,在使用App购物的时候,表现出的真实偏好是30~40岁的。对于这类使用产品时表现出的用户心智和真实年龄不相符合的用户,如果只采用用户上传的基本属性来为其推荐产品,是不是很难命中个体用户的兴趣呢?

两种不同的标签,本质上是用户自己上传信息的随意性和挖掘信息的权威性差异,是用户社会属性和真实属性差异。我们仔细分析一下两者在数据源、计算逻辑、标签格式、标签值和应用场景等方面的差异,如下。

(1)数据源与计算逻辑方面基本属性直接利用用户自行上传的、存储在用户基本信息表里的数据,平台属性则利用客户端或者服务端埋点上报采集的用户行为数据进行挖掘计算生成。基本属性是典型的直采型标签,平台属性是典型的算法挖掘型标签。

(2)末级标签和输出标签值方面以性别为例,基本属性代表用户真实的社会身份,是确定的事实,典型标签形式为“性别_女”,而平台属性则代表用户在性别维度的偏好概率,典型形式为“性别_女_0.80”,其中“女”为末级标签,“0.80”则代表用户在平台的女性身份上表现出的倾向程度。

3.行为属性

4.产品偏好

产品偏好是对用户使用某些产品、产品核心功能或者其他渠道的偏好程度的刻画,属于挖掘型标签,其中产品的选取可以包括自家产品、竞品;功能和渠道既包括站内产品功能,也包括push、短信、开屏、弹窗等几大运营和产品法宝。示例:搜索模块偏好、直接竞品_京东偏好、短信偏好。

5.兴趣偏好

兴趣偏好是用户画像内非常重要的维度,以电商产品为例,用户对商品的喜爱程度是用户最终的信息之一,兴趣偏好是对用户和物品之间的关系进行深度刻画的重要标签,其中最典型的是品牌偏好、类目偏好和标签偏好。示例:品牌偏好_优衣库_0.91、类目偏好_美妆_0.80、标签偏好_红色_0.70。

6.敏感度

在做营销活动时,我们留意到有些用户不需要优惠也会下单,而有些用户一定要有优惠券刺激才会下单,而且优惠券的额度会影响其下单的金额。这种情况下,如何识别出对优惠敏感的用户并为其发放合理券额的优惠券,保证优惠券不浪费,从而使促销活动的ROI最大?其中一个很重要的标签就是用户的敏感度标签。敏感度代表用户对平台活动或者优惠的敏感程度,也是典型的挖掘类标签。示例:热点敏感度、折扣敏感度。

7.消费属性

8.用户生命周期及用户价值

用户生命周期是用户运营的重要法典,一个用户从进入产品到离开,通常会经历“新手”“成长”“成熟”“衰退”“流失”这5个典型阶段,每个阶段对用户的运营都存在策略差异,画像在其中的作用是明确标记用户所处生命周期的阶段,便于后续业务人员落地。用户价值是体现用户为产品贡献价值高低的标签,最经典的是通过RFM模型获得交易维度标签,此外,也应该看到用户的其他价值,例如为产品贡献活跃度,通过裂变拉来新用户,这些都可设计相应的标签。示例:新手、成长、成熟、衰退、流失、高价值用户、VIP等级等。

二、用户画像从1到100的构建思路

用户画像的主要目的有以下3个:

·用于用户信息的统计,建立对产品、对用户的基本认知;

·用于用户定向营销,利用人群圈选投放物料;

·用于算法,沉淀用户特征,供模型使用。标签的完善也可以按照这3个维度不断丰富。

1.用于统计,对产品、对用户的基本认知

每个产品功能策略的完善,都需要建立在对产品、对用户的充分认知基础上,也就是说,用户是谁,有何特点,基本情况如何,这些是用户画像需要回答的重要问题。

思路拆解:既然要了解用户的基础信息,就需要将用户基本属性进行拆解,包括年龄、性别、居住城市(几线)、家庭结构(婚否、孩否)等。为了盈利考虑,还需要了解基本的收入水平、消费能力等。将拆解的维度抽象,构建对应标签,然后进行分布统计,便能生成一份基本的用户认知报告。

标签结果:年龄、性别等。

2.用于定向营销和精细化运营

运营人员作为画像的重要业务适用方,每天都会通过标签圈选人群,做定向的用户、活动、内容精细化运营,以及各app每天都在进行的促销活动。这些运营和活动的场景分布在产品的各个渠道和各个资源位,对场景和人群的精细程度要求都很高。

举一个日常工作中最常见的需求,通过一次数据分析发现,产品的流失用户占比提升,经过讨论,大家认为一次结合利益点的push推送是召回流失用户的有效且快速的手段;同时push作为各个业务都在争取的有限资源,希望可以提高使用效率,确保push这个资源渠道的整体roi。以上需求希望画像可以支持。

思路拆解:从这个需求背景中,我们做一次关键词提取,不难发现,关键词是“流失用户”“利益点”“push”“效率”。其中“流失用户”是用户身份识别,“利益点”是用户优惠敏感度,“push”是产品渠道资源,“效率”意味着要尽可能确保圈选人群精准,不能为了覆盖率牺牲准确率。

具体落地步骤如下:

第一步,确定流失用户的口径和标签。这里需要用到用户生命周期的划分,从中识别并标识出流失用户。

第二步,分析对流失用户拉回效果最好的利益点。例如优惠券、折扣、礼品或其他内容。这一步需要运营和数据开发人员根据日常经验和数据分析完成,对于画像的要求是基于分析结论,挖掘不同用户对于优惠折扣的敏感程度,这一点在前面介绍敏感度标签时有论述,最终目的是确保将每一分钱都花在刀刃上。

第三步,确定拉回的明确目标。是拉回规模还是准确率。通过需求分析可以确定,本次拉回在资源有限的情况下,需要提升人群识别的准确率。画像实现准确率的方法有两个,一是提升画像算法的准确率,这部分主要依赖算法本身,无法一蹴而就,因此这里选择第二个方法,即增加人群圈选的条件,也就是新增标签,供圈选求交。

根据背景分析,我们可以增加流失用户关于push渠道打开意愿的标签,提高push资源的使用效率。

经过上述分析,需要生产的标签如下:

·用户生命周期_流失

·用户折扣优惠敏感度

通过以上需求分析和思路拆解,画像的建设过程应该比较明确了,这里再留一个思考的案例,可以尝试分析如何落地:平台新上一款商品,初期需要在某模块展示给目标用户做推广,同时尽量不打扰非目标用户,且不降低该资源位的整体转化效率。思路拆解:商品的目标用户——商品可以按照哪些维度拆分关键信息?模块位置——用户的模块功能使用偏好是什么?准确率的要求——如何提升画像应用的准确率?回答好以上问题,这个需求的标签便能顺利获得。

思路拆解:召回的作用是粗筛,帮助推荐系统计算第一道用户兴趣池。这里用户对物品的兴趣可拆解为对商品品牌、类目和商品标签的兴趣,这就转化为前面介绍的内容了,用户标签中有品牌偏好标签、类目偏好标签和标签偏好标签,只需要在所有品牌、类目、标签下维护一个按照商品质量或者热度降序排列的列表,这样只要获取到用户标识,便能从用户画像中获取偏好的品牌、类目和标签。再从品牌、类目和标签下的商品列表中召回相应的商品,根据候选集大小的设计,做topk截断召回。这样,这部分商品就完成初步的召回,为进入下一个流程进行粗排和精排做好了准备。

三、单个用户标签的做法

1、用户标签的生产流程

(1)标签定义:给出标签的定义,即发生什么行为的用户可以打上这个标签。

一个用户标签是由用户的不同历史行为组合而成的,可以写成y=∑fn(x),其中fn(x)是单个的用户行为。所以标签的定义主要是指这个标签包括哪些用户行为,这些用户行为以什么方式组合计算。

(2)用户行为获取:探究不同的用户行为的获取难度,包括怎么获取数据、怎么处理数据。

因为获取到的用户行为是给算法或者规则计算用的,所以获取的用户行为五要素中,内容要经过结构化后才算是获取了一条有用的数据。

商品结构化后,会有商品标签;促销方式结构化后,会有促销标签。

2)数据质量检查。数据从采集到使用的过程中会出现各种数据质量问题。在获取数据时,要先做数据质量的检查和改善,需要注意以下几点:

·人工标注的数据质量;

·中间过程中使用算法计算的环节会有准确率的问题;

·如果是用户人工填写/选择,也会有错误、不全等问题;

·数据处理流程中的无效、失效数据。

3)基础数据获取。内容结构化和数据质量检查可能需要一些新数据,而这些数据需要开发新功能才能获取到,这个开发新功能获取新数据的过程就叫基础数据获取。

(3)模型设计:经过分析,确定了哪些行为之后,就可以进行模型的设计。

(4)标签计算:对原始用户行为数据进行计算,生成标签。

(5)标签评估:对生产的标签进行评估,看准确率、覆盖率等指标是否达到预期。

图11-3用户标签的生产流程

四、算法标签的一般生产流程

1、标签定义分析

示例如下:

用户标志_偏好_类目偏好_衣服_0.83

用户标志_偏好_类目偏好_帽子_0.12

这里的“0.83”和“0.12”就是我们需要计算的标签属性值。

2、用户行为获取(特征探查)

用户行为获取的难点和重点有两个:新用户行为如何获取,是否用户的全部行为都需要参与计算。

(1)新用户的行为如何获取新用户行为的获取方式有以下两种。

(2)是否全部行为都需要参与计算

这个问题的答案一定是否定的,尤其是画像建设初期,不宜一次加入过多特征训练,因为结果很难把控。行为特征选择依据,可以参考两个标准。

·该行为是不是影响用户决策的核心因子。

·该行为是否稀疏。很多行为虽然重要,但因为操作门槛高,数据稀疏,一样影响模型的训练,初期可以不引入。

3、模型设计

(1)标注数据

(2)训练集建模

1)明确哪些特征属于重要特征

仍以电商为例,特征一共分为4个维度:用户的特征、物品的特征、用户—物品的多维特征和环境特征。在每一个维度内,最能影响业务表现的特征是什么,这是产品经理要明确的问题。

例如某个以GMV为优化目标的商品列表场景,影响最终收入的因素如下。

·用户侧:用户的年龄、性别、经济能力、客单价和历史订单GMV等,这些都属于影响用户付费的重要因素。

·物品侧:除了物品的文本、图片信息外,价格和近期价格变动以及优惠程度也是重要特征。

这些重要的业务特征,都需要产品经理通过数据分析和日常经验的积累,转化为模型的特征,帮助算法更好地输出符合需求的结果。

2)评估特征的权重值是否符合业务认知人工提供有效特征是建模前的步骤,算法在训练完成后,也会输出各特征所对应的真实权重,当算法输出特征和对应权重的时候,产品经理一方面需要根据自己的经验,判断这些权重的合理性;另一方面,需要从这些特征中抽象出真实有效的决策信息,沉淀为自己的经验,便于建立更完整的业务认知。

(3)测试集验证

除了auc等离线测试算法的指标以外,具体还需要在线上进行a/b测试。

(4)画像加工

1)确定衰减方案

2)更新频率

3)数据归一

经过以上步骤,便可以得到一个动态的、不断更新的、准确的偏好标签了。

五、加入内容标签的用户标签生产流程

比如,要定义标签“宠物行业偏好”,可以拆为以下用户行为。

用户行为三:购买宠物类别的商品。

用户行为五:……

另外,最好把用户历史行为数据找出来验证,看看自己的定义对不对。

2、内容标签制作

(1)内容标签制作方法

1)直采型

·b端用户输入;

·c端用户输入;

·公司职能部门输入

2)规则型

3)算法型

·直采型:人工标注团队输入;

·直采型:客户输入;

3、用户标签模型设计

·直采型

·统计型

·挖掘型

六、用户画像的效果验收

线上部分:a/b测试

离线部分:算法指标验收、分布验证、交叉验证和抽样评测四种方案。

1、算法指标验收

算法指标是对算法能力的评测,例如机器学习,常用指标为AUC、AUC提升率、召回率及准确率四大指标。AUC是算法的常用指标;提升率则是跟之前的迭代对比,评估本次的提升幅度;召回率和准确率是算法基础指标,用以评估标签的覆盖情况和准确情况。

2、分布验证

分布验证是算法标签的过程验证方法,一个算法标签做完,输出结果是海量的“用户标识–分值”对,如何验证这些“用户标识–分值”和合理性呢,方法是选取待校验的标签和标签值,再选取最能影响用户在该标签分值的一个单点行为,比较分值和行为在用户轴上的分布情况。

以类目偏好标签为例,如图119所示,第一个分布图横坐标是用户,纵坐标是类目偏好的分值;第二个分布图横坐标也是用户,纵坐标则选取最能代表用户对类目偏好程度的下单行为——用户订单量。将两者进行对比。

图11-9标签用户分布与真实行为分布对比

可以看到,用户和具体标签值分布呈现“L”型,用户和用户订单量呈现“S”型,两者存在较大的差异。这里值得一提的是,分布验证是过程验证方法之一,不是衡量线上最终效果的唯一指标,有些情况下不能一概而论,认为标签错误,但是可以作为标签的一个重要优化方向。

3、交叉验证

交叉验证的前提:用已经验证过的正确标签和新标签做交叉,得到较为综合的用户特征,再根据经验判断新标签是否合理。

4、抽样评测

例如在用户兴趣偏好标签输出后,统计用户3个月内不同类目标签的点击次数(点击行为比较能够代表用户的意愿),如果兴趣分值高但实际点击次数非常低,则认为标签是有问题的。没有问题的数据占比即是抽样评测的准确率。

七、标签系统注意事项

1、做好mvp测试机制

MVP是指最小可行性产品,本质是为了加快迭代速度,以便获取认知。

THE END
1.分享一篇关于陌生人社交的竞品分析报告(上)第三,目标用户对比分为两个方面,第一,通过对soul的用户使用场景,基本数据,偏好数据和用户画像进行分析充分理解soul用户特点,因为soul是迭代产品。第二,将三款产品用户使用场景和基本数据进行对比,发现三款产品目标用户的不同。 第四,业务模式对比是指对比产品间目前业务模式的差异,理解产品现有方案如何满足产品核心定位...https://www.niaogebiji.com/article-135709-1.html
2.抖音商机与用户画像平台内容类型及实操步骤解析公司LOGO推广项目更受抖音用户欢迎: 1、潮流品牌鞋服、奢侈品箱包、珠宝玉石、手表、护肤化妆品、魔术道具、指尖陀螺、照片拼图、手机键盘等个性化玩具以及手柄、旋转笔、个性化打火机等; 2、活体宠物及宠物周边设备; 3、女性个人护理、减肥、丰胸、增高、祛斑、美白等; 4、民宿、青年旅社、游乐园、网吧、餐厅、小吃...http://www.xm8168.com/h-nd-335892.html
3.“萌宠”宠物类APP视觉界面解析.docx宠物类APP功能分析 4 第3章“萌宠”宠物类 APP界面设计用户研究 5 3.1 宠物人群分析 5 3.2 目标用户 5 3.3 用户痛点 5 3.4 用户画像 6 第4章“萌宠”宠物类 APP界面设计竞品分析 7 4.1 竞品选择 7 4.2 竞品的定位 7 4.2.1 有宠发展简介 7 4.2.2 爱宠发展简介 7 4.2.3 闻闻窝宠物发展简介 7 4.2...https://m.book118.com/html/2023/1002/7151102134005163.shtm
1.宠物行业深度报告系列二:剖析宠物细分行业智能用品潜力大宠物行业各细分赛道基本定型,涵盖了宠物饲养、交易、食品、用品、医疗、美容、训练、保险以及殡葬等多个领域。宠物上游以饲养和交易为主,由个人经营,规模化企业较少;宠物中游中的食品和用品是刚需,占据宠物行业的主导地位,规模化程度高且竞争激烈。其中,宠物食品最先受益于行业的快速增长,宠物用品未来具有很高的爆发力...https://stock.hexun.com/2024-11-15/215583533.html
2.国泰君安:年轻宠物主推动市场多元化与"拟人化"趋势国泰君安研报显示,中国宠物产业虽起步晚但发展迅速,年轻宠物主推动行业增长,宠物消费多元化和拟人化趋势显著。2023年城镇宠物消费市场规模达2793亿元,猫市场增长6%。国产品牌通过创新提升竞争力,逐渐改变外资主导的市场格局。 观点网讯:11月14日,国泰君安研报指出,尽管中国宠物产业起步晚于欧美国家,但目前正处于快速发展阶...https://www.guandian.cn/article/20241114/449400.html
3.宠物类app用户画像分析案例资讯随着人们生活水平的提高和生活方式的改变,越来越多的人开始养宠物。宠物成为许多人生活中不可或缺的一部分,为了更好地管理和照顾宠物,宠物类app应运而生。而了解用户画像对于开发宠物类app以及提供个性化服务至关重要。本文将以一个宠物类app用户画像分析案例为例,探讨不同类型用户的特点和需求。 https://www.appzzgs.cn/newsinfo.php?id=736
4.产品研究68款宠物APP产品分析:宠物行业的巨浪淘沙通过对用户地域分布以及用户属性各方面的分析,最终得出有关养宠主的用户画像,将养宠主分成三种不同的人群并代入详细的用户情景中,得出养宠主基本是为了陪伴,并且都是把当做自己的亲人甚至是孩子,正因为如此,基本上养宠主也会对自己的宠物格外的呵护,愿意花费时间和金钱去陪伴它们。 https://maimai.cn/article/detail?fid=1368921073&efid=jmMz1_nUCqB92B3wjI5FXg
5.4000字拆解:除了乘了逆周期的东风,波奇宠物的用户运营到底强在...我觉得用户画像、用户旅程地图、同理心地图可以复用到自己的工作中去,因为我是做用户运营的,这3块之前都觉得比较虚,或是说太玄学了,没有好好深入研究,目前也只是模仿的状态,希望以后能把这几块的短板补齐。 注:本文数据来自见实公众号发布文章《私域用户过百万,波奇宠物自有商城年销售额达数亿!》、《波奇宠物私...https://www.shangyexinzhi.com/article/4860267.html
6.2018年宠物行业市场及用户画像报告主要内容:宠物市场的总体概况;用户画像;饲养不同种类宠物的人群对比;未来宠物市场的需求分析。 随着居民意识和消费能力的提高,我国宠物产业成为新的“潜力股”,从1990年到2018年,宠物行业由萌芽期进入了快速发展期。 作为宠物行业的从业者,或者即将进入宠物行业的外来新生力量,你必须了解整个宠物行业所处的阶段以及你面...https://www.jianshu.com/p/9587272b4a2f
7.2020中国宠物经济发展现状用户画像及趋势分析(附报告下载)2020中国宠物经济发展现状、用户画像及趋势分析 空巢老人、空巢青年等社会结构的改变,以及家庭养宠观念的进步,都令宠物的情感价值得到提升,成为驱动宠物经济发展的重要力量。 2015-2020中国宠物经济发展规模数据分析 iiMedia Research(艾媒咨询)数据显示,中国宠物市场规模在2019年达到2212亿元,预计2020年将达2953亿元,年...https://www.iimedia.cn/c1020/72174.html
8.结合进化心理学,解析陌生交友产品的三大问题反观国内很多陌生交友app,功能过于冗杂,看似什么功能都不缺,但没有哪个功能是用户一看就懂一用就会的。 这方面陌陌、探探、same做得比较好。 据陌陌公开信息显示,其此前关闭贴吧功能也主要考虑到“少即是多”的产品理念。 3. 女性用户安全感的需求 在成千上万的世代更替之后,女性逐渐进化出了一种择偶偏好,她们...https://www.iruanshi.com/tt5/43777.html
9.宠物用品海外市场调研与分析详细指南4.2 用户画像: 制作详细的用户画像,了解目标市场宠物主人的特点和购物行为。 1.用户调查数据分析:分析用户调查数据,确定目标市场宠物主人的年龄、性别、偏好等关键信息。 2.社交媒体分析工具:使用社交媒体分析工具,如Facebook Insights或Twitter Analytics,了解宠物主人的在线行为。 4.3 SWOT分析: 分析您的产品在目标市场...https://m.cifnews.com/article/155054
10.私域用户过百万波奇宠物自有商城年销售额达数亿!零售二、波奇宠物的私域用户画像 见实:波奇宠物私域是从什么时候开始布局的? 周宇:在2013年时,我们就做了几十个QQ群,愿景也比较简单,给用户提供一个可以交流任何养宠问题的地方,当然我们也会在群内进行商品售卖。商品来源主要是我们的pc端自有商城,其次也会推送三方平台的链接,如天猫。当时并没有分层运营,管理相对简单...https://www.ebrun.com/20211210/465655.shtml
11.如何提高App下载量?这些实用的营销策略你必须学!3、明确你的目标人群,建立用户画像 试着想象下你的app用户应该有着什么样的共同的性格特征和特点?一旦你确定了你的目标人群,你就可以调整你的营销内容以获得更多的关注。一款面向35-50岁年龄段人群的app与一款与面向青少年的app的宣传方式是截然不同的。要聪明地有所针对地使用俚语、gif、表情符号或商业术语,以免疏...http://www.shang-haiseo.com/seohuati/ziiETSO.html
12.波奇宠物的流量矩阵拆解有哪些渠道?LTD行业百科用户画像 社交电商 私域运营 会员体系 裂变玩法 流量矩阵 波奇宠物 宠物电商 本文资讯不代表枢纽云的观点或立场,其中涉及的信息和数据均来自第三方。枢纽云不对其准确性、可靠性或完整性提供任何明示或暗示的保证,仅供参考。如有疑问或需删除,请联系 kefu@LTD.com....https://ltd.com/article/5406267971702391
13....的高风险地区,需要经常进行消毒,下列不能使狂犬病毒灭用户画像是商业模式设计中的逻辑起点。() A. 正确 B. 错误 查看完整题目与答案 为了延缓水泥的凝结时间,在生产水泥时必须掺入适量石灰作为缓凝剂。() A. 正确 B. 错误 查看完整题目与答案 零开关PWM电路中无功功率的交换被增加到最大,这使得电路效率有了进一步提高。 A. 正确 B. 错误...https://www.shuashuati.com/ti/2a5f2fd9ffd4417d8513ce709befd5ed.html?fm=bd94a44025df9e654247eff6915d170c55
14.美国Mac用户画像:2023年57%新购用户来自PC等其它平台IT之家 3 月 14 日消息,市场调查机构 CIRP 调查了 2023 年美国笔记本电脑和台式机的购买情况,发现去年购买 Mac 的用户群体中,57% 来自 PC、Chromebook 等其它系统。 35% 的 Mac 新用户来自 PC,这比安卓用户转用 iPhone 的比例(13%)高出近 3 倍。 https://i.ifeng.com/c/8Xw5kG9huEU
15.PetSmart,价值百亿美金的宠物零售巨头的启示宠物医院:公司部分控股的宠物医院 Banfield 在850多家PetSmart商店内提供全套的宠物医疗服务。 宠物领养慈善会:为爱宠人士免费领取宠物。 宠物美容美发、洗浴护理等服务。 PetSmart网站 03.用户画像 第一梯队用户(核心用户):平均年龄46岁的女性,她们的平均收入比全美平均水平高出30%,宠物支出高出78%。这些消费者每年...https://www.36kr.com/p/5163369