在会员分析方面的应用及用户画像的研究payton数据之旅

话题一:数据挖掘在会员分析方面的应用

现在我们开始第一个话题的讨论:1、数据挖掘在会员分析方面的应用,包括并不限于会员分级、精准营销、交叉销售、流失分析等。

汪尚:

今天的机会真的很好,我之前一直做的是线下的分析,今天能和知乎的专家一起交流,刚好能够互补,也希望大家能够踊跃参与进来,把这个平台真正作为大家共同的学习平台。

在数据分析技术不断推陈出新、企业数据积累越来越丰富、大数据技术被应用越来越广泛的今天,对比国内外,重视的行业并不相同,我国仍然像之前那样重视信息化的还是像银行金融、互联网、运营商这些行业,而在零售、连锁经营(像百货、酒店、餐饮、药店、超市等)这些容易见效的行业却远不如国外。国外在这方面已经有20年的经验,像我们熟知的沃尔玛、肯德基、星巴克无不是以数据运营精细化管理。

由于这几年零售业发展面临的考验越来越严峻,国内一些企业已经开始重视对数据的应用。从这几年的发展来看,大数据挖掘在这些行业的应用主要存在这三方面的问题:

第一个问题:数据质量较差,这主要是之前对数据的采集和管理不够重视,我说的主要针对线下,电商除外,因为这些大的电商的数据质量还是很好的。

第三个问题:国内在这些方面的经验积累不够,还需要加大投入探索。

今天我就围绕零售行业跟大家一起探讨数据挖掘在零售业的解决方案,尤其是在会员分析方面的应用。针对会员的分析,主要有三大类:

1.如何进行会员分级

2.如何进行会员营销

3.如何进行会员挽留

接下来,咱们先针对会员分级进行交流,交流之前先了解一下会员的生命周期,如下图所示

一个顾客来了之后,一部分会成为会员,这部分会员之后有可能会变成活跃会员,也有可能会流失,而活跃的会员有的会继续活跃,也有的会变成沉默会员,沉默的会员有可能会被再次激活,也有可能会流失掉,这就是从顾客进来到最后可能保持也可能流失的大概生命周期。

那如何进行会员分级呢会员等级可以分为两类:

第二种,是以业务分析主题为目标的会员分级。比如,在百货商场,针对百货的会员建立客户等级,可以分成五个等级:A级(一买一大堆组)、B级(成长空间较大组)、C级(常来常往组)、D级(别人家的顾客)、E级(看我不顺眼组)。以上5个等级分别表示:A表示的含义是忠诚度最高的组,生活需要的方方面面都在这里购买;B表示对我认同度较大且还有很大消费潜力的组;C表示时常来这里,也时常去别家买东西的组;D表示很少来这里买,主要去别家买的客户;E组表示对这里不满意而流失的客户。所以针对以上5个级别,每个级别都有运营措施,比如对E组的人重点做客户流失分析,对B组的人重点做向上迁移,加强B组向A组的转换,提高B组的消费量,等等吧。这两种体制相辅相成。线上第一种做的很好,有足够的重视,但是线下大部分做的不够好,很多大型的商场连会员信息采集都没有做好,又如何有足够的信息对这些会员进行分析。因此,完善会员分析首先应该完善第一种会员管理的等级制度。这也是我们最初给百货商场做会员分析遇到的一个难题。以上就是我对会员等级的两点看法,大家有什么要一起讨论的吗?

面包君:

前面汪总把会员分级的基本情况都讲到了。我介绍下我们怎么做潜在用户、活跃和流失的吧。

这是用户的生命周期流程,我们就不多说。

潜在用户怎么做呢?就是怎么解决数据挖掘中的冷启动问题。常规我们有两个方式:

1.经验判断:比如你推车主业务,前提是我要有车吧。比如你推理财产品,前提我有钱。

2.海投,通过GBDT决策树做投放优化,通过不停的召回样本,定义正负样本,来做预测。

应用到数据挖掘就是通过:

1.模型:

通过模型来做分类问题,就是判断用户会不会用我们这个产品或功能,根据大量的历史用户行为数据。

2.业务规则来做用户活跃

是什么意思呢,就是比如我都已经知道你这个月手机欠费了,当然拿到你的这个信息直接给你push一下手机充值的消费。

实际我们在做模型拉新和活跃的时候也发现。比如一般充值业务拉新模型的转化率是3%,活跃能做到30%。这也验证了为什么我们要做老用户活跃,拉新要做精准化,尽量少海投。

那么我们怎么看待我们的会员忠诚度和价值呢?

会员价值包括历史价值、当前价值、影响价值和未来价值。比例大致在2:5:1:2。所以当你在给会员价值打分的时候,需要结合他多方面的影响来权重考虑。对应不同的业务,每个会员的得分都会不同,我们打分的模型常用LR/RF/MLR/PS-LR,最后决定给他推什么业务,会有融合排序的过程,结合这个业务的conversion%和modelaccuracy%,来说为什么不仅不是不操心用户流失,还可以是更担忧这样的问题!

特别是我们讨厌薅羊毛的用户,什么意思,就是他只是来领了个红包就走了!

话题一自由讨论

同学提问一:哪些指标可以衡量客户的活跃度?

C_:活跃度除了消费次数和积分使用次数一般还能用什么数据去确定?

汪尚:如果是线上的话,还有一个方面可以衡量,就是用户消费的关联度。

瘦蚂蚱:消费关联度是什么含义?

汪尚:这个关联度,可以是该会员消费对其他人的带动,也可以指消费产品品类数。

ィ鬼:有什么比较量化的公式,或者比率来划分等级么?

瘦蚂蚱:这个就是从两个不同的维度来解释了

汪尚:嗯,对,很多指标的定义都和自己的业务目标有关

C_:如果需要几个维度确实活跃度,这几个维度的权重如何确定。业务人员打分还是有什么方法?

汪尚:并不唯一,虽然很多有统一的标准,但是也该根据自己的业务特征建立更适合自己的计算规则。

汪尚:挖掘分析的指标确定可以是多维的也可以是单一维度的。

同学提问二:请问怎么识别伪关联?

面包君:关联出来的结果肯定要经过和运营、产品的人碰过之后得出的结论,数据方面的比如我们做关联分析的时候,置信度、支持度要大于多少,以及最终做出的分析结果是否和事实吻合,和啤酒与尿布类同。

布拉德:怎么判断分析结果和事实吻合呢

面包君:昨天我给杭州的一家App公司讲数据运营的时候也说道,我们怎么去做数据分析。数据是客观的、是事实,但分析是人的事情,是需要经验和判断的。

汪尚:这也是挖掘的难点之一

Rui:业务和技术,比重大概多少?

金融:7/3

Rui:还是业务重要多哈

同学提问三:线下的数据质量肯定比线上要差,对于质量差的数据,有什么经验的处理方法呢?

汪尚:其实数据质量差是普遍现象,我们应该更关心基于现有的数据如何把预测效果做的更好。数据质量的处理一般通过数据探索发现清除数据质量差的记录的规则,而很多时候数据的异常恰恰可以通过调研获取背后的业务原因,进而找到过滤和处理办法。

比如说我们做百货会员分析的时候,遇到这样的情况,有的人退货次数特别异常,也有的消费金额特别异常。比如有个会员,一年内退货金额达到19万多,还有的9个月内退货次数达到135次,我们细一分析,才明白这种情况是伪会员导致的。比如咱们去大多数商场购物没有会员卡也肯定可以打折,为什么呢?因为绝对有人愿意你使用他们的会员卡,这样可以帮他积分,也可以帮你打折、互惠,但是如果一个会员卡这种事情做多了。比如销售员的,那个这个会员卡代表的已经不是一个真正的会员了。所以在研究会员的时候必须剔除,那如果商场指定自己员工的会员卡排除掉这些是不是就可以了?遗憾的是商场并不掌握这个信息,也无法获取这个信息,怎么办?只有根据这种伪会员的使用特征,如一天消费次数达到多少以上,或者是否大量购买同一品牌等。但是这样肯定不能把伪会员去除干净,但是好在关系不大,只要剩下的对分析结果影响不大就好了,也就是挖掘的推断估计。

以上就说的是去伪的问题,其他的数据质量问题也大多如此解决。

C_:如果数据分析结果比如关联分析结果与实际不符,那么该怎么办唉

汪尚:那就要想一个问题,为什么不符?其实这种情况出现正常,出现在应用的时候就不正常。模型或者规则获得后,一定要做重新分的模型测试和评估。如果测试结果不理想,就要反推原因,这是咱们深入业务分析的重点。我们的业务能力也正是在这样反复的纠正和反思中得到不断提升的。之所以分析和实际不符,有个很大的原因就是数据会骗人。而且你被骗了,我们很多时候在初始分析的时候,忽略的数据产生的背景,一切数据已经过时了,但是我们没有注意到还是把它放到了分析数据中,结果就干扰了我们的分析结果。

C_:比如说之前做的电器的关联。业务人员会认为空调跟厨卫关联性最大。但数据并不是这样。

内心召唤:伪会员数量应该不会有很多吧?会影响分析结果吗,是否可以不用考虑剔除这些数据呢,只要多数数据是正确的应该就可以吧,我们看的是大体的趋势啊,不知道我这种观点对否?

汪尚:不会很多,但是影响很大

内心召唤:能说说影响是什么吗?

汪尚:因为他们的消费频次和消费金额普遍的大,显得普遍的“重要”。如果你验证出来和业务认识不一样,恭喜你,这就是你的成果。数据挖掘本来就有做数据验证的作用。

狗狗:去伪的时候有可能也会去掉真实的数据,所以这只是一个分析的方法,看的是趋势,而不见得是百分百的准确数据吧。

陈斌:关键还要能解释不一样不然只会被怀疑呢

汪尚:如果您能再深入一下为什么如之前的认识不符时,恭喜你你又有了更大的成果,帮助业务也帮住自己更懂业务了。

同学提问四:数据采集的工作能否简化?

面包君:@第二个寒字这些标签都需要建立用户标签库、行为基因库的。这些都是常用的特征指标。

汪尚:没有办法简化,我们其实针对百货会员派生了上百的字段,最终只是从这上百字段中找出了这几个重要的做的分析。

话题二:用户画像的研究

用户画像我们主要是这6个维度。

这里面会大概有600多个标签,有原始数据、也有通过模型预测的。

比如你是多大、性别这些都是知道,但是你什么时候生孩子、什么时候结婚都是预测的。

用户画像做什么用?个性化,精准化营销!

方式有两种,一种是传统的BI的方式,描述用户画像的群体特征,比如我们的用户是理财小白,我们就要去想这些屌丝有什么习惯,给他们什么产品合适。

第二种方式就是机器学习,通过大数据训练的方式来做自动化的个性化营销。通过这些600多个特征的不同组合,训练出AUC大于0.7以上的model,再实测。

举个例子,就是我们在天猫logo做的“千人千面”。

基本思路:要实现这个目标,需具备以下3个条件:1)建立一个logo库:存放品牌ID/所属类目/logo图片/跳转链接等必要信息;2)有一套业务逻辑&数据模型算法,分析计算出每个人可能最想看到的品牌;3)有一套产品支持:利用推荐引擎产品和前端开发实现对应资源位的个性化展现;

我们会每天喝着茶,思考着人生,看看这些不同model跑出来的效果。

而围绕用户画像的传统BI的做法,是建立数据监控体系,有个类似会员健康度的东东。

差不多是这些,欢迎补充。

话题二自由讨论

同学提问一:现在网购很多都是一个帐号,然后以家庭为单位,也就是说shopper和consumer很多时候不是一个人,这种情况下一般都怎么处理?

面包君:好问题!!!

林桐:面包君你们是怎么解决的,我也想听听。

面包君:这个问题也是我们在实际数据处理会遇到的。就是多个账号,多个不同用户,怎么去区别的。我们有个数据挖掘团队专门做这个事情,就是做自然人模型研究,他们还申请了专利。

黄晓帆:决战大数据这本书有提过这个问题。

林桐:也是同人模型啊。

Richie:这个就回到了第二个话题用户画像通过指标来分析,分组分情况对客户打标签。

面包君:我说的比较粗一些,通过媒介(常登陆手机、地点lbs、收货地址)、社会关系(给谁转账、给谁充值)、资金关系、手机通讯录等场景来做的同人模型。

悟:不能作为一个整体考虑吗?毕竟这个账号的所有使用者基本稳定。

春宇:@悟是的,我这种小白也是考虑整体考虑,不想那么细了。

林桐:对的,统一打标签。

春宇:但标签就没法画了,既买女士用品,又买剃须刀。

林桐:分业务场景也就是人群了。

这个在社交场景应用的比较多,就是把你老婆和你小三要区分出来。

林桐:对于数据种类多样性大家都很重要,那么基于用户的数据打通成为关键,这个是阿里用户数据的核心技术。

林桐:在此基础上,所谓的家庭关系,室友关系都可以基于此建立做用户连接及解决了。

同学提问二:如何确定你的研究对象的特征呢?说说基本的方法和思路?比如说你要去挖掘分析一个你不熟悉的的行业。

汪尚:企业用户标签的建立分三种,第一是基本标签,如年龄、性别,第二是统计标签,比如消费金额、消费频次等,第三是预测标签,如流失概率、客户偏好等。三种标签的建设分三个步骤完成。

首先是两个方向,第一是以数据驱动,从表中提炼;第二是业务驱动,从业务角度想你需要什么标签。第二种如何以业务驱动,这个比较笼统,业务不同也就不一样,但是大致做法就是做业务分析,看看从业务决策上看需要什么信息,多方访谈。那我们主要说第一种,从表中获取,分三个步骤:

第一,从表中体现用户基本信息(如果是建用户标签库的话),这个简单,都能理解;

第二,梳理表的业务,派生统计指标,常用度数值型有求和、平均、最大、最小以及比例,对于分类型的计算众数,频数等,具体也要业务和经验多想。

第三,是面向分析主题见预测模型,进而获得预测指标。

这是基本思路。

悟:流失概率,如何得到?

汪尚:流失概率,就是首先定义了流失目标字段,然后派生影响指标,然后建立分类预测模型得到相应概率。

面包君:这也是我们在做不同的场景推荐的时候,需要思考的问题。

1.结合自身已有的数据,比如我就只知道你叫什么,我怎么去分析你的星座啊;

THE END
1.茶饮市场用户画像市痴间测算及盈利关键要素分析(2021年).pdf...茶饮市场用户画像、市场空间测算及盈利关键要素分析(2021年).pdf,内容目录 我国茶饮市场:迎合健康、社交等生活方式,新媒体资本助力 - 3 - 现制茶饮令传统饮品焕发新活力- 3 - 驱动因素:受益于消费升级+外卖崛起,迎合健康、低脂的饮食方式- 5 - 竞争格局:集中度高- 9 https://max.book118.com/html/2021/0507/8073033061003100.shtm
2.星巴克PEST分析报告20240318.docx版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领文档简介星巴克PEST分析报告1引言1.1星巴克简介及背景星巴克(StarbucksCorporation)成立于1971年,是一家总部位于美国西雅图的全球连锁咖啡公司。星巴克以出售高品质的咖啡、茶和其它饮料以及食品而闻名,其门店遍布全球多个国家和地区。经过...https://www.renrendoc.com/paper/319113562.html
3.瑞幸咖啡(用户画像市抄营情况)本数据包数据展示了瑞幸咖啡的发展简史,从用户画像、市场概况和经营情况的维度大体展示了瑞幸咖啡的发展概览和经验教训分析,可以帮助用户快速了解瑞幸咖啡市场的发展状况。 数据清单 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172 ABCDEFGHIJKLMNOPQRST...https://www.dydata.io/datastore/detail/2072281785215094784
4.「北京用户画像工程师招聘」2万-3.5万 北京 3-5年 本科 全职 招1人 查看更多相似职位 职位描述 工作职责: 负责用户基础数据挖掘工作,构建用户标签体系架构, 实现用户行为分析和用户画像。 岗位要求: 1、熟练掌握数据挖掘、机器学习的基础理论和方法,熟悉常用模型和大数据处理工具; https://jobs.zhaopin.com/CZ304915530J00049408810.htm
1.为什么星巴克会是现在这个样子?虽然在发布正式财报之前,星巴克就公布了2018财年第三季度销售额预告,预告显示该季度星巴克全球同店销售额同比增长1%,明显低于分析师2.9%的增长预期,是星巴克9年来的最差表现。但中国市场表现不佳,甚至出现负增长,则令投资者“措手不及”。 星巴克对中国市场的看重有目共睹。 https://www.31344.com/celuecankao/26158.html
2.星巴克的困境折射“高端咖啡”的尴尬澎湃号·湃客澎湃新闻财报显示,第三季度,星巴克中国全国门店总数达7596家,其中净增门店290家。但星巴克中国的营收却并没有同步增长。第三季度,星巴克中国营收7.84亿美元(合人民币55.84亿元),下滑了7%,而且高于星巴克全球3.2%的下滑水平。 星巴克中国营收下滑的背后是其单店运营效率下降。第三季度,星巴克中国同店销售额下滑幅度达到14%,其中...https://www.thepaper.cn/newsDetail_forward_29424053
3.上市企业品牌建设与员工认同和组织文化的塑造通过市场分析和调查研究,可以获得有关目标市场的信息,例如目标客户的年龄、性别、收入水平、购买习惯、消费心理等方面的信息。此外,了解竞争对手的品牌形象可以帮助企业确定自己的差异化战略,以便在市场中脱颖而出。最后,了解市场的趋势和变化可以帮助企业积极应对市场的变化,适时调整品牌策略。通过深入了解目标市场,企业...https://www.rhtimes.com/news/Design-NEWS7662.html
4.社群运营是做什么的,微信运营的工作内容,什么是微信社群营销?微信...有效识别和分析微信社群中的目标用户群体,首先需要明确目标群体的特征,包括但不限于年龄段、性别、地域、兴趣爱好、消费习惯等。接下来,可以通过以下几个步骤进行: 你离创业成功,只差加入创奇学院,请加微信:6420636 构建用户画像:根据目标用户的属性数据建立目标用户模型,这一步骤是基于交互设计之父Alan Cooper提出的用...http://www.jd30.com/c12/231218.html
5.企业用户画像是什么?为什么需要用户画像分析,有什么作用?伴随着大数据应用,企业用户画像越来越被企业所重视。相比传统的线下会员管理、问卷调查、购物篮分析,大数据第一次使得企业能够通过互联网便利地获取用户更为广泛的反馈信息,为进一步精准、快速地分析用户行为习惯、消费习惯等重要商业信息,提供了足够的数据基础。今天我们来聊一聊企业用户画像是什么?为什么需要用户画像分析,...https://www.infocode.com.cn/blog/997.html
6.如何打造品牌差异化,星巴克营销案例分析!因而星巴克从其品牌目标用户出发,进行品牌差异化定位,最终将星巴克这一品牌定位于独立于家和工作场所的“第三空间”。这一品牌定位大受品牌目标受众的追捧,而星巴克的品牌差异定位之所以做得如此成功在于它精准地识别了受众,进行了受众定位。 以下是在BoardMix白板中绘制的【星巴克用户画像图】:...https://boardmix.cn/article/pinpaichayihua/
7.成立5年门店800+的国风新茶饮,霸王茶姬是如何在红海中突围增长的...2)用户画像 一二线城市、女性、中青年、华东地区居多。 3)市场规模 2022年中国新茶饮行业市场规模超过2900亿元,同比增长5.1%,门店数量突破45万家,预计到2025年达3400亿元。 但有业内人士认为就目前现制现售茶饮赛道来讲,总的市场规模在3000亿左右,该赛道目前属于竞争尤其激烈的红海市场。 http://www.henanfood.net/lenglianwuliu/news/canyinmeishi/220231
8.开喜赞轻食加盟店怎么样?有发展吗?加盟指南一、轻食沙拉用户画像分析 开一家轻食沙拉加盟店怎么样?有发展吗?轻食沙拉的用户主要是20-30岁上下的年轻人,按需求分析大概可以分为:减肥人群、健身人群、三高人群、饮食养生人群,根据不同的需求打造减肥餐、减脂餐、低脂餐、健康餐等多功能产品,轻食沙拉以年轻时尚、注重健康人群为主消费群体。 http://m.1637.com/news/M09724B89R91157372.html
9.艾媒咨询发布《2022中国咖啡行业用户调研:用户画像(一) 图片来源:公众号@艾媒咨询 7、中国咖啡行业用户调研:消费频率(一) iiMedia Research(艾媒咨询)数据显示,每天消费咖啡的顾客占比达21.5%,接近六成的受访消费者会每周购买咖啡,仅有1.6%的消费者不常喝咖啡。艾媒咨询分析师认为,随着消费者消费水平的提高,以及新式茶饮的兴起,咖啡...https://www.biolink.cn/index.php/article/7673_13.html
10.艾媒报告2018新零售咖啡受到资本市场的关注。从消费者角度看,70.8%的咖啡馆消费者是女性,61.0%咖啡馆消费者年龄位于26到35岁之间。消费者更多地关注咖啡馆、精品咖啡等与咖啡相关话题。(《2018-2019中国咖啡产业商业模式及用户画像研究报告》完整高清PDF版共42页,可点击文章底部报告下载按钮进行报告下载。)...https://www.iimedia.cn/c400/63469.html
11.上海交大文创学院“新文创”CEO9月课程回顾ICCI上海交大- 通过组织大的运营团队进行闭环管理,结合用户画像,不断改善与纠偏,让产品更加满足用户的需求。 -无论科技怎么发展,艺术是无法被替代的,是一个能够保持长久性的事物;无论线上如何发展,线下的文化娱乐消费的刚需仍然十分强烈。 分享嘉宾 王冬teamLab无界上海总经理、上海大地诚泰文化科技有限公司总经理 ...https://icci.sjtu.edu.cn/news/view/595
12.创新案例咖啡连锁星巴克门店体验创新的5大策略–Runwise.co星巴克会员体系在中国市场需要进一步优化和升级。消费品牌需要降低会员的门槛,吸引更多的用户加入会员。会员权益的透明度和个性化推荐,也需要加强对会员数据的分析和利用,以更好地把握消费者需求和行为习惯。星巴克的会员计划一直以来都非常受欢迎,但面临着一些挑战,例如:推出更多适合不同会员的优惠和礼品,会员优惠力度不足...https://runwise.co/dtc-user-experience-innovation/188147/
13.设计师如何洞察用户需求?来看这篇超全总结!优设网比如找工作你会关注工资、五险一金、福利待遇,买电脑会看内存、CPU、屏幕大小,点外卖会看价格、送餐速度。功能需求是用户的“左脑”需求,也是用户基本想要的东西。 情感需求,则是与之相对的,隐性的、抽象的内在心理层次需求。 比如这家火锅店的服务太周到了,让我感觉心里暖暖的,喝一杯星巴克,体验到白领小资的情调...https://www.uisdc.com/insight-into-user-needs
14.奈雪的茶(01491.HK)一文详解奈雪的茶招股说明书:新式茶饮领航者...5. 1 用户画像:新茶饮做的是年轻人的生意,客户消费意愿及频次较高? 新茶饮主要消费人群90后、00后等年轻人,以女性为主但男性比例也逐渐提升。年轻人及女性消费者是目前新茶饮的消费主力人群,90后及00后占新茶饮消费人群达70%。女性消费者仍是新茶饮主力消费人群,但同时男性消费者占比同比也有较为明显的提升,预...https://tool.lu/en_US/deck/rd/detail
15.瑞幸咖啡与星巴克产品比较2、竞品分析 2.1产品定位 2.2用户画像 资料来源:https://dy.useit.com.cn/2019/07/4925/ 2.2搜索指数 资料来源:百度指数 从近半年的搜索指数中我们可以看到,瑞幸咖啡的整体日均值为5571,整体同比上升94%,整体环比上升29%;星巴克整体日均值为6477,整体同比下降16%,整体环比下降14%。作为2017年进入中国市场的瑞幸咖...https://www.jianshu.com/p/2c2bcee6a0f7?utm_campaign=haruki
16.跟星巴克迪士尼学数据驱动,教你如何使用数据帮助企业做重大决策2、帮您做好用户分析、需求洞察和运营的基础 有了LinkFlow,您可以快速搭建起用户标签体系、用户画像和数据分析看板,帮您更全面及时的洞察用户需求,提高转化效率; 3、帮助您更好的实现精细化和个性化营销 LinkFlow,能根据用户的标签、分组、各种行为,按照您设定好的策略和频率,自动的、个性化发送给最应该接收到的用户,...https://www.linkflowtech.com/blogs/data-driven-story-disney-starbucks