在互联网逐渐步入大数据时代后,不可避免的给企业及用户的行为带来一系列改变与重塑。最大的变化,用户的所有行为在企业面前几乎都是可视的。随着大数据技术的深入研究与应用,企业的专注点日益聚焦于怎样利用大数据来为精准营销服务,进而深入挖掘潜在的商业价值。于是,“用户画像”的概念也就应运而生。
一、什么是用户画像?
简而言之,用户画像是根据用户社会属性、生活习惯和消费行为等信息抽象出的一个标签化的用户模型。构建用户画像的核心工作即是给用户贴“标签”,而标签是通过对用户信息分析而来的高度精炼的特征标识。例如:
二、为什么需要用户画像
1、精准营销,分析产品潜在用户,针对特定群体利用短信邮件等方式进行营销;
2、用户统计,比如中国大学购买书籍人数TOP10,全国城市奶爸指数;
3、数据挖掘,构建只能推荐系统,利用关联规则计算,喜欢红酒的人通常喜欢什么运动品牌,利用聚类算法分析,喜欢红酒的人年龄段分布情况;
4、进行效果评估,完善产品运营,提升服务质量,其实这也就相当于市场调研、用户调研,迅速下定位服务群体,提供高水平的服务;
5、对服务或产品进行私人订制,即个性化的服务某类群体升值每一位用户。
6、业务经营分析以及竞争分析,影响企业发展战略。
用户画像的核心工作是为用户打标签,打标签的重要目的之一是为了让人能够理解并且方便计算机处理,如,可以做分类统计:喜欢红酒的用户有多少?喜欢红酒的人群中,男、女比例是多少?
三、如何构建用户画像
如年龄段标签:18~28岁,地域标签:武汉,而且人能很方便地理解每个标签含义,同时一个标签也是高度精炼的特征标识(人为规定),这也使得用户画像模型具备实际意义,能够较好的满足业务需求,如:判断用户偏好。每个标签通常只表示一种含义,短文本,标签本身无需再做过多文本分析等预处理工作,这为利用机器提取标准化信息提供了便利。
所以,用户画像,即:用户标签,向我们展示了一种朴素、简洁的方法用于描述用户信息。
数据源分析
这样的分类方式,有助于后续不断枚举并迭代补充遗漏的信息维度。不必担心架构上对每一层分类没有考虑完整,造成维度遗漏留下扩展性隐患。另外,不同的分类方式根据应用场景,业务需求的不同,也许各有道理,按需划分即可。
本文将用户数据划分为动态信息数据、静态信息数据两大类。
动态信息数据
用户不断变化的行为信息,如果存在“神”,每一个人的行为都在时刻被“神”那双无形的眼睛监控着,广义上讲,一个用户打开网页,买了一个杯子;与该用户傍晚溜了趟狗,白天取了一次钱,打了一个哈欠等等一样都是“神”眼中的用户行为。当行为集中到互联网,乃至电商,用户行为就会聚焦很多。
静态信息数据
目标分析
用户画像的目标是通过分析用户行为,最终为每个用户打上标签,以及该标签的权重。如,红酒0.8、李宁0.6。
标签,表征了内容,用户对该内容有兴趣、偏好、需求等等。
权重,表征了指数,用户的兴趣、偏好指数,也可能表征用户的需求度,可以简单的理解为可信度,概率。
数据建模方法
运营知识建设:你不得不了解的用户画像!
什么用户:关键在于对用户的标识,用户标识的目的是为了区分用户、单点定位。
什么地点:用户接触点,TouchPoint。对于每个用户接触点。
内容:每个url网址(页面/屏幕)中的内容。
注:接触点可以是网址,也可以是某个产品的特定功能界面。如,同样一瓶矿泉水,超市卖1元,火车上卖3元,景区卖5元。商品的售卖价值,不在于成本,更在于售卖地点。标签均是矿泉水,但接触点的不同体现出了权重差异。这里的权重可以理解为用户对于矿泉水的需求程度不同。即,愿意支付的价值不同。
标签权重=衰减因子×行为权重×网址子权重
如:用户A,昨天在品尚红酒网浏览一瓶价值238元的长城干红葡萄酒信息。
假设用户对红酒出于真的喜欢,才会去专业的红酒网选购,而不再综合商城选购。
则用户偏好标签是:红酒,权重是0.95*0.7*1=0.665,即,用户A:红酒0.665、长城0.665。
以上的模型权重值的选取只是作为参考,这里主要是强调如何去整体思考、构建用户画像模型,从而能够慢慢地细化模型。