用户画像的第一步就是进行画像架构的分级分类。画像的维度不同,画像结果千变万化,所以有效的画像必须是以商业结果为目标的标签集合。例如存量经营的商业目的就是存量产品的精准营销,因此画像架构的分级依据为存量产品体系。从存量产品体系的策略、需求、产品和渠道4个维度出发,建立了四级用户画像架构。
二级架构是行为画像。从用户的需求维度进行画像,行为画像根据不同的行为特征可细分为4类:通信行为、语音行为、流量行为和权益行为。通信行为反映用户的综合行为特征,如套餐是否经常超量,语音、短信和流量的使用度是否失衡等;语音行为用来描述用户语音套餐的使用程度,例如国内及国际语音是否有剩余或超额;流量行为用来描述用户流量套餐的使用程度,例如是否存在流量压抑、流量超出套餐以及流量高饱和的行为;权益行为用来描述用户对自身权益的敏感程度,例如是否资费敏感、ARPU值是否相对固定以及是否积极参加优惠活动等。
三级架构是产品画像,如图2所示。产品画像针对具体的产品以及产品的具体内容进行目标用户画像。将用户的标签属性与产品内容、产品特征相结合,进行相互匹配,筛选目标用户。例如根据现有产品冰激凌、畅越流量王、畅越视听宝等套餐的具体内容和特征进行目标用户画像寻找目标用户,实现精确的产品推荐。
四级架构是触点画像,如图3所示。进行产品匹配后的用户,需要通过用户最常用和最容易接受的触点,进行产品营销。通过分析用户行为得到用户最常用的业务办理渠道,有针对性地在用户触点渠道进行产品营销。渠道类型分为电子渠道和实体渠道两类。其中电子渠道包括自助终端、网上营业厅、掌上营业厅、互联网和短信营业厅等;实体渠道包括大客户客户经理、营业厅和呼叫中心等。
首先对标签体系进行系统梳理,根据具体的业务场景进行用户画像,再将用户画像形成的特征标签库应用于实际营销中精准的定位目标用户。画像流程分为4个步骤,分别是画像数据收集、标签梳理、用户画像和标签应用。
其中来自通信网络、业务平台系统和IT生产系统的数据是企业内部数据,可信度高,采集方式为在系统中直接获取。IT生产系统的数据源主要包括电子化销售服务管理系统(ESS)、业务支撑系统(BSS)、企业管理域(MSS)和运营支撑域(OSS)等。ESS主要负责管理终端销售;BSS主要负责客户关系管理、数据采集系统、计费账务、综合结算、营销支撑等功能,它包括总部CRM、集中PRM和集中集团客户等系统;MSS主要负责电信企业运营的流程管理,它包括ERP、OA、财务和人力资源等系统;OSS是一个综合的业务运营和管理平台,同时也是真正融合了传统IP数据业务与移动增值业务的综合管理平台。它主要由网络管理、系统管理、计费、营业、账务和客户服务等部分组成。
来自合作伙伴的数据源主要包括公共机构和数据/知识合作伙伴,属于外部数据,价值密度中等,包含了第三方的用户/企业的各方面信息,需要与内部高可信数据相互验证,获取方式可通过合作伙伴直接获取。
来自互联网的数据源主要包括互联网的访问行为、互联网网站内容,属于外部数据,价值密度低,包含互联网上的各种行为/言论,可信度低,需要与内部高可信数据验证。互联网信息库的数据源主要来自移动用户上网日志和互联网数据,其中移动用户上网日志数据是采用FTP(文件传输协议)文件方式进行数据采集实现;互联网数据是建立多台服务器集群,通过实现分布式网络爬虫采集、插件采集、模拟采集等技术方式进行高效的互联网数据采集。
用户画像的第三步是对业务需求的理解,将业务语言转化为建模语言,为下一步的数据建模做准备。
根据具体的业务场景需求确定用户画像的目的,在此基础上制定用户画像标签,形成画像用户的特征标签库。
在数据建模完成后,需要对数据模型进行可视化的展现。所以画像步骤的最后一步就是给用户打上标签,即以可视化的形式清晰简洁地将数据建模的结果传达出来。
将业务场景与用户画像深度结合,筛选出具有价值的数据和客户,精准地定位目标客户,触达客户,对营销效果进行记录和反馈。以存量用户保有为例,具体步骤如下。
步骤1确定画像的目的,通过梳理各类流失模型应用场景得出流失定义,如不出账、极低三无、状态不正常行为等,然后根据流失定义确定用户画像的目的,即对定义的预警用户进行数量保有。
将用户画像技术应用在流失预警上需要对业务场景有深入的理解。确定流失预警的定义为拆机离网、不出账、极低三无和状态不正常。其中,离网用户毋庸置疑是流失;不出账用户根据探索和市场部经验基本可以定义为流失;极低三无用户约占整个离网人数的98%,且每个月离网速度在14%左右,需将这部分用户定义为流失用户,作为模型目标变量,确保后期模型能够提前在极低三无前发现目标;状态不正常的用户后期有67%转为不出账和极低三无,基本可以定义为流失用户。综上所述,得出流失定义为:如果用户在T月为在网出账、非极低三无、状态正常的用户,在(T+1)月及以后发生离网、不出账、转为极低三无、转为状态不正常即视为流失用户。随着3G与4G网络与业务的不断普及,用户在行为上也出现了风格迥异的局面,对全网用户笼统地构建流失模型已经完全无法适应当前情况,需要针对性差异化构建流失模型。目前,市场维系产品以合约(终端合约、单卡类合约)产品、单产品(裸机、流量包和语音包)、固网融合业务产品为主。
预测准确率计算式为:预测流失用户数P=预测流失(实际非流失)+预测流失(实际流失),P∩C=预测流失(实际流失)。预测准确率(查准率)等于正确预测用户数除以预测流失用户数。
将模型结果应用到合约到期流失预警名单、提前续约/逾期续约流失预警名单、单卡类用户流失预警名单中,每月输出移动互联网用户中流失概率为极高/高的用户并对其进行月度维系挽留,每天输出流失概率极高的特定人数用户并进行预警。模型应用对比结果如下。
(1)解决目标不明确
传统手段无法精准且全面地捕获流失用户;流失模型可以准确地捕获流失目标。
(2)解决方向不明确
传统的维系手段无法对不同流失原因的用户差异化营销;流失模型可以准确识别用户离网原因。
(3)解决节奏不明确
(4)解决资源浪费
传统手段无法区分流失风险大小,无法做到资源合理投放;流失模型针对不同流失风险的用户,精准化维系资源投放。