标签是人为规定的高度精练的特征标识,电力用户主要以家庭为单位定义属性标签,如:家庭人口数量标签,3人等;住房区域标签,金水区等。标签呈现出两个重要特征:①语义化,人们能很方便地理解每个标签含义,这也使得用户画像模型具备实际意义,能够较好地满足业务需求,如判断用户偏好;②短文本,每个标签通常只表示一种含义,标签本身无需再做过多文本分析等预处理工作,这为利用机器提取标准化信息提供了便利。
如图7-2所示,电力用户标签体系主要包括两个类别:一是社会属性,包括基础属性、人口状况、房屋状况、热源类型等,描述了电力用户的基本类型特征,反映了用户用电模式和用电需求宏观差异的原因;二是用电行为,包括负荷模式、用电设施、信用等级、需求响应,描述了电力用户用电行为基本特征,体现了用户用电行为的微观差异,是提供个性化用电服务的基础。
图7-2用户画像标签体系
数据源分析
图7-3电力用户画像数据源
用户画像建模与大数据分析方法
如图7-4所示,基于大数据的电力用户画像分析系统及其建模方法和过程主要包括:
图7-4用户画像大数据建模分析系统
(2)数据中转系统。数据中转系统通过数据交换子系统和外联应用网关,实现数据文件、日志文件、实时数据及第三方数据集成融合,为大数据分析平台提供数据输入。
标签建模
标签建模是电力用户画像的关键环节,如图7-5所示,目标是根据用户的属性和用电行为为其打上标签,并计算标签的权重。主要过程包括:
图7-5用户画像标签建模方法
(1)数据统计。利用大数据平台对用户各种静态和动态用户数据进行统计分析,为用户赋予事实标签。比如某用户可以定义标签为“三之家、普通住宅、12—14点用电高峰、无违约行为”等
w=r*wb
式中:wb为行为权重。
通过标签的建模分析可以为用户赋予包含标签的权重的模型标签,形成用户兴趣爱好、渠道偏好、用电偏好、活跃度、关联关系、满意度、信用风向等级等动态标签。