数据指标与标签在数据分析中的关系与应用算法维度历史数据

一、何为指标,何为标签,两者有何区别?

1、从内容上看:指标通常描述客观事实,标签往往存在人为划分。

指标是用来定义、评价和描述特定事物的一种标准或方式,多为数值型。比如:新增用户数、累计用户数、用户活跃率等是衡量用户发展情况的指标;月均收入、毛利率、净利率等是用来评价企业经营状况的指标。

标签是人为设定的,根据业务场景的需求,对目标对象运用一定的算法得到高度精炼的特征标识,标签是经过人为加工后的结果。比如客群标签可以分为长尾客户、高净值客户;产品标签有高风险和低风险。标签并不是一个客观的事实,而是由人为的定义和客观事实结合得到的数据标签。其核心的目的是划分不同的实体群组。

从二者之间的关系来说,指标和标签之间是可以相互转化的。指标可以从标签中转化,比如高净值客户的迁移率,其中高净值客户和长尾客户都是标签,但在标签的基础上增加一个迁徙率,就由标签转化为了指标。

同样标签也可以从指标转化得来,比如说银行中常用的数据标签:私行客户(AUM>=1000万),其中AUM就是数据指标,不同银行的标签设定可能是不同的。

2、从分类和场景上看:指标和标签的分类原则不同,使用的场景也不同。

1.指标分类一般来说指标常用的分类是相对固定的,会将指标分为原子指标、派生指标和衍生指标三类。

2.标签分类标签可分为事实标签、规则标签和模型标签。

3.指标使用场景

指标通常拆解使用。比如一个较大的指标:客户数,可以拆解到不同维度上,并且加以限定词,比如手机银行客户数、七日内客户数的增量等,主要是用来监测和评价业务的效果。

4.标签使用场景

标签通常归纳使用,用来刻画某一个群体的特征,可以是客户也可以是产品,其核心是分类,给予不同类别不同的经营策略。

具体举例说明:指标体系通常会首先定义一个或几个北极星指标,比如银行常年使用AUM作为北极星指标,将北极星指标拆解到现金/存款、投资理财或其他业务模块,同时用户也可以拆解为活跃用户和非活跃用户等。以此基础可以梳理出整体的指标框架,从而指导业务。在标签的使用场景上更多的偏向一线的营销场景,包括客户的经营、精准营销和资格判断等。通过不同客户的标签将其分成不同的类别,并进行不同的活动、资格或者产品的推送。也可以给产品打标签,用来标识产品适合哪类人群,在平安银行口袋APP这样的平台就做到了千人千面,每个人进去看到的具体内容是不一样的,这就是通过标签去筛选圈定的。

数据指标就是将大数据之“大”的精髓给提炼出来,展现每日观察数据的使用者最迫切想要看到的统计量。数据指标体系并不是第三方服务公司的专利,只要对埋点科学地进行数据采集,每个成型的互联网公司都可以自己搭建数据指标体系。

数据之大,很多时候人们并不知从哪里着手,甚至弄不清自己到底想要什么数据,这时候数据产品经理这一角色应运而生。数据产品经理既要完成数据体系设计,让原本无序或庞杂的数据变得“规矩”,又要根据业务场景的变化不断调整项目内容,推进项目进度,推进数据指标体系的建设与迭代。

数据指标体系的规划是平台型数据产品经理必备的能力,这也是数据产品经理有别于其他产品经理和数据分析师的方面。

《荀子》有云:“水能载舟,亦能覆舟。”在公司日常运营过程中,数据指标体系就像是水,孕育着生命,承载着万物。科学的数据指标体系能指引公司在正确的道路上不断前进,或者使平淡无常的业务焕发新生,而不合理的数据指标体系可能使得业务方无所适从。

1、什么是数据指标体系?

在了解什么是数据指标之前,我们思考一下为什么会出现指标,它是为了解决什么问题。人类及科学的发展是与时俱进的,早期为了使自然科学的实验及结果更具统一性及方便标准化衡量,一些标准化的专业指标应运而生。

随着人类社会的发展,社会科学也越来越需要统计学来进行事物的衡量,一系列统计学指标也逐步产生了。随着新信息技术的发展,数据指标逐步被大众认可为衡量目标的方法。

从社会科学角度看,指标是统计学的范畴,用于数据的描述性统计。指标是说明总体数量特征的概念及其数值的综合,故又称为综合指标。

在实际的统计工作和统计理论研究中,往往直接将说明总体数量特征的概念称为指标。传统的指标有国内生产总值(GrossDomesticProduct,GDP)、国民生产总值(GrossNationalProduct,GNP)、居民消费价格指数(ConsumerPriceIndex,CPI)、沪深300指数等。

1.什么是数据指标?

数据指标有别于传统意义上的统计指标,它是通过对数据进行分析得到的一个汇总结果,是将业务单元精分和量化后的度量值,使得业务目标可描述、可度量、可拆解。

数据指标需要对业务需求进行进一步抽象,通过埋点进行数据采集,设计一套计算规则,并通过BI和数据可视化呈现,最终能够解释用户行为变化及业务变化。常用的数据指标有PV、UV等。

本文提及的指标是衡量目标的方法,指标由维度、汇总方式和量度组成(见下图)。

指标的构成

其中,维度是指从哪些角度衡量,是看待事物的视角与方向,决定了根据不同角度去衡量指标。汇总方式是指用哪些方法衡量,是统计汇总数据的方式。而量度主要是明确事物的具体目标是什么,是对一个物理量的测定,也用来明确数据的计量单位。

这里,我们可以理解为指标是由这几个方面构成,相当于英文的构词法,前缀、后缀等共同形成了一个单词。

2.什么是指标体系?

体系化的本质是将数据指标系统性地组织起来,具体会按照业务模型、按标准对指标不同的属性分类及分层。当然,不同的业务阶段、不同业务类型会有不同阶段的划分标准。

数据指标体系含有十分丰富的统计量,从宏观上看,它是一个相对全面的有机整体;从微观上看,每个数据指标都有其特定含义,反映了某一细节的客观事实。不同的数据指标定义不同,逻辑也不同,这些各种各样的统计量共同构成了数据指标体系,使其产生不可磨灭的价值。

2、数据指标体系的价值

数据指标体系是业务数据标准化的基础,其对指标进行了统一管理,体系化是为了方便统一修改、共享及维护。

宏观方面,数据指标体系建设是数据中台建设的重要一环,不仅符合“创新驱动”的意识,更是企业实现自身“数据驱动”发展的重要途径。

随着大数据和人工智能技术的发展,很多企业选择借助信息技术实现转型升级。在大数据时代早期,大部分数据并没有被充分地挖掘分析和利用。虽然数据规模非常大,但是却很难利用这些数据创造价值。而数据中台的提出及数据指标体系的构建,使得数据产生了实际价值。

有了数据指标,人们做决策时不再是按照经验“拍脑袋”,而是看看数据是怎样呈现的,能够及时基于数据进行战略调整及决策规划。

数据指标体系的价值主要体现在全面支持决策、指导业务运营、驱动用户增长,同时统一统计口径(如下图所示)。其中,作为压轴作用的统一统计口径对于数据指标体系而言具有战略意义。

在一个整体中,如果不能统一口径,那么一切分析及对比的参考价值就会显得无意义,各方也会陷入公说公有理,婆说婆有理的尴尬局面。由此说明,对于衡量整个公司的业务价值而言,建立一套统一标准的数据指标体系的作用不言而喻。

1.全面支持决策

数据指标极具参考价值,公司的管理层为了更准确地进行战略决策,需要搭建完备的数据指标体系。一个相对全面的数据指标体系,可以让管理者对公司的发展从数据层面有一个比较客观的认知,而不是管中窥豹,这样在进行战略决策时,可以保持相对理性。

而对于新业务的洞察,也可以不断融入新的数据指标,丰富指标体系,灵活且全面地把握业务发展趋势,为未来的决策提供借鉴。

2.指导业务运营

不懂数据的产品不是好运营,为了便捷地了解产品现状及业务效果,指标体系中会有很多拆解的细分指标,这些数据的变动反映的是用户对于运营情况的最新反馈,为运营的业务决策提供了数据支持。用户运营可以根据这些数据,了解用户的喜好,决定下一步的运营策略和活动开展。

例如,对于阅读行业来说,内容编辑会基于自己对内容的认知,将一组有共性特征的书籍组成一个书单推送给用户,那么指标体系中也会有相应的指标反映用户对这个书单的偏好。内容编辑就可以通过这些指标,了解用户的偏好,决定下一步是否要继续尝试这种类型的专题。

3.驱动用户增长

最近最火的词莫过于用户增长,数据指标体系中的用户行为数据,可以让产品及运营人员对用户的行为路径和喜好模式有一个比较深入的理解。剖析用户的行为特征,助力用户价值的提升,让产品及运营更聚焦于产品细节的优化,更好地进行监测,提升用户留存及转化。

人们在分析和挖掘用户行为的过程中,也许会发现不少新的用户增长点。体系化的指标结合了用户的场景,且多个不同的指标和维度可以串联起来进行全局分析,解决了非体系化指标无法串联的痛点。

公司在深入进行数据分析后,可能会在原有业务中发现某个点潜藏着巨大商业价值,从而单独把这块业务重点推进,实现用户增长的二次腾飞。

4.统一统计口径

从技术角度来看,数据中台是为了汇总与融合企业内的全部数据,甚至外部数据,打破数据隔阂,解决数据标准与口径不一致的问题。数据指标体系化有个好处是可以实现指标的统一管理,实现统一的统计口径,避免定义模糊和逻辑混乱,影响数据质量。

同时,完备的数据指标体系也可减少重复统计的问题,从而避免日志上报产生的数据冗余和重复分析产生的服务器资源浪费。

标签由标签和标签值组成,打在目标对象上,如图所示。

标签由互联网领域逐步推广到其他领域,打标签的对象也由用户、产品等扩展到渠道、营销活动等。

在互联网领域,标签有助于实现精准营销、定向推送、提升用户差异化体验等;在行业领域,标签更多助力于战略分级、智能搜索、优化运营、精准营销、优化服务、智慧经营等。

标签分为事实标签、规则标签和模型标签,如图所示。

标签管理分为标签体系建设和打标签。1、标签体系建设

2、打标签

1.打标签数据存储结构

打标签是建立标签值与实例数据的关系,可以对一个业务对象、一个逻辑数据实体、一个物理表或一条记录打标签。

为了方便从“用户”视角查找、关联、消费标签,可增加用户表,将标签归属到该“用户”下,这里的“用户”是泛指,可以是具体的人,也可以是一个组织、一个部门、一个项目等。

2.打标签的实现方法

事实标签:根据标签值和属性允许值的关系由系统自动打标签。规则标签:设计打标签逻辑由系统自动打标签。模型标签:设计打标签算法模型由系统自动打标签。

总结:

本文首先区分了标签和指标两个概念的一些异同;后面分别介绍了指标和标签体系的一些相概念,指标体系的梳理及应用价值等,标签要根据实际的应用场景出发,建立体系化的标签。

THE END
1.单片机原理及应用试题3.要访问专用寄存器和片外数据寄存器,应采用什么寻址方式?举例说明。 访问专用寄存器:可采用直接寻址或寄存器寻址。 访问片外数据寄存器:寄存器间接寻址 4.什么是堆栈?其主要作用是什么? 堆栈是后进先出的数据存储区 一般用于中断处理过程中,若需要保护现场数据(如内部RAM单元的内容),可使用入栈指令,将数据压入堆栈,...https://www.eeworld.com.cn/mcu/2015/0325/article_18949.html
2.自考大专00342高级语言程序设计(一)复习资料复习资料(l)数据定义语句——用来定义程序中使用的各种数据,及能存放数据的对象的名称和特性。 (2)表达式语句——任何在有意义的表达式之后接上分号(;)构成的语句。最常见的有赋值表达式和函数调用表达式后加分号构成的表达式语句,分别称为赋值语句和函数调用语句。 http://www.mdgs-edu.com/fxzl/1939.html
3.说明方法有哪些及作用答题模板7.下定义:这里运用下定义的说明方法,用简明科学的语言对……加以揭示,从而更科学、更本质、更概括地揭示事物的……。 8.列数字:这里运用列数字的说明方法,用具体的数据对事物的……加以说明,使说明更准确更有说服力。 9.列图表:这里运用列图表的说明方法,用列图表的方式对事物的……加以说明,使说明更简明更直...http://yw.ychedu.com/zxywcs/618225.html
4.《管理信息系统》考研复试整理数据结构:数据结构的描述重点是数据之间的组合关系,即说明这个数据结构包括哪些成分。 模块:是指独立命名并且拥有明确定义的实体。 模块化:即把系统功能自顶向下地、由抽象到具体地划分为多层次的独立功能模块,每个模块完成一个特定的功能,一直分解到能简单地用程序实现为止。 https://www.jianshu.com/p/7513a1521ed7
1.最强总结,必会的四大统计检验方法!!统计检验的定义 统计检验是一种统计学方法,用于判断样本数据是否支持关于总体参数的某一假设。通过对样本数据的分析,统计检验可以帮助我们做出科学推断,以确定原假设是否成立或需要被拒绝。 统计检验是统计学中最核心的内容之一,广泛应用于科学研究、工程实践、市场分析和医疗试验中,例如验证药物的疗效、比较不同教学方法...https://www.51cto.com/article/802237.html
2.数据分析之数理统计(总结版)配对样本 T 检验:用于比较配对样本(同一对象的两个状态或时间点)的均值差异。两个样本是成对的,数据之间存在关联性。示例:比较患者服药前后的血压。 9、假设检验和置信区间的关系? 假设检验是二分法(拒绝原假设或不拒绝),而置信区间提供了参数估计的范围。 https://blog.csdn.net/weixin_64648065/article/details/143916885
3.权威数据解释定义标准版93.82.96,定量分析解释定义在当今信息爆炸的时代,数据的权威性和准确性对于各行各业的发展至关重要,权威数据不仅能为决策者提供可靠依据,还能引导公众认知,推动社会进步,本文将围绕“权威数据解释定义”这一主题展开,以93.82.96这一数据为例,详细阐述权威数据的定义、特点及其解释的重要性。 https://anzewei.cn/post/1237.html
4.www.stats.gov.cn/zsk/snapshoot?reference=d466cfa12a8d807d0...知识库 知识分类:|知识来源: |发布日期:https://www.stats.gov.cn/zsk/snapshoot?reference=d466cfa12a8d807d0c267a76a75d1e42_BC0C3C82A36DB47D57F3B787239162EF&index=resource_data&qt=%E7%BB%9F%E8%AE%A1%E6%96%B9%E6%B3%95
5.oracle与gbase8s迁移数据类型对照以及举例说明oraclegbase8s是一个高性能的分布式关系型数据库,下面这篇文章主要给大家介绍了关于oracle与gbase8s迁移数据类型对照以及举例说明的相关资料,文中通过图文介绍的非常详细,需要的朋友可以参考下+ 目录 GPT4.0+Midjourney绘画+国内大模型 会员永久免费使用!【 如果你想靠AI翻身,你先需要一个靠谱的工具!】 声明:以下为笔者...https://www.jb51.net/database/310398pwd.htm
6.DMSQL程序中的SQL语句达梦技术文档通过SQL 语句及上一章介绍的各种控制结构,用户可以编写复杂的 DMSQL 程序,实现复杂逻辑的数据库访问应用。 5.1 普通静态 SQL 语句 5.1.1 数据操纵 在DMSQL 程序中,可以直接使用 INSERT、DELETE 和 UPDATE 语句对数据库中的表进行增、删、改操作。 举例说明: ...https://eco.dameng.com/document/dm/zh-cn/pm/dm8_sql-sql-statement.html
7.说明文的说明方法举例⑥、摹状貌:对事物的特征/事理加以形象化的描摹,使说明更具体形象。 ⑦、下定义:用简明科学的语言对说明的对象/科学事理加以揭示,从而更科学、更本质、更概括地揭示事物的特征/事理。 ⑧、列数字:用具体的数据对事物的特征/事理加以说明,使说明更准确更有说服力。 https://www.ruiwen.com/zuowen/shuomingwen/920093.html
8.元数据是什么?举例告诉你什么是元数据腾讯云开发者社区元数据,一个简单的定义是描述数据的数据。在企业中,无论哪里有数据,都有相应的元数据。只有存在完整而准确的元数据,我们才能更好地理解数据并充分利用数据的价值。为了让大家更好地了解什么是元数据,亿信华辰小编针对元数据的类型,举例说明什么是元数据。 https://www.cloud.tencent.com/developer/article/1654908
9.常见说明方法及作用5、作比较:说明对象的特点突出。 答题思路:把什么和什么进行比较,突出了说明对象的什么特点。 6、下定义:科学、准确、精练、严密。 答题思路:给什么下定义,科学、准确、精练、严密地揭示了说明对象的内涵。 论证方法及其作用 1.举例论证:所举的能证明论点的具体事例、概括事实、各种现象、统计数据,及作者对此所做...https://www.unjs.com/zuixinxiaoxi/ziliao/20170807000008_1418540.html
10.生物统计学复习资料抽样调查:根据一定的原则对研究对象抽取一部分个体进行测量或度量,把得到的数据资料作为样本进行统计处理,然后利用样本特征数对总体进行推断。 8.随机抽样满足条件:1)总体中每个个体被抽中的机会均相等;2)总体中任意一个个体是否被抽中是相互独立的 9.统计表要求:1)标题:简明扼要,准确地说明表的内容,有时须注明时...https://www.360doc.cn/article/17027296_768965437.html
11.会计视野法规库:《企业会计准则—关联方关系及其交易的披露》指南(一)本准则定义的说明 1、控制,指有权决定一个企业的财务和经营政策,并能据以从该企业的经营活动中获取利益。控制可以通过各种方式来实现,主要有: (1)通过一方拥有另一方超过半数以上表决权资本的比例来确定。表决权资本,是指具有投票权的资本。包括以下几种情况: ①一方直接拥有另一方过半数以上表决权资本。例...https://law.esnai.com/mview/2562
12.《企业会计准则(五)附则的说明 本准则及相关指南,均由财政部负责解释。 三、关联方关系披露举例 例1 :某一上市公司对外披露合并会计报表,所有子公司均包括在合并会计报表内 其关联方的有关情况如下: (一)存在控制关系的关联方 ┌────┬───────┬────┬──────┬───────┬─────┐ ...https://sjc.hebtu.edu.cn/a/2017/12/02/2017120211454361646.html
13.数以达理:量化研发管理指南本书先介绍了量化管理的基本概念,然后以软件研发活动顺序为主线讲述了如何识别与定义量化管理的对象、如何设计数据指示器、如何分析历史数据的分布规律、如何量化地分析因果规律、如何量化地预测未来、如何量化地控制过程、如何量化地管理过程改进,最后介绍了统计学的基本概念与假设检验在量化研发管理中的应用。 https://www.epubit.com/bookDetails?id=UB831725a362a3f
14.北大心理系“实验心理学”串讲资料远程成考17、操作定义:指用可感知、度量的事物、事件、现象和方法对变量或指标做出具体的界定、说明。操作定义的最大特征就是它的可观测性。 简答题: 1、举例说明操作定义在实验心理学研究中的应用。 ①操作定义或多或少给了我们一些检测假设构造的有效方法,虽然它并不能完全说明整个构造。 https://zikaoren.com/Get/ycck/1424.html
15.医疗器械临床试验设计指导原则(2018年第6号)需在临床试验方案中说明样本量估算的相关要素及其确定依据、样本量的具体计算方法。附录2提供了样本量估算公式的样例,供参考。确定样本量的相关要素一般包括临床试验的设计类型和比较类型、主要评价指标的类型和定义、主要评价指标有临床实际意义的界值、主要评价指标的相关参数(如预期有效率、均值、标准差等)、Ⅰ类和Ⅱ...https://flyingspd.com/news/policy/1344.html
16.说明文的说明方法说明文的方法:举例子、作比较、下定义、列图表、诠释法(又称作诠释)、打比方、摹状貌、引用、分类别、列数字等。 说明文的内容:按照不同的标准,说明文可分不同的类别:依据说明对象与说明目的的不同,把说明文分为事物说明文和事理说明文两大类。根据说明语言的不同特色,表达方式的使用情况的不同,把说明文分...https://www.yuwenmi.com/zuowen/shuomingwen/3623859.html
17.七年级数学上册教案教学难点:形象、有效地用统计图描述数据. 教学过程:.创设情景 引入新课 三.讲授新课: 请你用熟悉的事物描述 一些较小的数据:大象是世界上最大的陆栖动物 它的体重可达几吨。世界第一高峰——珠穆朗玛峰 它的海拔高度约为8848米。 1.哪些数据用科学记数法表示比较方便?举例说明. ...https://www.wenshubang.com/jiaoan/2825967.html
18.说明文的写作技巧相信大家都接触过作文吧,尤其是说明文,说明文是以说明为主要表达方法的介绍事物、解释事物的文体。要求使用一定的说明方法,如定义、分类、举例、数据、图表等。我们要怎么去写这类型的作文呢?以下是小编帮大家整理的说明文的写作技巧,欢迎阅读,希望大家能够喜欢。 https://www.fwsir.com/fanwen/html/fanwen_20211211153516_1515659.html