产品经理好用易上手的数据分析方法数据挖掘奥巴马用户研究

数据分析从难易程度区分大致可以划分为5个层级,覆盖了数据整理、统计、机器学习的过程,数据分析后的决策环节不在本次讨论的范围。

Q1:SaaS销售人员拜访新客户次数的走势如何?

比如层级1,需要解的问题是量化现况。可以使用“叙述统计”、“数据可视化”等方法,把数据通过图表的方式表现出来,从中观察图表的数量、频次、波动、分布等等,这个层级主要是依赖可视化后的观察得以实现。

Q4:SaaS产品经理追踪哪些数据,才能知道用户下个月会不会取消订阅?

Q5:CEO该如何分配员工开发新客户,才能让营收最大化?

而层级4、5则是希望通过已有数据的样本,去预估未来数据的可能性/概率、最佳解或近似解,属于数据探索。

对于不同层级,需要面对的问题也不一样,可以层层递进,由易到难,逐一选择数据分析需要解的问题。在进入数据分析阶段,具备数据分析的层级结构认知尤为重要,这决定了你能够在对的时机做对的事情。

二、7种常见数据分析方法2.1总量分析

用于描述某个母群(population,指你想了解的集合体,可能是顾客或产品)或某个市场区隔,或者比较两个市场区隔的差异,是最常用、最简单的分析方法。

Q:哪些人会在酒庄办婚礼呢?

查阅过往3年、300位顾客的预约记录→分析性别、年龄、户籍地址→85%女性、平均年龄33岁、60%是当地人→如何针对这群人沟通、拓展业务?

观察2件或多件事情间的关系,期望能用一个因素解释或驱动另一个因素。

Q:为什么推出某个功能后,转化率会下降?

假设1:转化率跟浏览器有关。假设2:转化率跟有无网络信标(webbug)有关。

结论:

Chrome浏览器如果有网络信标,会造成转化率下降13%。Chrome浏览器造成转化率下降20%。60%的转化率下降仍然无法解释。

注:网络信标(webbug)是一个放在网页或电子邮件上的文件对象,用于监测用户的行为。

2.3趋势分析

Q:营收增长,但成长率却下降,原因出在哪?

步骤2,加入各产品、各渠道的营收和成长率。

观察结果:S成长率不断下降、M的站外成长率却在上升。

步骤3,量化影响。

观察结果:S占营收成长率下降的84%,必须集中心力采取行动。

2.4规模估计

在缺乏历史的情况下,以结构化的方法估算。通常用于进军新市场的企划,或是要了解未上市产品的销售潜力。

Q:想在广东某城市推广小学夏令营产品,怎么估算市场规模?

步骤1,分层。将问题切割,找出可能不同的市场区隔。

市区和郊区的小学密度可能不同

步骤2,设计方程式。确定哪些数值和因素可能影响正在估算的规模数值。

城市、人口和财富可能影响小学的数量

小学数量=城市数量x每座城市的人口数x每群人口的学校数量x财富因数(市区和郊区的财富对比)

步骤3,计算方程式。对方程式里的数值进行假设。

市区人口=50K,郊区人口=10K。

每10K人有1所学校,市区的财富是郊区的2倍。

市区小学估计值:20x50000x1/10000=200

郊区小学估计值:20x10000x1/10000=20

约有220所小学

2.5预测分析

分析目前和过去的事实数据,来预测未来的事件或行为,最常使用的统计技术是回归和分类。

Q:结账的转化率变低了,为什么?

利用逻辑回归建立模型(特别的回归形式,适用于因变数是二元性质,“有或没有”,此案例考量即为有转化或没转化)

因变数:想要预测的目标,如转化率。

2.6市场区隔

区隔顾客或产品成有意义的群组,通常是为了锁定目标,透过量身打造的方式,让该目标群体产生更高的价值。

Q:哪些客户只想折扣?哪些客户想要第一手信息?

用RFM模型为顾客分组。

2.7顾客生命周期分析

观察消费者的购买流程,以确定某一群顾客正处于哪个阶段,以及怎么将他们推向下一个阶段。

Q:怎么让使用者成为重度玩家?

三、4种统计数值掌握数据特性

手上有一群数据的时候,要快速掌握数据的特征,可以从“平均数”、“中位数”、“众数”和“标准差”下手。

Q:这是公司全体员工职业IT素养程度报告,身为公司数字化转型的负责人,该如何利用它拟定教育训练策略?

整体实力中等,满分10分,拿到平均成绩为5.8分。

组织实力分布不均,中位数低于平均数,表示能力落后的成员较多,应依能力设计不同的课程,或由能力佳者带领落后者学习。

员工职业IT素养程度表

四、2个叙述统计的陷阱

叙述统计虽然能够帮助我们掌握数据的特征,快速产生观点,但在应用平均数、百分比推导结论时,要留意陷阱。

4.1平均数陷阱

平均分提高了1.2分,表现优异。

平均数虽然提高了,但标准差只缩小0.6分,代表组织内程度差距未缩小,可能是有IT背景者进步幅度大,拉高了平均分。

4.2百分比陷阱

近3年员工职业IT素养的成绩持平,2021年成绩跟2019年一样。

不要用百分比去推算分数是否成长,因为每年的基期不一样,所以增长或减少的数值会不同。下表所示,2021年成绩比2019年少了0.71分。

五、5种数据比较的方式

「比较」是让数据产生意义的有效方式,但怎么比、跟谁比?我整理了5种比较方式,以拿到某品牌挂耳咖啡的销售数据为例。

5.1差距比较:分析对象和比较对象的差异

Q:某公司挂耳咖啡包全年营收3亿在市场上的表现如何?跟竞争对手的差距为何?

步骤1,选择比较对象,同类性质互比。

步骤2,设定比较基准值,绘制条形图。

A:挂耳咖啡包为A公司主力商品,虽然A公司在咖啡包全年收入上超越我们,但比起A公司,我们具有多项产品同步发展的优势。

5.2趋势比较:分析一段时期内市场、营收、产品的走势

Q:某公司挂耳咖啡包2021年营收3亿,跟前几年比有成长吗?成长了多少呢?

步骤1,搜集近10年公司咖啡包营收数据,绘制折线图。

步骤2,观察曲线走向,根据转折点、异常值推测变化的原因。

A:跟2020年比没有成长太多,但与2012年相比营收成长了10倍,显然贩售联名商品有效果。

5.3指数分析:利用总体市场数据,判断品牌的目标对象

Q:某公司挂耳咖啡包在市场上哪个年龄层最有优势?

步骤1,搜集比较对象的人口分布比例。

步骤2,计算指数数值。当指数小于95,代表在该年龄层为相对少数,指数大于105代表在该年龄层为相对多数。

A:咖啡包在25~44岁的客群中有竞争优势,45岁以上的客群还需要经营。

5.4异质比较:分析数据的结构是否明确偏向或集中某处

Q:假设挂耳咖啡包月度营收为250万,跟公司的其他产品相比表现算好吗?

步骤1,将所有产品月度营收分布由大至小排列,并记录区间次数。

步骤2,绘制直方图,注意分散的程度、峰值数量。

图1:一个峰值位于中间、图偏向「钟型曲线」,代表数据为常态分布,产品的营收平均值与中位数较不受异常值影响,分布比较平均。

图2:有2个峰值,平均数、中位数受异常值影响,数据分布不平均。

A:产品月度营收分布如图1所示,代表产品的月度营收分布平均,集中在151~200万区间,咖啡包收入250万高于平均,表现不错。

5.5变数分析:比较多个事件的关系,希望找到其中一个事件能去解释另外一个事件

步骤2,将数据绘制成分布图。

六、数据比较的陷阱

Q:患者死亡率是评估医疗品质的指标之一,试试从下表评判,A、B医院,哪间医疗品质更好?

无法评判。

参考表1时,B医院平均死亡率比A更低,B医院表现比A更好;但表2加入「轻重症死亡人数」变项时,A医院无论在轻症、重症死亡率都比B更好,为什么会这样?

原因:

因为A医院的重症人数是B的3倍以上,导致平均死亡率被拉升,只要A、B医院轻重症患者比例相同,就不会有类似的问题。这个案例被称为「辛普森悖论」现象,也就是当某项统计变项为搜集到(此例为轻重症人数比例),造成统计结果逆转的现象。

避免方式:

Q:许多世界知名的领导者都爱好运动,前美国总统奥巴马从小打篮球、youtube总裁沃西基擅长冰球。所以我们可以推测,「擅长运动的孩子,学习力更好」?

培养运动能力,未必能提升学习力。运动能力→学习能力→家长对教育的重视程度。重视教育的家长,会引导孩子学习,所以他们的成绩比较出色。重视教育的家长,会注意孩子的饮食均衡,导致体力变好。

X导致Y或Y导致X,其实存在另一个变数Z,是Z导致X和Y。举例来说,冰淇淋的销售量会随着穿短裤的人数增加而增加,不是「越多人穿短裤」导致「越多人买冰淇淋」,而是两种发生的共同原因是「夏天气温较高」。

八、利用A/B测试,确认因果关系

南美国总统奥巴马的竞选团队,便是利用RCT测试哪一种首页的注册率最高。结果相比原本想选择「影片」和「望向远方的独照」,最后经对实验选择「奥巴马全家福」的方案让注册人数多了288万人,并多募得6000万美元的政治献金。

如果环境不允许,或是没有资源做随机对照实验,《数据分析的力量》建议用「自然实验(naturalexperience)」替代,就是进行一系列假设、验证,厘清因果关系。

举例来说,想知道改变自付额,对医疗服务使用频率的影响。可以先假设「如果自付额会影响医疗服务的使用,70岁以上的人,应该会比70岁以下的人,更常使用」,因为日本法令规范,70岁开始,自付额由3成降为1成。

查询公开数据后发现,随着年龄愈大,医疗服务的使用者也愈多。但到了70岁,原本缓慢上升的曲线突然大跳跃!

这个「断层」代表有变数发生,而69~70岁比较普遍的改变,就是自付额的高低。自付额和医疗服务的使用频率有因果关系得到了验证。

THE END
1.产品经理必备之如何进行需求分析?如今产品经理逐渐发展出诸如数据产品经理、电商产品经理、金融产品经理、C端产品经理等细分类型,虽然不同细分类型在某些素质和能力方面有差异,但是需求分析一直都是所有产品经理的核心能力之一。 需求分析是将用户需求转化为产品需求的过程,笔者将这样的过程分为需求收集、需求分类、需求挖掘、需求分级四个阶段。本篇文章先...https://www.jianshu.com/p/2e81595ae216
2.产品数据运营分析(学会这6大数据分析方法,解决你99%的运营需求...(图为诸葛iodemo实操页面)漏斗分析模型已经广泛应用于网站和APP的用户行为分析中,例如流量监控、CRM系统、SEO优化、产品营销和销售等日常数据运营与数据分析工作中。(图为诸葛iodemo实操页面)在数据分析中,经常会用到用户画像分析,比如在漏斗转化过程中,有200个用户在某个流程中流失了,那我们需要对这200个用户进行画像...https://www.niaogebiji.com/article-626400-1.html
1.数据产品:深度探索与案例剖析?在当今数字化时代,数据产品正逐渐成为各行业发展的关键驱动力。让我们深入了解数据产品的分类与特点,以及通过典型案例分析,感受数据产品的强大魅力。 首先,数据产品主要分为报表型、分析型、平台型等不同类别。 报表型数据产品以直观的报表形式呈现数据,为用户提供简洁明了的信息展示。它通常具有固定的格式和指标体系...https://blog.csdn.net/KLWL_2022/article/details/143760618
2.如何分析用户数据和产品数据?51CTO博客产品类数据主要包括产品ID, 产品的描述, 产品的单价。 分析思路如下: 根据思维导图提出以下问题: 1.客户可以进行那些分类?哪些客户最具价值? 哪些客户最值得挽留? 2.客户分布在哪些国家?客户最多的国家?客户主要分布区域? 3.客户在哪时间段比较活跃? https://blog.51cto.com/u_15241767/2923309
3.你会怎样衡量你的产品?——一点产品数据分析的经验分享-尝试但是未完成文档的用户:本月注册成功,并尝试使用(编辑文档5次以上),但最终没有完成文档的。产品在哪些方面有问题,最终没有完成文档? 可以用神策查询出符合条件的用户,然后进行访谈 5. 总结 这里,我们以自己的产品文图为例介绍了产品数据分析的一些基本的内容,包括 ...https://www.douban.com/note/635605361/
4.产品数据分析常用的4种方法产品数据分析常用的4种方法 同样的数据不同的数据分析师解读出来的结论可能是不一样的,甚至是完全相反的,但结论本身没有对错,所以从客观的数据到主观的人,需要有一些科学的分析方法作为桥梁,帮助数据的信息更好、更全面、更快的传递。那么,针对产品,常用的数据分析方法有哪些呢?今天我们通过中琛魔方大数据与大家一...https://mp.m.ofweek.com/bigdata/a545683822926
5.产品数据分析的方法有哪些产品数据分析的方法有:趋势分析,对比分析,象限分析 ,交叉分析。 1、趋势分析 趋势分析一般用于核心指标的长期跟踪,比如:点击率、GMV、活跃用户数。一般做成简单的数据趋势图,但光制作成数据趋势图还不算分析,还需要观察数据上有哪些趋势上的变化,有没有周期性,有没有拐点,并分析背后的原因,无论是内部原因还是外部...https://36kr.com/p/1481744204398981.html
6.全域采集与增长分析数据采集与洞察流量统计分析大数据计算产品简介 全域采集为企业开展数字化营销沉淀重要数据资产,是营销增长的第一公里。Quick Tracking 全域采集与增长分析帮助企业实现APP、小程序、H5、Web、公众号等端的全旅程洞察,提供广告投放监测、流量统计分析、客群画像、性能体验监测、隐私授权管理等用户数据合规采集与洞察能力,安全合规地助力企业实现全域采集、体验...https://www.aliyun.com/product/man
7.用6个章节,帮你掌握常见的数据指标和数据分析模型优设网一文读懂设计师应该懂的数据指标和数据分析模型。 设计师为什么要懂数据? 市场现状不容乐观,伴随着红利(人口、流量)消退,资本寒冬,产品同质化严重,市场对设计师提出了更高的要求。除了审美层面的设计执行还远远不够,设计师需要具备数据眼光,从体验侧和商业侧入手,以数据为目标导向,精益设计,实现增长。同时随着数据方...https://www.uisdc.com/the-data-analysis/