统计计量吸烟的人更长寿?冰淇淋销量越好溺亡人数越多?——相关分析概述辛普森斯皮尔曼统计量正态分布

本文转载自公众号量化研究方法(phdthink)

“万物皆有联”,是大数据一个最重要的核心思维。

世界上的所有事物,都会受到其它事物的影响:

HR经常会问:影响员工离职的关键原因是什么?是工资还是发展空间?

销售人员会问:哪些要素会促使客户购买某产品?是价格还是质量?

营销人员会问:影响客户流失的关键因素有哪些?是竞争还是服务等?

产品设计人员:影响汽车产品受欢迎的关键功能有哪些?价格、还是动力等?

所以,在不引起混淆的情况下,我们也会用影响因素分析。

可视化的优点是:直观,但其缺点是:无法准确度量。比如腰围和脂肪比重,对体重的影响程度到底有多大?或者说,这两个因素中哪个因素对体重的影响会更大?散点图是无法给出答案的(所以,我们接下来要引入更强大的方法)。

显著性检验的步骤如下:

构建新的统计量t,如下所示

7显著性检验

构建新的统计量t,如下所示:

在变量X和Y服从正态分布时,该t统计量服从自由度为n-2的t分布。

计算统计量t,并查询t分布对应的概率P值。

最后判断(α表示显著性水平,一般取0.05):

第1步:绘制散点图

在SPSS中,绘制散点图非常简单。操作步骤如下:

点击【图形-图表】构建程序。

在库中选择散点图,双击简单散点图。

第2步:选择系数公式

在SPSS中,判断两变量是否服从正态分布操作步骤如下:

点击【分析-描述统计-探索】,进入探索界面。

将待判断的变量选入因变量列表。

注:当样本量大于50时用K-S检验结果,样本量小于50时用Shapiro-Wilk检验结果。

第4步:显著性检验

第5步:进行业务判断

然后,再从业务上对分析结果进行解读,并给出相应的业务策略或建议:

业务解读:腰围对体重的影响很大,脂肪比重对体重的影响较大。

业务建议:要减轻体重,最好先减小腰围,少吃脂肪类食物。

不明分布类型的定距数据;

两个数据序列的数据一一对应,等间距等比例。数据序列通常来自对同一组样本的多次测量或不同视角的测量。

结论分析

假设有两个数据序列A和B的秩分序列分别是{2,4,3,5,1},{3,4,1,5,2},即相对应的秩对为(2,3)(4,4)(3,1)(5,5)(1,2)。在按照A的秩分排序后,得到新的秩对(1,2)(2,3)(3,1)(4,4)(5,5),此时B的秩分序列变成了{2,3,1,4,5}。在这种情况下,针对第一个B值2,后面有3,4,5比它大,有1比它小,所以一致对为3,非一致对为1;第二个数字3,有4,5比它大,有1比它小,所以一致对为2,非一致对为1;依次类推,总共有8个一致对,2个非一致对。即Nc=8,Nd=2。

数据要求

适用于不明分布的定序数据;

案例分析

解题步骤

利用【分析】-【非参数检验】-【旧对话框】-【1样本K-S】命令对语文、数学、英语、历史和地理成绩进行正态分布检验。

结果解读

例一:想长寿吗?来吸烟吧!(……)

那我们再来回头看看还能从数据中找出来点儿什么。可能有朋友已经想到了,数据有缺失信息(比缺失值更甚),没错,年龄。在这随机抽取的1314个人里面,我们统计了一下,吸烟者中65岁以上的老年人只占8.4%,而不吸烟者中的老年人却占到了26.4%。这种年龄不均衡性就可以解释上述的现象了:不吸烟组他们的死亡率高是没错,但可不是因为人家不吸烟啊,而是因为本来这组老年人的比例就高,那20年以后自然死亡或者是患某种致命的疾病的几率本来就大啊!

例二:犯罪率和教育

如果说今天报纸的头条是这样写的:“美国高等教育现状令人堪忧:高学历更易引发犯罪”,你会有什么反应?是不是迫切地想知道为什么会造成这样的社会现象:是读书读多了压力过大容易变态吗?还是高学历社会认同感不够导致了容易仇视社会?还是美国高等教育真的有问题?然后又联想到几例最近听到的美国高校枪杀案呢,还有各种高科技犯罪的新闻,马上把这篇报道转到票圈,呼吁亲朋好友不要再到美国去留学了。

以上两个例子都属于辛普森悖论的范畴。有些看似的新发现啊、新言论啊,其实只是因为少考虑了一些潜在变量。

这类问题的常见种类总结如下:

上面的吸烟使人长寿的例子大家都知道是在忽悠,那么“吸烟可能导致肺癌”却是一个被普遍认可的观点。但是其实呢,从20世纪初直到现在,这种因果关系都受到科学界的各种质疑或者说怀疑。比如说也许肺癌与吸烟习惯的背后有一种共同的遗传因素只是人们还没有找到?现代统计学之父R.A.Fisher大家都认识吧?至少可能学统计的同学会认识他。他当时甚至认为,不排除“由肺癌导致吸烟”的这样一种可能性——也许在即将患上肺癌时,人们开始感觉不舒服或者感到烦躁,这时候比平常更容易吸上一支香烟来应对。这种论调呢,现在看来可能有点荒唐,但是的确给我们打开了一扇不走寻常路的这种逻辑门,避免我们落入定式思维的圈套。

THE END
1.课题研究方案2、拟定步骤: 1、现状调查及分析(20xx.3——20xx.4) 2、拟定可行性措施(20xx.4——20xx.5) 3、可行性措施的实施(20xx.6——20xx.9) 4、效果调查与分析(教学案例分析)(20xx.10) 5、研究总结(撰写结题报告20xx.11) 3、课题研究的方法: 1、调查法:采用问卷调查、个别谈话和学生座谈相结合的方法,对学生...https://www.jianshu.com/p/fc86bdb555c3
2.金牌班组长培训实务现场的问题分析与解决技巧 基本分析工具(柏拉图/鱼骨图/对策表) 8D方法训练 案例:丰田公司解决问题的思维模式 十二、生产现场改善与效率提升 现场改善的基本规则 现场改善是成本降低的基础 工作改善的误区 改善给企业及个人带来的影响 改善的观念 改善成功的两个必要承诺 改善合理化四步骤 PDCA循环改...http://www.hztbc.com/lesson/info_2737.html
1.高校学生工作案例分析的方法与技巧明确了作答步骤,案例分析的大框架便搭好了,其他就是在这个框架内充分发挥参赛选手的智慧和个性,把案例解说清楚、分析透彻。《关于举办第三届全国高校辅导员职业能力大赛的通知》指出,案例分析环节由“参赛选手现场抽题,分别从案例背景、问题关键点、解决思路、实施办法、经验启示等5个方面进行...https://www.enaea.edu.cn/pxztnew/gaodengjiaoyu/2013nianputonggaodengxuexiaofudaoyuanzhuantiyuanchengpeixun/cankaoziliao/2014-09-30/8878.html
2.华为全面面试资料解析:技术逻辑与产品知识要点5.1.2 案例分析的思路和步骤 进行案例分析时,首先需要理解案例的背景和目标。具体步骤可以分为以下几个阶段: 案例准备:阅读和理解案例的详细信息,识别关键的业务流程和目标。 问题识别:分析案例中出现的问题,确定问题的性质和范围。 数据收集:搜集与案例相关的信息和数据,为解决问题提供支持。 https://blog.csdn.net/weixin_42584758/article/details/141948176
3.案例分析标准答案举例6篇(全文)综上所述,跨文化交际看起来容易做起来难,需要各方面的综合素质。作为一名对外汉语教师,应在平时就注意培养自身的跨文化交际能力,并以此为基础积极推动汉语教学在世界范围内的推广。汉语国际教育硕士案例分析题答题方法 1.答题思路:按照 发现问题--分析问题--解决问题的思路。具体如下: ...https://www.99xueshu.com/w/filec62xwxvv.html
4.形题研究方案(通用13篇)1、课题研究的方案及报告。 2、案例分析及论文。 小课题研究方案 2 引导教师树立“问题就是课题,反思就是研究”的教育科研理念,依据“小步子、低台阶、快节奏、求实效”的原则,从教育教学中的小现象、小问题、小策略入手,通过小课题研究的形式,引领教师人人开展教学行动研究,提高学校总体教学水平。实施计划如下: ...https://www.oh100.com/a/202304/6615888.html
5....说到用户心坎儿里?——产品短描述撰写思路梳理和案例分析——产品短描述撰写思路梳理和案例分析 内容提要: 从用户视角理清整个购买决策流程 与其狂野地猜测用户的想法,不如从更有把握的方向入手——从产品定位本身出发 把自己装进用户画像里,走一遍用户决策流程,结合产品定位,找到文案方向——以跑步鞋为例 总结https://maimai.cn/article/detail?fid=1732071040&efid=WU9yZEBDuyJVPhsRQ0OUMg
6.案例分析大疆无人机海外营销思路揭秘三级市场:以日韩港为代表亚洲市场以及澳洲市场。三级市场还处于开拓阶段,大疆便着重提高品牌在该市场上的知名度,覆盖尽可能多的受众,进而根据亚澳市场不同国家的受众特点制定产品及营销策略。 对各个市场有了明确的了解和定位后,大疆又针对不同产品和产品用户群体,再次进行新的分析和定位。 https://www.cifnews.com/article/133266
7.一次分区大表索引整改的案例分析(上)腾讯云开发者社区绑定变量的值不同不能使用一种hint写法等,这样的结果倒推必须进行索引整改,以提高更好的查询效率,但如果涉及的是一张很大的分区表,索引整改必须很慎重,不然调整不理想可能会引起严重的性能问题,因此,本文想根据这个问题提供一种分析思路和操作步骤,使分区大表的索引调整的操作可以考虑得更全面些,更有效达到理想的...https://cloud.tencent.com/developer/article/1424891