R数据分析：网络分析的做法，原理和复现方法|数据分析实例_宠物保险

对于复杂问题和现象行为的研究，尤其是他们之间还有复杂的交互影响（complexinterplay）的时候，网络分析（备用名：psychologicalnetworks,networkanalysisornetworkpsychometrics）是个备选的好方法，这个方法火了也没几年，感兴趣的同学可以去学学，而且，如果你再能把网络图做的美点，应该各个审稿人都愿意看的。今天尝试给大家做个网络分析的简单介绍。

举个例子，像physiological,psychological,socialandenvironmentalfactors等等如何影响肥胖，很复杂，做个多元回归？做个结构方程模型？这些都缺乏系统性的视角，从整体上把握肥胖的影响因素之间的关系，找最重要的干预靶点推荐用网络分析。

像健康，行为，心理，认知功能等等，反正就是复杂系统的分析，想不到课题了，就可以考虑在方法上上网络分析

Fromanetworkperspective,healthbehavioursandoutcomescanbeconceptualisedasemergentphenomenafromasystemofreciprocalinteractions:networkanalysisoffersapowerfulmethodologicalapproachtoinvestigatethecomplexpatternsofsuchrelationships.

Bloch-Elkouby,S.,Gorman,B.,Schuck,A.,Barzilay,S.,Calati,R.,Cohen,L.J.,Begum,F.,&Galynker,I.(2020).Thesuicidecrisissyndrome:Anetworkanalysis.JournalofCounselingPsychology,67(5),595–607.

通过网络分析作者就回答了三个问题：一是自杀崩溃综合征中不同症状的关系是什么？二是这些症状有没有哪几个格外重要？三是这些症状有没有一些聚集性？三个问题每一个都很有价值，一个网络分析全给你解决了，感兴趣的同学下载去读读。

还有一个点很重要，网络分析可以帮助你识别复杂系统的干预点，这个其实是很有临床价值的

networkanalysesallowforthecomputationofcentralityindicesthatprovideinformationaboutthesymptomsthatarethemostconnectedtotheothersymptomsincludedinthenetworkandwhosepotentialcausalcontributiontotheothersymptomsmaythusdeservefurtherinvestigation

如果你是搞人文社科的，由于其是一个针对复杂人文系统的作用关系，网络分析也是最容易帮助你提出原创理论假设的一项重要技术支撑。总体的意思就是想推动0到1的科研，这个方法必须要学。

一个最简单的网络，像这样

有好些点叫做node，这些点被线连起来的，线叫做edge。

Psychologicalnetworksconsistofnodesrepresentingobservedvariables,connectedbyedgesrepresentingstatisticalrelationships.Thismethodologyhasgainedsubstantialfootingandhasbeenusedinvariousdifferentfieldsofpsychology,suchasclinicalpsychology,psychiatry,personalityresearch,socialpsychology,andqualityofliferesearch

成图的基本步骤如下

首先得有数据间的统计模型，模型系数作为edge的权重，然后成图，然后评估模型。

本身来讲网络分析就是比较复杂的，网络的随机性相对于别的分析就要大一些，而且本身来讲我们的科研逻辑就是用样本反映总体，如果你做出来的网络不稳定你能说你发现的比如肥胖比如自杀的网络是可信的？所以做完网络分析之后我们对于网络的稳健性我们是一定要报告的，逻辑就是进行反复的bootstrap抽样，反复的重新估计模型，反复的重新计算confidenceintervals(e.g.95%CI)fortheiredgeestimates看看这些模型的差异从而评估模型的稳健性，通过edgestabilityanalysis我们可以得到网络各个边的权重的置信区间，区间越窄，说明网络越稳定。做edgestabilityanalysis的示例代码如下：

resboot1<-bootnet(Data,default=c("EBICglasso"),tuning=.5,corMethod="cor_auto",nBoots=1000,nCores=8,type=c("nonparametric"))通常这一部分论文中也会以图的形式报告出来。

在网络分析中每个节点的重要性是不一样的，是不是存在某些节点相对于另外的节点更重要？对节点重要性的评估的指标就是centralityindices，这个指标又包含3个指数strength,closeness,andbetweenness，三个指标的意思见下面：

strength,whichshowshowwellanodeisdirectlyconnectedtoothernodes,closeness,whichshowshowwellanodeisindirectlyconnectedtoothernodes,andbetweenness,whichquantifiesthenumberoftimesanodeactsasabridgealongtheshortestpathbetweentwoothernodes

简单的逻辑就是如果图中的一个点和另外的点连线多越强，那么这个点就重要，这个点也越应该放在图的中心；如果一个点和其他点的间接距离越近那么这个点越容易受到网络变动的影响；如果一个点平均来看总是在两两关系中起桥接作用，那么这个点对整个网络的构成就意义极大。

通常只报告strength就可以，因为其他两个指数都不太稳定。

作者报告了网络图还有模型的centralityindices，都是以图的形式呈现的，见下图：

还有Bootstrappededgeweightestimates，也是一个图：

那么我们今天就来看下，这个论文的图如何用自己的数据复现出来。

比如我现在有数据如下，有2800个观测，26个变量，最后一个变量是性别，其余的25个变量是5个5条目的量表：

首先我要做的是拟合网络模型，拟合网络模型用到的核心函数是estimateNetwork，通常我们只用设置data和default参数便可以运行，我们要通过lasso来简化网络的话就设置default="EBICglasso"，将拟合好的网络模型对象喂给plot即可以出网络图。

比如我要对男性观测拟合网络模型，可以写出代码如下：

network_male<-estimateNetwork(df%>%filter(gender=="Male")%>%select(-gender),default="EBICglasso",corMethod="spearman")运行完毕后，直接将模型对象喂给plot即可出图：

到这儿就基本算是完成了，但是要发表的话还是有点粗糙的，其实我们的数据中不同的字母（变量名）代表的是不同的量表，其实更好的方法是将各个量表的条目放一起，并且给出图例，使得其一目了然，所以接下来我们得对图形做一些调整。

比如我要对节点的整体布局做一个调整并且加上每个量表的图例，我就可以在代码中加上group参数，指明每个节点都是来自哪个量表的：

这样其实就好看多了，当然如果需要更细的图例，比如我想知道每个节点到底啥意思，我还可以用nodeNames参数加上节点的图例：

这样就更好了，赞。

但是我们注意AmericanJournalofPublicHealthResearch上的这篇研究是给边加了标签的，我们要出这样的效果的话只需要设定edge.labels为真就可以了，因为节点比较多，加上标签其实效果就不太好了：

我们接着再看作者的另外的两个图的做法，一个是centralityindices的图，我们只需要将模型对象喂给centralityPlot即可出图：

另一个是边的权重估计的图，只需要将模型对象喂给bootnet，并且plot就可出来：

可以看到我们的图的效果其实是比原文好的。

到这儿，原文中所有的结果都给大家复现完了。

今天给大家写了网络分析的做法，其实还有一块就是网络分析的对比，解决的问题是几个网络是不是不一样，或者同一个网络的某两个边是不是不一样，这个以后有机会给大家写。

如果你是一个大学本科生或研究生，如果你正在因为你的统计作业、数据分析、模型构建,科研统计设计等发愁，如果你在使用SPSS,R，Mplus中遇到任何问题，都可以联系我。因为我可以给您提供最好的，最详细和耐心的数据分析服务。

如果你或你的团队需要专业的科研数据清洗，建模服务，教学培训需求等等。请联系我。

Ifyouareastudentandyouareworriedaboutyoustatistical#Assignments,#Data#Analysis,#Thesis,#Reports,#Composing,#Quizzes,Exams..Andifyouarefacingproblemin#SPSS,#R-Programming,#Excel,Mplus,thencontactme.BecauseIcouldprovideyouthebestservicesforyourDataAnalysis.

AreyouconfusedwithstatisticalTechniqueslikez-test,t-test,ANOVA,MANOVA,Regression,LogisticRegression,Chi-Square,Correlation,Association,SEM,multilevelmodel,mediationandmoderationetc.foryourDataAnalysis...

ThenContactMe.IwillsolveyourProblem...

IfYouorYourResearchTeamNeedProfessionalScientificDataCleaning,ModelBuildingServicesorStatisticalConsulting...PleaseContactMe.

THE END

R数据分析：网络分析的做法，原理和复现方法

10个超有趣的经典数据分析案例！让你轻松了解数据分析！——九数云BI

电商数据分析数据分析实例

数据产品实践课：Excel数据分析实例

pandas数据分析案例：利用python进行汽车数据分析可视化实例–帆软

SPSS数据统计分析实例详解

实例解析｜App数据分析，其实没有你想象中的那么难

数据分析案例解析，掌握这些技能薪资翻倍

淘宝双11数据分析与预测课程案例—步骤五:利用ECharts进行数据可视化分析

统计学分析数据范文

原创数据挖掘案例——ReliefF和Kmeans算法的医学应用数据之巅

带你读《增强型分析：AI驱动的数据分析业务决策与案例实践》之二：大数据探索及预处理

Pandas数据分析：快速图表可视化各类操作详解+实例代码(一)我正在参加「掘金·启航计划」前言一般我们做数据挖掘或

数据分析的方法范例6篇

浙江省内部审计协会关于表彰2019年度优秀内部审计论文案例及“内部审计结果运用”经验的通报

R数据分析：网络分析的做法，原理和复现方法