STRINGCytoscape网络互作图0820LL

网络图(Network)看似复杂,其实构成非常简单,网络图是一种图解模型,形状如同网络,故称网络图,由节点(node)和连线(edge)两个因素组成的。其中node又分为sourcenode(源节点)和targetnode(目标节点)两个因素组成的。这里的node就是我们的基因,edge就是基因间的相互作用关系。任何网络图都不外乎这些构成成分。知道了网络图的构成之后,再做图分析就很简单了。

edge就是基因之间的相互作用关系。比如两个基因TP53和CXCL12之间是否有相互作用关系呢?通过什么方法进行判断呢?这是一个比较困难的问题。好在,有一些非常好的数据库帮我们解决了这一问题,比如最著名的就是STRINGdatabase。

STRING数据库中包含有实验数据、从Pubmed摘要中文本挖掘的结果、综合其他数据库的数据,另外还有利用生物信息学的方法预测的结果,所应用的生物信息学的方法有:染色体临近、基因融合、系统进化谱、基于芯片数据的基因共表达等。

Cytoscape是一套完整的网络图分析系统,它不仅仅是一个软件,还包括了一系列编程语言接口、appstore等诸多内容,是网络分析领域的龙头老大。Cytoscape能够帮助我们实现基因互作的可视化网络图,并且通过其诸多分析插件帮我们找到这里面的关键基因。

step1从基因列表到蛋白互作

step2从蛋白互作到互作网络

step3从互作网络到关键基因

step1准备基因列表

这个基因列表的文件说白了就是一列基因,对于基因的数量最好是50-300个。

step2打开STRING数据库

点击SEARCH,然后就会跳转到让我们输入基因列表的页面,如下图所示,我们点击"Multipleproteins",再依次输入我们的基因列表和物种名称,点击SEARCH即可。

然后STRING数据库会搜索我们提交的蛋白,点击CONTINUE即可。

之后就会出现这些基因的互作网络图了。这个网络图中有很多彩色的点,这个颜色是随机分配的没有生物学意义,有的点中还有花花绿绿的蛋白质的三维结构,这个对我们来说也不是非常重要,重要的是蛋白之间的连线,这就是相互作用。

图的下面有很多的panel,这里面蕴含了很多功能,其中最主要的就是Exports,从这里可以输出我们想要的图形和网络。

对于初级分析来说,网络图就可以了;当时如果是高级分析和美观的网络图,比如需要找到关键基因,需要发表质量的高级网络图,那就需要源文件了,源文件是一个tsv文件,通过它,可以制作各种各样的网络图。

step3Cytoscape美化网络图

网络文件包括多种格式:TXT、SIF、GML等,这些都是Cytoscape能够识别的,其中最常用的就是TXT文本格式。这种格式是最简单的,其实就是从Excel中复制出来的表格,其格式如下:

(1)第一行,默认作为列名,所以不要有重复的名字

(2)从第二行开始就是节点之间的相互作用关系了

(3)数据至少包含两列,第一列是SourceNode,第二列是TargetNode

就拿我们从STRING生成的网络图源文件为例,我们生成的是一个名为string_interactions.tsv的文件,这是一个文本文件,用Excel把它打开之后是这样的

将该文件导入到Cytoscape中

File-->Import-->NetworkfromFile即可导入文件

点击导入文件,找到要导入的网络文件,即string_interactions.tsv文件,导入之后是这样的。Cytoscape会自动识别最重要的两列:SourceNode和TargetNode,一般就是前面的两列。

如果自动识别的不对,可以自己指定。点击表头,会出现一个下拉菜单,然后自己选择指定即可。除了SourceNode、TargetNode其他列数据的属性还包括InteractionType、EdgeAttribution、SourceAttribution、TargetAttribution等,同时对应不同颜色和图标标记。

指定好数据列之后,点击OK即可,数据导入到此为止,软件会自动生成一个网络图。

页面布局

Cytoscape是一个非常庞大的软件,其功能非常丰富,页面布局也很复杂,在我们导入网络图数据后,其会自动帮我们生成一个网络图,如下

从上图中可以看出,页面相当复杂,而其中我们最常用的区域就是两个:控制面板和网络图区。

控制面板是我们用的最多的地方,这里面至少包括了三个子面板:

1)Network:网络图列表,这里以树形图的方式罗列了我们打开的所有网络图

2)Style:外观可视化控制面板,这个面板控制了我们的网络图的外观,所有的外观设计都在这个里面,这个面板也包括三个子面板:

--Node:控制节点的外观,包括大小、颜色、形状等,使用频率很高

--Edge:控制连线的外观,包括颜色、粗细等,使用频率很高

--Network:控制网络图的外观,如背景色等,使用较少

3)Select:筛选,即从整个网络图中按照用户的要求去选定特定的Node或者Edge。

其实整个Cytoscape页面布局中最重要的就是控制面板,而通过控制面板中特定属性的设置,我们可以随心所欲的改变网络图的外观。

Cytoscape的应用商店

Cytoscape的菜单栏中有很多的功能栏,其中Apps就是很重要的一个,其提供了非常多的功能插件,使得Cytoscape的功能根据用户的需求无限延伸。

寻找关键基因

通过使用Cytoscape插件MCODE或者Cytohubba可以从网路图中找到关键基因

第一步打开网络图

找到以.cys结尾的网络图文件,导入到Cytoscape中

第二步安装插件

第三步运行插件

MCODE的使用

在Apps中点击MCODE,然后会在控制面板中出现Mcode这一面板,点击AnalyzeCurrentNetwork即可。

Cytohubba的使用

Cytohubba的使用也比较简单,但是相对于MCODE来说,Cytohubba提供了更多的算法来对基因的重要性或者说核心程度进行排序。使用Cytohubba的话,首先也是在Apps当中找到Cytohubba,点击以后会在控制面板中出现Cytohubba的子面板,然后按照我们下面的步骤操作,逐步点击即可:

这里可以跟大家罗列一下Cytohubba所提供的核心基因筛选算法有哪些。算法虽多,但是这些算法的具体方法不需要我们大家掌握,只需要知道怎么用怎么选择就行了。

THE END
1.7+单细胞+WGCNA+验证,思路新颖,换个病种也能轻易复现!灰色模块代表没有相似表达模式的基因,并被删除以进行进一步分析。如结果所示,土耳其石模块中的基因与脆弱斑块的发生最显著相关(图 4A)。散点图显示,97 个共表达基因与绿松石模块中的脆弱斑块性状高度相关,模块隶属度 >0.8,基因显著性 >0.7(图 4B)。通过在单细胞 RNA 测序数据集中结合共表达基因和 DEGs 获得了 ...http://www.360doc.com/content/24/1128/18/73795974_1140657649.shtml
2.整合GWAS和WGCNA筛选鉴定甘蓝型油菜生物产量候选基因其中, 加权基因共表达网络分析(weighted gene co-expression network analysis, WGCNA)能够特异筛选出与目标性状高度关联的基因, 并进行模块(module)化分类, 得到具有高度生物学意义的共表达模块(co-expression module), 能够有效筛选到核心基因(hub genes)[33]。WGCNA算法作为一种精准、高效的生物信息学及生物数据挖掘...http://school.freekaoyan.com/bj/caas/lunwen/2021/12-26/1640496850331977.shtml
3.我得到转录组分析的wgcna数据需通过cytoscape筛选关键模块的hub...这个权重值没有统一的标准,可以根据自己的需要选择多个筛选阈值,分析hub基因,直到筛选合适的;https://www.omicsclass.com/question/6851
1....互作网络及寻找核心基因)cytoscape筛选核心基因在制作蛋白质互作网络时,我们需要先从公开数据库或者文献中获取蛋白质相互作用数据,将其输入Cytoscape软件,然后进行网络构建和可视化展示。最终,我们可以得到一个复杂的蛋白质互作网络图,其中节点表示蛋白质,边表示蛋白质之间的相互作用关系。 在寻找核心基因时,我们可以利用Cytoscape提供的网络分析工具,如度中心性、介数中...https://blog.csdn.net/m0_53915752/article/details/132600331
2.核心基因筛选:基于EXCEL腾讯云开发者社区昨天我们介绍了利用STRING数据库来进行蛋白相互作用预测(STRING:蛋白相互作用数据库的使用),但是我们只是获得了相互作用网络分析的数据以及可以使用的相关网络分析的图,对于核心基因的筛选还是没有涉及。今天就介绍一下如何来筛选核心基因吧! 对于核心基因筛选的方法有很多的,如果是使用专门的插件的工具的话,那cytoscape里面...https://cloud.tencent.com/developer/article/1636266
3.求助cytoscape中应用Mcode绘图时,为什么会出现那么多核心基因杨宏浩1 临床医学医学生 请问解决了吗?我也遇到这个问题 2020-03-18IP未知未知 收藏回复点赞 ...https://www.dxy.cn/bbs/newweb/pc/post/42917737
4.基于生物信息学分析肝细胞癌的核心基因目的 采用生物信息学方法筛选在肝细胞癌中的异常表达基因,并分析其在肝癌中的临床意义及其可能的机制。方法 通过GEO 数据库获取 GSE101728 基因芯片数据集,筛选差异基因;通过 STRING 和 Cytoscape 筛选出核心基因;利用 GEPIA 验证核心基因在肝癌组织中的表达及其临床意义,进一步利用 DAVID 进行 GO 分析及 KEGG 通路...https://www.cjebm.com/article/10.7507/1007-9424.202002087
5.基于生信分析对脓毒症相关性脑病中神经炎症相关核心基因的筛选采用STRING构建蛋白质-蛋白质相互作用网络、Cytoscape以及Lasso回归分析筛选核心基因。构建LPS诱导BV2小胶质细胞活化体外细胞模型,采用实时荧光定量PCR(quantitative real-time PCR,RT-qPCR)检测基因表达;采用慢病毒载体法过表达组蛋白去乙酰化酶9(histone deacetylase 9,HDAC9),Western blot检测炎症相关分子表达。结果:...https://www.cnki.com.cn/Article/CJFDTotal-NJYK202407018.htm
6.桑寄生茯苓药对治疗膝骨关节炎作用机制网络药理学研究将上文获得的药物靶点与疾病基因载入Draw Venn Diagram-Universiteit Gent绘制Venn图。并用Excel表格函数公式取得交集靶点。 1.5 核心靶点筛选 交集靶点用STRING做蛋白互作(PPI)网络,最低互动分0.7,输出TSV文件,再导入Cytoscape中,用“Network Analyzer”插件计算每个靶点Degree(度值),根据Degree降序排序筛选核心靶点。 https://www.91xueshu.com/l-ggjlw/87747.html
7.肝细胞癌关键基因的生物信息学分析STRING数据库,认为置信度≥04为PPI显著.分析结果导入Cytoscape3.6.1软件中进行可视化分析[13].利用cytoHubba插件并选择degree[14]算法,从PPI网络中筛选核心基因,选择degree≥85的79个DEGs作为核心基因. 1.6关键基因的表达与生存预后分析 使用在线工具UALCAN[15](http://UALCAN.path.uab.edu)分析并验证核心DEGs的表达,...https://www.fx361.com/page/2021/0910/9548588.shtml
8....挖掘种公鸡睾丸和附睾中影响精子活力的核心基因Cytoscape 软件筛选每个关键模块的核心基因并构建可视化共表达网络? 结果表明?14 227个基因聚类到 11 个模块?以决定 系数( R2 ) ≥0 6,P<0 05 为标准挖掘出青绿色( Turquoise) 模块,黄色( Yellow) 模块,红色( Red) 模块与表型显著相 关? 对 3 个关键模块的基因进行功能分析?发现这些基因显著...http://jsnyxb.jaas.ac.cn/oa/pdfdow.aspx?Sid=202303017
9.基于生物信息学方法分析食管鳞状细胞癌中的核心基因及初步验证通过韦恩图筛选出ESCC及配对正常食管组织的差异性表达基因(differentially expressed genes,DEGs),运用DAVID在线工具对差异基因进行GO富集和KEGG通路分析。利用STRING数据库和Cytoscape软件发掘ESCC核心基因,并在GEPIA和Kaplan Meier Plotter数据库对核心基因进行表达水平验证和生存分析预测。2.选取TTK和CDKN3两个蛋白进行免疫...https://mall.cnki.net/magazine/Article/CMFD/1021157589.htm
10.基于生物信息学分析早期液体复苏改善脓毒症休克的核心基因及通路随后,使用Cytoscape的分子复合物检测(molecular complex detection,MCODE)插件(版本3.7.1)在脓毒症休克的PPI网络中创建子类[9]。再通过GO图包处理[10],得到差异表达的核心基因。核心基因标准为:关联程度阈值(degree cutoff)=2,最小核心阈值(K-core)=2,节点评分阈值(node score cutoff)=10.2。 2 结果 2.1 筛选...https://www.coretina.com/article/10.7507/1671-6205.202101027
11.基于蛋白质互作网络挖掘自闭症谱系障碍的功能模块与核心基因通过 Cytoscape 3.7.2 软件进行可视化和连通度分 析, 将筛选出的连通度大于 25 的节点作为 PPI 网 络的重要基因. 1.3 功能模块及核心基因识别 利用 MCODE (Molecular Complex Detection)算 法对 PPI 网络中的节点进行密度聚类[12].首先排 除连通度小于 3 的节点, 计算纳入节点的核聚类 系数(core-clustering ...http://smkx.hunnu.edu.cn/EN/article/downloadArticleFile.do?attachType=PDF&id=2294
12.GEO基因芯片分析结合网络药理学及分子对接技术探析"黄连通过Cytoscape 3.9.1软件构建"中药-活性成分-疾病-靶点"网络和蛋白互作(protein-protein interaction, PPI)网络并进行拓扑分析, 以此筛选出主要活性成分及核心靶点; 同时利用Metascapes数据库进行基因本体(gene ontology, GO)富集分析和京都基因与基因组百科全书通路(kyoto encyclopedia of genes and genomes, KEGG)富集分...https://www.wjgnet.com/1009-3079/full/v31/i20/852.htm
13.基于网络药理学和分子对接探讨大花红景天在2型糖尿病合并阿尔茨...通过 Cytoscape 3.7.2 软件进行网络拓扑分析。以 2 倍“degree”中位数进行筛选得到新的网络,再分别以“degree”“betweenness centrality”和“closeness centrality”这 3 个参数的中位数为界值得到核心基因网络,其靶点定义为核心基因。构建药物-活性成分-核心基因-疾病互作网络图,依据度值(degree)排名筛选 RC 抗 ...https://www.wcjm.org/article/10.7507/1002-0179.202211164
14.WGCNA分析,简单全面的最新教程(在线做,但也需要懂原理)从关键模型中选择感兴趣的驱动基因,或根据模型中已知基因的功能推测未知基因的功能。 导出TOM矩阵,绘制相关性图。 WGCNA包实战 R包WGCNA是用于计算各种加权关联分析的功能集合,可用于网络构建,基因筛选,基因簇鉴定,拓扑特征计算,数据模拟和可视化等。 输入数据和参数选择 ...https://blog.51cto.com/u_16077014/6252500
15.基于生物信息学的特发性肺纤维化关键基因及miRNA分析方法 首先从Gene Expression Omnibusl( GEO) 数据库下载2个基因芯片数据集:GSE5384和GSE24206,通过R语言分析得到差异表达基因,并进行GO 、KEGG通路分析,使用STRING及Cytoscape软件进行蛋白质-蛋白质相互作用网络分析(PPI),从而得出核心基因,最后通过NetworkAnalyst网络构建寻找潜在miRNA。结果 筛选出137个差异表达基因。GO...https://www.yywsbjb.com/h-nd-3796.html
16.基于网络药理学联合加权基因共表达网络分析探究雷公藤治疗系统性...1.8 蛋白相互作用(PPI)网络的构建 将交集靶点基因导入 STRING 11.5 平台[16]隐藏 离散的靶点,构建 PPI 网络,再将 PPI 网络导入 Cytoscape 中可视化,并通过 cytoHubba 插件[17]筛选 核心靶点基因.核心靶点网络构建方法相同. 1.9 表达量与诊断分析 提取核心靶点基因表达量,分析在正常样本和 SLE 患者之间的差异,并...https://www.tiprpress.com/xdywlc/article/pdf/20221007