开通VIP,畅享免费电子书等14项超值服
首页
好书
留言交流
下载APP
联系客服
2021.05.06
解螺旋公众号·陪伴你科研的第2555天
期刊简介
◆NetworkAnalyst数据库
◆Enrichr数据库
◆Cytoscape软件及cytoHubba插件
数据解读
详细解读如下
流程图用PPT、思维导图软件、photoshop等都能实现,这里不再赘述。
图2、从SARS-CoV-2感染差异表达基因和IPF患者的差异表达基因中发现共同的差异基因
GSE147507数据集用于分析COVID-19的DEG,使用GSE35145数据集分析IPF的DEG,并用韦恩图取两者的交集。
输入数据集名称【GSE147507】→【检索】→【数据下载】
此数据集包括了人体细胞实验(GPL18573)和动物实验(GPL28369)的数据,本分析只用下载细胞实验数据,即【GSE147507-GPL18573_series_matrix.txt.gz】(数据基本信息介绍)和【GSE147507_RawReadCounts_Human.tsv.gz】(原始counts数据)。
将【GSE147507-GPL18573_series_matrix.txt.gz】解压并打开,查看每一列标本代表什么含义,可以看到,本分析只需要健康人的标本(Lungbiopsyforheatlynegativecontrol)和COVID-19患者的标本(LungsamplefrompostmortemCOVID-19patient),因此选取Series15的结果即可。
将【GSE147507_RawReadCounts_Human.tsv.gz】解压并打开
选择Series15的数据,将其他数据删除,并将第一行第一列命名为【id】
在第一行插入新的一行【group】,并根据样本特征输入【control】和【COVID19】
【高级版】→【立即使用】
注:免费版和基础版都可以进行统计和可视化,由于高级版功能最全,这里选择高级版作为范例
【分析工具】→【表达差异(挑)】→【差异分析】→【测序数据-counts格式】→上传刚刚保存的文件→【确认】
在【历史记录】中可以看到分析的状态,待状态变为【完成】时,即可【下载】,这里我们【CSV表格下载】
打开文件→【筛选】→【padj】的小三角→【数字筛选】→【小于】
【小于】→【0.05】→【确定】
【log2FoldChange】旁边的小三角→【数字筛选】→【大于】
【大于】→【1】→【或】→【小于】→【-1】→【确定】
这样挑选出所有padj<0.05并且|logFC|>1的所有基因了。
将第一列选中并复制
将其粘贴到新的表格中,并将列名改为【COVID19】
再次回到仙桃学术【数据集检索】→输入数据集名称【GSE35145】→【检索】→【GEO2R】
【Definegroups】→将标本分为【IPF】和【normal】→【Analyze】
打开文件,用上面同样的方法挑选出所有padj<0.05并且|logFC|>1的基因,并复制基因名列。
粘贴到前面保存的文件中,并将列名改为【IPF】,保存这份文件,这样韦恩图的文件就准备好了
图3、GO/KEGG富集分析
表1、GO及对应的P值
表2、KEGG及对应的P值
这里1张图2张表都可以在仙桃学术里完成。
【分析工具】→【功能聚类(圈)】→【GO|KEGG】→【GO|KEGG富集分析】→将韦恩图中获得的2个基因集的共同基因名粘贴到【分子列表】→【条目】中选择【GO-BP】→【确认】→【保存结果】或【下载结果】
【保存结果】,并且记得给这个结果起个响亮的名字,比如“GO-BP”这样就能直接进行【GO|KEGG可视化】分析啦
【Word三线表下载】,打开文件,将此结果填入表格即为Table1。
【GO|KEGG可视化】→选择刚刚保存的【GO|KEGG富集分析】结果→调整图片的风格→【确认】→【保存结果】并【下载结果】
分析其他项目,只需更改【富集分析条目】为【GO-CC】、【GO-MF】、【KEGG】,下载结果填入表格,并可视化。
图4、COVID-19和IPF共同差异基因的PPI网络
【MultipleProteins】→将差异基因粘贴进【LisofNames】→选择【Homosamples】→【SEARCH】
【CONTINUE】
下载bitmap,即为图4;下载textoutput,可作为cytoscape的输入文件。
图5、从差异表达基因的PPIs网络中检测hub基因
表3、前5个hub基因的分析结果
图6、hub基因的关联度分析
以上2张图1张表均可以Cytoscape软件中完成。
打开Cytoscape软件→【File】→【Import】→【NetworkfromFile】→打开从STRING数据库下载的文件
【OK】
【cytoHubba】→【Calculate】→【Top10Degree】→点【Checkthefirst-stagenodes】前勾勾→【Submit】
【Layout】→【CircularLayout】即为图5
【Export】
打开文件,按【Degree】降序排列,将前5个基因数据填入表格,即为表3
【ClusteringCoefficient】→点【Displaytheexpandedsubnetwork】前勾勾→【Submit】即为图6
图7、TF基因与差异基因互作网络
图8、TF-miRNA调控网络
以上2张图片均可在NetworkAnalyst数据库完成。
选择【H.sapiens】→【OfficialGeneSymbol】→输入基因名→【Upload】→【Proceed】
选择【TF-geneInteractions】→【ENCODE】→【OK】
【Proceed】
调整图片颜色和形态→【Download】→选择特定格式下载即为图7
回到前页
选择【TF-miRNACoregulatoryNetwork】→【OK】→【Proceed】
调整图片颜色和形态→【Download】→选择特定格式下载即为图8
表4、潜在候选药物
输入差异表达的基因名→【Submit】
选择【Diseases/Drugs】
找到【DSigDB】并点击
选择【Table】即为表4
3.基于基因富集分析了SARS-CoV-2和IPF感染的hub基因,对于药物化合物的预测更加有效。