String数据库是一个可以用来检索已知蛋白和预测蛋白之间相互作用的数据库。除了可以对这些蛋白生成精美的蛋白质-蛋白质-互相作用(PPI)图,还提供了输入蛋白的的分析,包括常见的功能富集分析(GO、KEGG),参考出版物等。
String数据库主要包含以下功能:
Network
Summaryview:showscurrentinteractions.Nodescanbemoved;popupsprovideinformationonnodes&edges.摘要视图:显示当前的交互。节点可以被移除;弹出窗口提供关于节点和边缘的信息。
Experiments
Databases
Textmining
Automated,unsupervisedtextmining-searchingforproteinsthatarefrequentlymentionedtogether.自动的、无监督的文本挖掘--搜索经常在一起有关的蛋白质。
Neighborhood
Groupsofgenesthatarefrequentlyobservedineachother'sgenomicneighborhood.在彼此的基因组邻域中经常观察到的基因组。
Fusion
Genesthataresometimesfusedintosingleopenreadingframes.有时融合成单个开放阅读框的基因。
Cooccurence
Genefamilieswhoseoccurrencepatternsacrossgenomesshowsimilarities.跨基因组的共现模式表现出相似性的基因家族。
Coexpression
网址介绍
[网址名称]:STRING
网站的数据也是可以下载的,点击Download,网站所有的后台数据,包括蛋白互作数据,蛋白附件数据,完整的数据库存储。
当然,你也可以下载某一物种的,如人类,输入物种名称,点击UPDATE,即可出现相应的数据,点击即可下载。
教程讲解
这里以多个差异基因的分析进行示例
1.将相应的基因直接复制在框中,选择物种名称,点击SEARCH(想试试的,可以直接点击#1#2#3的例子)
2.点击继续
3.网络图出现,当前默认展示的是Network
4.点击Legend,即可发现PPI网络中的信息
NodeContent:即空的未知3D结构的蛋白和已知蛋白
KnownInteractions:即来自数据库或者实验中的数据
PredictedInteractions:即基因邻接,基因融合,基因共现
Others:即文本挖掘,共表达,蛋白同源性
YourInput:这里面就是你输入进去的基因
5.点击Settings,这里我们只对常用的进行解释
meaningofnetworkedges:即可以将图中的连线更改为证据型还是按照数据支持的强度型
minimumrequiredinteractionscore:可以通过调整数据,对网络进行筛选,数值越大,节点越少
networkdisplaymode:即将网络作为不能更改的位图展示,还是作为可以更改挪动的矢量图展示
networkdisplayoptions:一般我们会选择将离散的点进行去除,所以选择第二个
6.然后我们的蛋白网络就变成这样了,你也可以自己点击挪动即可
7.点击Analysis,可以发现对PPI图的一个总结和分析
NetworkStats:图中节点的所有信息
GO分析:生物过程,分子功能,细胞组分
参考出版物:数据库中类似研究的文献
KEGG通路
反应途径
维基通路
亚细胞定位
注释关键字(UniProt)
8.这些分析结果,在本页下方提供了下载,方便其他应用
10.网络中数据的下载,可以点击asshorttabulartextoutput,下载下来直接使用记事本打开,也可以用这些数据,通过一些其他软件如Cytoscape进行一个重新作图。
11.Clusters,一般是默认为不聚类的。
12.如果需要对图中的节点进行聚类分析,可以点击kmeansclustering进行聚类
13.结果就如图所示,每一种颜色代表一个聚类
14.下方或出现聚类的标志和个数,以及对应的蛋白名称
15.下方提供了聚类网络的数据库下载
16.点击一个聚类进去,可以发现该聚类的所有信息,包括PPI图
17.以及对应的网络节点分析信息
18.点击More或者Less可以显示更多或者更少的蛋白节点信息
数据库
22.点击进去,我们还可以发现我们输入的蛋白,以及该通路上的其他蛋白
文本挖掘
24.点击进去之后,我们也可以发现文献的信息,以及相应的蛋白出现的位置