Science通过结构域分类探究蛋白质宇宙的结构多样性

在本研究中,作者组合了三种结构域识别方法和结构分类算法识别已知的结构域(图1A,B)。通过这一流程,作者在AFDB中识别到了共3.65亿个结构域,比基于序列的识别方法多出一亿多个(图1C)。其中,单结构域蛋白和多结构域蛋白的比例约为42:55(图1Di),其中多结构域蛋白最多由20个结构域组成。对TED-100数据集中的平均预测局部距离差异测试分数(pLDDT)分析表明,TED-100数据集中绝大多数数据的pLDDT都很高,仅2%的数据落于pLDDT<50%的区域(Low,图1Dii)。考虑到作者的结构域划分方法中并没有参考模型的残基pLDDT,所以作者认为良好的pLDDT分数分布显示出其方法有效地识别出了AFDB中折叠良好的区域内合理的结构域。

2.TED数据集的CATH分类

除了序列聚类,作者还使用Foldseek和Merizo-search对所有TED-100结构域进行搜索,并与CATHSSG5结构域比对,为1.94亿个结构域分配了CATH超家族(H)标签,4600万个结构域分配了拓扑(T)层级标签。通过将Foldseek预测的超家族进行HMM验证,作者发现约1.71亿超家族标签可通过HMM超家族比对确认(88.54%),另有180万个结构域(0.95%)可以在折叠层面得到确认。而Foldseek的1180万个折叠预测和2030万个超家族预测未得到HMM比对的确认,这表明通过结构聚类相较于基于HMM的序列聚类,CATH标签的结构域覆盖率能够提升15.4%。

3.AFDB中折叠(Fold)的分布情况

比较CATH和TED-100数据集,作者发现在两个数据集中数量均位居前列的结构域包括:MFS泛底物转运蛋白样结构域、翻译因子和FAD/NAD(P)结合结构域。其中,在TED中显著富集的超家族包含典型的多药外排泵AcrB。AcrB是一种RND转运蛋白,构成细菌中的AcrAB-TolC外排泵的一部分,负责将抗生素等有害物质排出,从而助力抗生素抗性。此外,作者还分析了发现的新的超家族蛋白只属于某一生物域的频率(图2C)。作者通过PCA降维,对TED中的折叠在各个生物域中的出现频率进行分析,观察到各类折叠在生物域中的独特性。

4.高对称性结构

在这些聚类中,作者发现了一些前所未见的架构,例如11叶β螺旋桨、封闭的α环状11螺旋桨,以及6螺旋桨等(图3)。作者还发现了一类由循环重复组成的结构,沿轴向延伸形成高度重复且对称的结构,作者称之为“延展重复”。图3最下部分展示了一些这些结构的示例,其中一些在重复单元之间包含高度多样化和无序的环状区域。这些结构与近期其他研究中报道的β-螺旋状折叠相似。

图3.高对称性结构示例

5.结构域对的相互作用

图4Ci中展示了ISP集的互作关系,其中如果两个超家族之间观察到至少一次交互作用,就在其间绘制一条路径。TED数据集发现了众多新相互作用,尤其是在CATH类别2和3(全β和α-β类别)之间。超家族互作网络有助于识别出与多个其他超家族的互作的“枢纽”超家族(图4Cii)。图4D展示了两个枢纽超家族示例,可以看出TED数据集揭示了许多之前在CATH中未观察到的互作模式。这为未来探索结构域间互作提供了新的线索。

在该研究中,作者通过构建“结构域百科全书(TED)”,将AFDB中的结构细分为各个组成结构域,并通过CATH框架进行分类,从而扩充了结构数据。这不仅推进了结构与功能之间的关联研究,还为发现和重新定义新的折叠和结构域提供了线索,揭示了新的蛋白质折叠空间“暗区”。

THE END
1.湖南自考03475环境化学考试大纲及其过程和机理;初步了解污染物的定量结构与活性关系。 4.掌握典型污染物在环境各圈层中的转归和效应。 5.了解受污染环境的主要修复和治理技术及方法,特别是要掌握生物修复技 术如微生物修复技术和方法及其影响因素、植物修复技术和方法及其影响因素; 掌握化学氧化技术及其方法和影响因素;了解电动力学修复技术和方法及其...https://www.zikaosw.com/jcdg/ksdg/6683.html
2.基于分子结构的有机污染物正辛醇/空气分配系数快速预测方法定量结构-活性关系(QSAR)方法可以用于KOA的预测。在环境科学领域,QSAR是指关联有机污染物的分子结构与其理化性质、环境行为和毒理学参数(统称为活性)的定量预测模型,该方法有助于大幅度降低实验测试费用,尤其有助于我国化学品企业应对欧盟REACH法规(化学品注册、评估、许可和限制法规)。根据经济合作与发展组织(OECD)提...https://www.xjishu.com/zhuanli/55/200910187937.html
1.最新结构化技术的应用与发展概览化工产品摘要:随着科技的不断发展,结构化技术的应用与发展日益受到关注。结构化技术是一种将数据进行有效组织和处理的技术,能够提升数据处理效率和准确性。目前,结构化技术正广泛应用于各个领域,如大数据分析、人工智能、云计算等。其发展趋势表现为更加智能化、自动化和高效化,能够为企业和个人提供更便捷、更高效的服务和解决...http://www.hengjiayanhua.cn/post/2152.html
2.结构方程模型▎潜变量分析复合变量分析及贝叶斯结构方程模型参数估...结构方程模型(Sructural Equation Model)是一种建立、估计和检验研究系统中多变量间因果关系的模型方法,它可以替代多元回归、因子分析、协方差分析等方法,利用图形化模型方式清晰展示研究系统中变量间的因果网络关系,是近年来地学、生态、进化、环境、医学、社会、经济领域中应用十分广泛的统计方法。然而,自Wright在1920年...https://blog.csdn.net/weixin_46433038/article/details/143743645
3.卤代有机化合物生物富集因子的定量结构摘要:依据经济合作与发展组织(OECD)关于定量结构-活性关系(QSAR)模型构建和使用导则,通过多元线性回归(MLR)方法建立了一个包含9个描述符的卤代有机化合物鱼类生物富集因子(BCF)的QSAR模型.QSAR模型的调整决定系数R2adj=0.877,去一法交叉验证系数Q2LOO=0.873,外部验证系数Q2EXT=0.757,表明模型具有较好的拟合优度、稳...https://d.wanfangdata.com.cn/periodical/cyyhj201305019
4.环境保护概况范文10篇(全文)4.2.2 化学品测试合格实验室体系和定量结构活性关系(QSAR)模型开发应用研究 (16)新化学物质安全性评价合格实验室体系及实验室审核与监管规范研究; (17) QSAR模型在优先管理化学品筛选上的应用研究; (18) QSAR模型在化学品危害性分类上的应用研究; (19) QSAR模型在化学品暴露和风险评价上的应用研究。 https://www.99xueshu.com/w/ikey9ig3okdt.html
5....活性测定及其分子结构与活性的定量关系目的·建立莨菪烷类M3受体拮抗剂的定量结构-活性关系(quantitative structure-activity relationship,QSAR)模型,为后续高活性分子的设计提供指导。方法·以3α-羟基莨菪烷(J0)为起始物,通过对莨菪烷母核C-3α位的结构进行改良,合成新莨菪烷类化合物(J1~J6)。选取富含M3受体的豚鼠气道环为测试样本,通过离体组织功能...https://mall.cnki.net/magazine/Article/SHEY201904007.htm
6.生物活性肽功能与制备简介,目录书摘第二节?抗高血压活性肽的制备方法 一、酶法水解蛋白质 二、直接提取法 三、发酵法 第三节?抗高血压活性肽的活性评价方法 一、体外活性评价方法 二、体内活性评价方法 三、人群实验 第四节?抗高血压活性肽的构效关系 一、ACE抑制物的结构特征 二、定量结构-活性关系模型(QSAR)和底物对接 ...https://www.jd.com/phb/zhishi/33961ff3e22ed519.html
7.近红外光谱快速分析技术及其在动物饲料和产品品质检测中的应用...进行了多种化学物质的性质&环境毒物的毒性和药物有关的性质的预测!建立了准确的定量结构性质+活性关系模型%对于每一种化学计量学方法而言!都有各自的长处和短处!在用于近红外光谱时可能受到某些限制%目前已有研究者将这些方法相互结合!取长补短!再将其应用于近红外光谱分析技术中....http://m.optosky.com/nd.jsp?id=126
8.2021年“华为杯”第十八届中国研究生数学建模竞赛题目D:抗乳腺癌...目前,在药物研发中,为了节约时间和成本,通常采用建立化合物活性预测 模型的方法来筛选潜在活性化合物。具体做法是:针对与疾病相关的某个靶标(此 处为ERα),收集一系列作用于该靶标的化合物及其生物活性数据,然后以一系 列分子结构描述符作为自变量,化合物的生物活性值作为因变量,构建化合物的 定量结构-活性关系(...https://m.book118.com/html/2022/0628/7102163124004135.shtm
9.医学开题报告范文模板(精选11篇)计算机辅助分子设计主要分两种情况:一种是在受体结构已知的情况下,采用生成与受体结构互补的配体的方法来寻找新药物;另一种是在受体结构未知的情况下,采用对一组具有类似活性的化合物建立定量结构活性关系,在此模型基础上进行结构修饰来预测生成新的化合物。 qsar作为抗肿瘤药物设计研究中的一个重要计算方法和常用手段,...https://www.wenshubang.com/lunwenfanwen/469049.html
10.毕业设计报告计算机辅助分子设计主要分两种情况:一种是在受体结构已知的情况下,采用生成与受体结构互补的配体的方法来寻找新药物;另一种是在受体结构未知的情况下,采用对一组具有类似活性的化合物建立定量结构活性关系,在此模型基础上进行结构修饰来预测生成新的化合物。 QSAR作为抗肿瘤药物设计研究中的一个重要计算方法和常用手段,...https://www.fwsir.com/fanwen/html/fanwen_20210107170907_652054.html
11.毕业设计开题报告(通用12篇)定量结构活性关系(Quantitative Structure-Activity Relationships,简称QSAR)是20世纪60年代发展起来的一门新兴学科,是由结构活性关系(Structure-Activity Relationship,简称SAR)发展而来的。QSAR是通过对已知结构且有生物活性系列化合物(如一系列有相同药理作用的结构相似的化合物)进行化学信息学的计算,选用适当的数学模型建立...https://www.ruiwen.com/word/biyeshejikaitibaogao.html
12.预防医学论文开题报告范文有关预防医学论文的开题报告怎么写计算机辅助分子设计主要分两种情况:一种是在受体结构已知的情况下采用生成与受体结构互补的配体的方法来寻找新药物;另一种是在受体结构未知的情况下,采用对一组具有类似活性的化合物建立定量结构活性关系,在此模型基础上进行结构修饰来预测生成新的化合物。QSAR作为抗肿瘤药物设计研究中的一个重要计算方法和常用手段,在...https://www.sibikeedu.com/wp/41594/
13.医学毕业设计的开题报告其中最为著名、应用最为广泛的是Hansch 法。 它假设同系列化合某些生物活性的变化是和它们某些可测量的物理化学性质(疏水性、电性质和空间立体性质等)的变化相联系的,并假定这些因子是彼此孤立的,采用多重自由能相关法,借助多重线性回归等统计方法就可以得到定量结构活性关系模型。 https://www.yjbys.com/biyesheji/1571227.html