分子对接在现代药物开发中越来越重要,它可以高效模拟蛋白与配体的结合模式,提升药物筛选的准确性。为了帮助科研人员推进药物研发进程,英飞智药在其PharmaMind平台上新增了分子对接MolDock模块,让我们一起来探索这个新的工具。
2
MolDock简介
分子对接的成功离不开两个关键步骤:分子结合模式的采样和打分。
为了更加全面地模拟分子构象,MolDock整合了基于GPU的并行多构象采样技术。这不仅极大提升了采样效率,还能确保分子在蛋白结合口袋空间中进行全局采样,为用户提供更精准的分子构象。
在打分方面,采用自研的MolDock-RefineScore,其引入了一种新颖的方法,将传统力场和经验性打分的优势与几何图神经网络融为一体。这种打分系统不仅提升了预测精度,还保持了较强的泛化能力,有效避免了过拟合的风险。
3
MolDock性能测评
一、MolDock-Sample对接采样召回率
图1.MolDock采样在CASF-2016数据集上的测试结果。
二、MolDock-RefineScore虚拟筛选性能评估
表1.Vina/GlideSP/RefineScore在CASF-2016标准数据集上的虚筛性能评测
表2.GlideSP/RefineScore在DEKOIS2.0标准数据集上的虚筛性能评测
表3.GlideSP/RefineScore在DUD-E标准数据集上的虚筛性能评测
三、MolDock-Score打分能力和排序能力测试评估
CASF-2016评价体系中包含了打分能力(Scoringpower)和排序能力(Rankingpower)。图2的结果反映了目前MolDock-RefineScore目前也具备了领先的打分能力和排序能力。
图2.MolDock-Score在CASF-2016数据集上的打分能力评估(左图)和排序能力评估(右图)。
四、案例展示:晶体结构复现
在我们在PharmMind平台上使用MolDock,直接输入小分子的SMILES字符串:Cc1cc(cc(c1F)C)n2c(c3c(n2)CCN([C@H]3C)C(=O)c4cc5cc(ccc5n4[C@]6(C[C@@H]6C)C7=NOC(=O)N7)[C@H]8CCOC(C8)(C)C)N9C=CN(C9=O)c1ccc2c(c1F)cnn2C。使用默认参数进行重对接复现晶体结构(需要把Filtersetting部分的分子量范围提高到900,避免该分子被过滤掉),结果如图3所示。
图3.Orforglipron对接结果比较图。
左图是MolDock的对接结果(浅杏黄色是原始晶体构象,紫色是对接最优构象,RMSD=1.34),右图是其他合作单位用GlideSP的默认参数对接结果(浅杏黄色是原始晶体构象,黄色是对接最优构象,RMSD=4.90)。
4
MolDock目前已支持功能
蛋白准备模块:补全残基,替换非标准残基,加氢,氢键网络优化,能量最小化(需要开通企业账号),自定义口袋;
配体准备模块:质子化状态、异构体生成、三维构象生成、分子类药性过滤,支持smiles/sdf的分子上传;
对接配置模块:支持RefineScore,对接构象筛选。
5
总结
从整体性能指标上看,MolDock是一款兼顾采样效率和对接精度的高性能AI分子对接工具。MolDock目前已支持了一些对接过程中需要考虑的细节功能,从而确保结果的可靠性和精准性。同时,英飞智药团队致力于不断优化和提升这一工具,计划在未来版本中整合更多基于AI的高精度打分系统,进一步增强其虚拟筛选性能。欢迎所有从事药物研发的专家和研究人员试用MolDock。考虑到计算资源的限制,每位免费用户每天最多可提交3个任务,每个对接任务限于100个分子以内。企业付费用户可以根据需求商定具体安排。