代谢组学是对某一生物或细胞在一特定生理时期内所有代谢产物同时进行定性定量分析的学科,被广泛用于揭示小分子与生理病理效应间的关系。目前,代谢组学已经被应用于药物开发的各个阶段(如药物靶标识别、先导化合物发现、药物代谢分析、药物响应和耐药研究等)。基于代谢组学的高性价比特性,它被药学领域的研究者给予了厚望,有望加速新药开发的进程。然而,代谢组领域还面临着严重的信号处理与数据分析问题,对其在新药研发中的应用构成了巨大挑战。为了有效消除由环境、仪器和生物因素所引入的不良信号波动,就需要开发针对代谢组信号系统优化的新方法,为不同组学研究量身定制最优的数据分析策略。
AIDD(AIDrugDiscovery&Design):是近年来非常火热的技术应用,且已经介入到新药设计到研发的大部分环节当中,为新药发现与开发带来了极大的助力。随着医药大数据的积累和人工智能技术的发展,运用AI技术并结合大数据的精准药物设计也不断推动着创新药物的发展。在新型冠状病毒的治疗方案中,通过一系列计算机辅助药物生物计算的方法发现一大类药物分子可以有效阻止新冠病毒的侵染,为治疗新冠提供了新思路。倾向于机器对数据库信息的自我学习,可以对数据进行提取和学习,一定程度上避免了化合物设计过程中的试错路径,同时还会带来很多全新的结构,为药物发现打破常规的结构壁垒。
培训对象
全国各大高校、企业、科研院所从事人工智能、生命科学、代谢工程、有机合成、天然产物、药物、生物信息学、植物学,动物学、化学化工,医学、基因组学、农业科学、植物学、动物学,临床医学、食品科学与工程、肿瘤免疫与靶向治疗、全基因组泛癌分析、人黏连蛋白折叠基因组机、病毒检测、功能基因组、遗传图谱、基因挖掘变异、代谢组学、蛋白质组学、转录组学、生物医学、癌症、核酸、毒物学等研究科研人员及爱好者
培训目标(完全适合零基础)
CADD计算机辅助药物设计设计流程,让学员能够掌握包括PDB数据库、靶点蛋白、蛋白质-配体、蛋白-配体小分子、蛋白-配体结构、notepad的介绍和使用、分子对接、蛋白-配体对接、虚拟筛选、蛋白-蛋白对接、蛋白-多糖分子对接、蛋白-水合对接、Linux安装、gromacs分子动力学全程实操、溶剂化分子动力学模拟
培训讲师
蛋白组学主讲老师来自国内高校李老师授课,有十余年的蛋白质组数据分析经验。研究领域涉及机器学习,芯片数据分析,蛋白质组数据分析,DNA,RNA,甲基化测序数据分析,单细胞测序数据分析,miRNA及靶基因分析等,发表SCI论文30余篇,其中一作及并列一作15篇。
CADD主讲老师来自国内高校、中科院等单位,老师主要擅长深度学习、机器学习、药物虚拟筛选、计算机辅助药物设计、人工智能药物发现、分子对接、分子动力学等方面的研究,在我们单位长期进行授课,讲课内容和授课方式以及敬业精神受到参会学员的一致认可和高度评价
课程内容
课程一:机器学习代谢组学
第一天
A1代谢物及代谢组学的发展与应用
(1)代谢生理功能;
(2)代谢疾病;
(3)非靶向与靶向代谢组学;
(4)空间代谢组学与质谱成像(MSI);
(5)代谢流与机制研究;
(6)代谢组学与药物和生物标志物。
A2代谢组学实验流程简介
A3色谱、质谱硬件原理
(1)色谱分析原理;
(2)色谱的气相、液相和固相;
(3)色谱仪和色谱柱的选择;
(4)质谱分析原理及动画演示;
(5)正、负离子电离模式;
(6)色谱质谱联用技术;
(7)LC-MS的液相系统
A4代谢通路及代谢数据库
(1)几种经典代谢通路简介;
(2)能量代谢通路;
(3)三大常见代谢物库:HMDB、METLIN和KEGG;
(4)代谢组学原始数据库:MetabolomicsWorkbench和Metabolights.
第二天
B1代谢物样本处理与抽提
(1)组织、血液和体液样本的提取流程与注意事项;
(2)用ACN抽提代谢物的流程与注意事项;
(3)样本及代谢物的运输与保存问题;
B2LC-MS数据质控与搜库
(1)LC-MS实验过程中QC样本的设置方法;
(2)LC-MS上机过程的数据质控监测和分析;
(3)XCMS软件数据转换与提峰;
B3R软件基础
(1)R和Rstudio的安装;
(2)Rstudio的界面配置;
(3)R的基本数据结构和语法;
(4)下载与加载包;
(5)函数调用和debug;
B4ggplot2
(1)安装并使用ggplot2
(2)ggplot2的画图哲学;
(3)ggplot2的配色系统;
(4)ggplot2画组合图和火山图;
第三天
机器学习
C1无监督式机器学习在代谢组学数据处理中的应用
(1)大数据处理中的降维;
(2)PCA分析作图;
(3)三种常见的聚类分析:K-means、层次分析与SOM
(4)热图和hcluster图的R语言实现;
C2一组代谢组学数据的降维与聚类分析的R演练
(1)数据解析;
(2)演练与操作;
C3有监督式机器学习在代谢组学数据处理中的应用
(1)数据用PCA降维处理后仍然无法找到差异怎么办?
(2)PLS-DA找出最可能影响差异的代谢物;
(3)VIPscore和coef的意义及选择;
(4)分类算法:支持向量机,随机森林
C4一组代谢组学数据的分类算法实现的R演练
(1)数据解读;
第四天
D1代谢组学数据清洗与R语言进阶
(1)代谢组学中的t、fold-change和响应值;
(2)数据清洗流程;
(3)R语言tidyverse
(4)R语言正则表达式;
(5)代谢组学数据过滤;
(6)代谢组学数据Scaling原理与R实现;
(7)代谢组学数据的Normalization;
(8)代谢组学数据清洗演练;
D2在线代谢组分析网页Metaboanalyst操作
(1)用R将数据清洗成网页需要的格式;
(2)独立组、配对组和多组的数据格式问题;
(3)Metaboanalyst的pipeline和注意事项;
(4)Metaboanalyst的结果查看和导出;
(5)Metaboanalyst的数据编辑;
(6)全流程演练与操作
第五天
E1机器学习与代谢组学顶刊解读(2-3篇);
(1)NatureCommunication一篇代谢组学小鼠脑组织样本database类型的文献;
(2)Cell一篇代谢组学患者血液样本的机器学习与疾病判断的文献;
(3)1-2篇代谢组学与转录组学和蛋白组学结合的文献。
E2文献数据分析部分复现(1篇)
(1)文献深度解读;
(2)实操:从原始数据下载到图片复现;
(3)学员实操。
部分案例图片
课程二:机器学习蛋白组学
机器学习及蛋白组学简介
1.机器学习基本概念介绍
2.常用机器学习模型介绍
3.混淆矩阵
4.ROC曲线
5.主成分分析(PCA)
6.蛋白组学基本概念
R语言简介及实操
1.R语言概述
2.R软件及R包安装
3.R语言语法及数据类型
4.条件语句
5.循环
6.函数
2.利用机器学习基于蛋白组学数据预测表型
3.利用机器学习基于蛋白组学数据进行分类
4.利用机器学习基于蛋白组学数据构建预后模型
1.Uniport
2.HPA
3.TCPA
4.CPTAC
零代码工具利用机器学习分析蛋白组学数据
利用PLOSComputationalBiology(IF:5分)发表零代码工具,轻松完成差异表达分析,常见统计分析,常见可视化,内置7种机器学习方法,轻松调用。
1.数据导入(两套数据,二分类,多分类)
3.缺失值填充
4.数据归一化
5.离群值检测/清理
7.机器学习方法应用(RF,lasso,SVM等)
利用机器学习基于蛋白组学数据预测表型,基于蛋白组学数据复现cell中机器学习分析结果
实操内容
1.蛋白组学数据处理,差异表达分析
2.火山图,多分组热图,多组箱型图展示差异表达分析结果
3.构建RandomForest模型
4.重要蛋白筛选
5.绘制ROC曲线
6.独立测试集检测模型表现
1.读取蛋白表达数据
2.差异蛋白挑选,火山图绘制,箱型图绘制
3.时序蛋白表达数据聚类分析
4.构建随机森林模型
5.挑选重要特征
6.独立测试集进行验证
2.比较22种不同的机器学习分类器,挑选最优算法构建不同肝病的分类模型
3.独立队列验证模型准确性
4.构建预后模型
课程三:CADD计算机辅助药物设计课表内容
背景与理论知识以及工具准备
1.PDB数据库的介绍和使用
1.1数据库简介
1.2靶点蛋白的结构查询与选取
1.3靶点蛋白的结构序列下载
1.4靶点蛋白的下载与预处理
1.5批量下载蛋白晶体结构
2.Pymol的介绍与使用
2.1软件基本操作及基本知识介绍
2.2蛋白质-配体相互作用图解
2.3蛋白-配体小分子表面图、静电势表示
2.4蛋白-配体结构叠加与比对
2.5绘制相互作用力
3.notepad的介绍和使用
3.1优势及主要功能介绍
3.2界面和基本操作介绍
3.3插件安装使用
下午
一般的蛋白
-配体分子对接讲解
1.1分子对接的概念及基本原理
1.2分子对接的基本方法
1.3分子对接的常用软件
1.4分子对接的一般流程
2.常规的蛋白-配体对接
2.1收集受体与配体分子
2.2复合体预构象的处理
2.3准备受体、配体分子
2.4蛋白-配体对接
2.5对接结果的分析
虚拟筛选
1.小分子数据库的介绍与下载
2.1openbabel的介绍和使用
2.2chemdraw的介绍与使用
3.虚拟筛选的前处理
4.虚拟筛选的流程及实战演示
案例:筛选新冠病毒主蛋白酶抑制剂
5.结果分析与作图
6.药物ADME预测
6.1ADME概念介绍
6.3预测结果的分析
拓展对接的使用方法
1.蛋白-蛋白对接
1.1蛋白-蛋白对接的应用场景
1.3目标蛋白的收集以及预处理
1.4使用算例进行运算
1.5关键残基的预设
1.6结果的获取与文件类型
1.7结果的分析
以目前火热的靶点
PD-1/PD-L1等为例。
2.涉及金属酶蛋白的对接
2.1金属酶蛋白-配体的背景介绍
2.2蛋白与配体分子的收集与预处理
2.3金属离子的处理
2.4金属辅酶蛋白-配体的对接
2.5结果分析
以人类法尼基转移酶及其抑制剂为例
3.蛋白-多糖分子对接
4.1蛋白-多糖相互作用
4.2对接处理的要点
4.3蛋白-多糖分子对接的流程
4.4蛋白-多糖分子对接
以
α-糖苷转移酶和多糖分子对接为例
5.核酸-小分子对接
5.1核酸-小分子的应用现状
5.3核酸-小分子的结合种类
5.4核酸-小分子对接
以人端粒
g-四链和配体分子对接为例。
操作流程介绍及实战演示
1.柔性对接
1.1柔性对接的使用场景介绍
1.2柔性对接的优势
1.3蛋白-配体的柔性对接
重点:柔性残基的设置方法
以周期蛋白依赖性激酶
2(CDK2)与配体1CK为例
2.共价对接
2.1两种共价对接方法的介绍
2.1.1柔性侧链法
2.1.2两点吸引子法
2.2蛋白和配体的收集以及预处理
2.3共价药物分子与靶蛋白的共价对接
2.4结果的对比
以目前火热的新冠共价药物为例。
3.蛋白-水合对接
3.1水合作用在蛋白-配体相互作用中的意义及方法介绍
3.2蛋白和配体的收集以及预处理
重点:水分子的加入和处理
3.4蛋白-水分子-配体对接
3.5结果分析
以乙酰胆碱结合蛋白
(AChBP)与尼古丁复合物为例
分子动力学模拟(linux与gromacs使用安装)
1.linux系统的介绍和简单使用
1.1linux常用命令行
1.2linux上的常用程序安装
1.3体验:如何在linux上进行虚拟筛选
2.分子动力学的理论介绍
2.1分子动力学模拟的原理
3.gromacs使用及介绍
重点:主要命令及参数的介绍
4.origin介绍及使用
第六天
溶剂化分子动力学模拟的执行
1.一般的溶剂化蛋白的处理流程
2.蛋白晶体的准备
3.结构的能量最小化
4.对体系的预平衡
5.无限制的分子动力学模拟
6.分子动力学结果展示与解读
以水中的溶菌酶为例
课程四:AIDD人工智能药物发现与设计课表内容
人工智能药物发现(AIDD)简介
机器学习和深度学习在药物发现领域的应用
工具的介绍与安装
1.人工智能药物发现(AIDD)简介2.机器学习和深度学习在药物发现领域的应用
2.1药物靶标相互作用
2.2药物重定位
2.3药物不良反应
2.4药物间相互作用
3.工具介绍与安装
3.1Anaconda3/Pycharm安装
3.2Python基础
3.3Numpy基础
3.4Pandas基础
3.5Matplotlib基础
3.6scikit-learn安装
3.7Pytorch安装
3.8RDKit基础
机器学习药物发现案例
1.机器学习
1.1分类算法与应用
1.2回归算法与应用
1.3聚类算法
1.4降维
1.5模型的评估方法和评价指标
1.6特征工程
2.机器学习药物发现案例(一)
——药物副作用预测模型
3.机器学习药物发现案例(二)
——化合物生物活性分类模型
4.机器学习药物发现案例(三)
——化合物生物活性回归模型
图1、副作用在药物-药物相似性网络中传播。
深度学习(一)
深度学习药物发现案例(一)
1.深度学习(一)
1.1多层感知机
1.2深度神经网络
1.3反向传播
1.4优化方法
1.5损失函数
1.6卷积神经网络
2.深度学习药物发现案例(一)
——药物-药物相互作用预测模型
图2、利用药物关联网络特征和深度神经网络识别药物之间潜在相互作用事件。
深度学习(二)
深度学习药物发现案例(二)
1.深度学习(二)
1.1循环神经网络
1.2消息传递神经网络
1.3图卷积神经网络
1.4图注意力神经网络
1.5图采样和聚合
2.深度学习药物发现案例(二)
——药物靶标相互作用预测模型
3.深度学习药物发现案例(三)
——药物重定位模型
图3、基于图神经网络的药物重定位。
深度学习(三)
深度学习药物发现案例(三)
1.深度学习(三)
1.1注意力机制
1.2自注意力模型
1.3多头自注意力模型
1.4交叉注意力模型
2.深度学习药物发现案例(四)
3.深度学习药物发现案例(五)
——药物靶标结合亲和力预测模型
图4、利用多源药物数据和注意力机制预测药物-药物相互作用事件。
赠送视频:深度学习AiphaFold2蛋白质结构预测实例讲解
(以下内容为赠送的视频教程)
蛋白质结构与功能的概述。
蛋白质的组成
蛋白质的结构
蛋白质的功能
常见蛋白质结构预测的网站及方法。
常用网站及软件的使用方法及说明
机器学习在蛋白质结构预测的应用。
蛋白质结构与小分子药物库获取
机器学习加速预测小分子药物
AlphaFold2机器学习模型对蛋白结构预测
实战蛋白结构预测目前最好的人工智能模型AlphaFold2。
AlphaFold2模型的获取及安装
AlphaFold2模型的实战操作
机器学习代谢组学培训班
2023.06.10----2023.06.11全天授课(上午09.00-11.30下午13.30-17.00)
2023.06.13----2023.06.14晚上授课(晚上19.00-22.00)
2023.06.17----2023.06.18全天授课(上午09.00-11.30下午13.30-17.00)
机器学习蛋白质组学培训班
2023.07.1----2023.07.2全天授课(上午09.00-11.30下午13.30-17.00)
2023.07.4----2023.07.5晚上授课(晚上19.00-22.00)
2023.07.8-----2023.07.9全天授课(上午09.00-11.30下午13.30-17.00)
CADD计算机辅助药物设计专题培训班
2023.6.10-----2023.6.11全天授课(上午09.00-11.30下午13.30-17.00)
2023.6.13-----2023.6.16晚上授课(晚上19.00-22.00)
2023.6.17-----2023.6.18全天授课(上午09.00-11.30下午13.30-17.00)
2023.6.19-----2023.6.20晚上授课(晚上19.00-22.00)
AIDD人工智能药物发现与设计专题培训班
2023.6.20---2023.6.21晚上授课(晚上19.00-22.00)
2023.6.25全天授课(上午09.00-11.30下午13.30-17.00)
2023.6.27-----2023.6.28晚上授课(晚上19.00-22.00)
报名费用
机器学习代谢组学、机器学习蛋白组学
公费价:每人每班¥4680元(含报名费、培训费、资料费)
自费价:每人每班¥4280元(含报名费、培训费、资料费)
AIDD人工智能药物发现与CADD计算机辅助药物设计课程价格:
公费价:每人每班¥5880元(含报名费、培训费、资料费)
自费价:每人每班¥5480元(含报名费、培训费、资料费)优惠政策
优惠一:报名两班免费赠送一个学习名额(赠送班任选)费用:9880元
优惠二:提前报名缴费学员+转发到朋友圈或者到学术交流群可享受每人300元优惠(仅限15名)