公共数据库的数据样本量大,免费而且选择范围广。常见的数据库有TCGA数据库和NCBIGEO数据库,里面含有大量的不同研究方向的样本高通量数据。
癌症是临床医学中非常重要的疾病方向。TCGA数据库中包含了常见了40种癌症方向的高通量数据及临床信息。大家对TCGA数据库的使用近几年也在逐渐增加!另外,其他疾病的研究可以通过GEO数据库进行。
本次培训不仅仅要大家了解多种不同的生信分析思路,学会TCGA&GEO数据库的基础操作,比如数据筛选,下载,差异分析,功能通路分析,预后分析等等,还有复杂的预后模型构建筛选风险基因的实操内容。可以说是基础分析与高级分析并存。
培训班针对生信0基础的学员进行教学,包教包会。
讲师简介:宋伟博士
成果:参与完成了近百篇软件著作权和发明专利的撰写和申请;肺癌、胰腺癌、骨肉瘤、胃癌等数据库的分析和构建;完成个体基因检测流程和无创唐筛流程的开发。
研究方向:有近十年的生信分析经验,擅长方向有转录组测序分析、芯片数据分析、疾病机理研究分析、疾病预后与基因关联分析、项目分析思路设计以及个性化分析等,精通perl、R等编程语言。
培训经历:在上海、北京、广州、沈阳、南京等城市举办过几十场培训班。
主办方:上海统循会务咨询有限公司
第1天晚上19:00-22:00(线上)
第2、3天白天9:00-18:00
会议地点:线上:腾讯网络会议室
会务费用:3200元/人
优惠政策:
1.提前确认报名及转账的,可以提前拿到学习材料
2.三人组团报名,每人优惠100元
3.四人组团报名,每人优惠200元,
4.六人组团报名缴费,可免1人参会费!
可以开正规会务发票,纸质邀请函(盖红章)。
注意事项:使用win7以上系统的电脑,现场不得录音录像。上课软件为Cytoscape,Heml,GSEA,R和Rstudio。
另外需安装腾讯会议软件。
详细日程参见日程表
TCGA&GEO数据分析及癌症预后模型构建靶标筛选日程
大纲
详细内容
第一天
晚上
19:00~20:30
生信与临床关联,以及文献解读
生物信息介绍,与临床的密切关联;
国自然前期基础研究中生信的作用。
高通量:测序及芯片介绍——不同组学:转录组学、基因组学、表观组学、顺反组学、宏基因组学等。
20:45-22:00
R语言学习
R软件与Rstudio软件下载、安装、界面。
R语言基础:元素、向量、矩阵、数组
R语言函数:计算函数、统计函数等
R语言路径确认及修改
R语言文件(图、表)的导入和导出
R语言包:常见R包的下载安装方法
第二天
9:00~10:20
TCGA数据库
NCBIGEO数据库
TCGA数据库:最全的癌症高通量数据公共库(简介)
TCGA数据库的介绍和使用(包含了转录组、基因组、表观组和临床信息数据)
GEO数据库介绍:数据量最大的高通量公共数据库。
GEO数据库的高通量芯片数据查找、筛选、探针转换、差异分析等。
茶歇
10:30~12:00
TCGA数据库癌症数据下载:RNA-seq数据、miRNA-seq数据、甲基化数据、基因组数据及临床信息数据的下载TCGA数据书库癌症数据的处理,获得关键mRNA、miRNA的表达谱矩阵。
午饭休息
13:30~15:20
差异分析及作图
GEO2R工具
R语言:差异分析limma包使用、火山图制作
15:30~17:30
数据的后续高级分析工具实战
聚类热图制作
R语言pheatmap包做聚类热图
DAVID功能富集分析——GO富集和KEGGpathway富集分析
第三天
蛋白互作分析及网络图构建美化
蛋白与蛋白互作分析(PPI)——STRING数据库
cytoscape软件:网络图构建及网络拓补学分析
筛选关键hub基因
癌症预后模型构建R语言实操
单因素及多因素cox回归分析
LASSO回归分析筛选特征因子基因
生存预后风险预测模型效能评估和比较分析
独立生存预后因素的生存率模型的构建
TCGA数据分析——突变分析、差异分析、关联分析、生存分析、miRNA调控靶基因分析等。Cbioportal数据库学习
Ualcan数据库学习
GEPIA数据库学习
15:35~17:00
思路讨论
基于GEO数据库多套数据整合(meta)分析思路
基于TCGA的lncRNA-miRNA-mRNA全转录组整合分析思路
基于TCGA的甲基化与转录组整合分析思路
基于TCGA的基因组与转录组整合分析思路
串讲
实操大串讲
备注:讲师基于windows系统讲解,请尽量使用windows电脑参加