技术服务–谷禾健康

谷禾利用16srRNA高通量测序技术,在肠道菌群检测方面已经深耕十多年,积累了丰富的经验和海量数据。

16srRNA测序技术是一种基于细菌16srRNA基因的微生物鉴定方法,可以快速、准确地分析肠道菌群的组成和多样性,是目前肠道菌群研究广泛使用的一种方法。

在此基础上,谷禾最新又推出肠道微生态宏基因组精准检测报告。

什么是宏基因组?

宏基因组测序也就是shotgun测序,以环境中所有微生物基因组为研究对象,通过对环境样品中的全基因组DNA进行高通量测序,获得单个样品的饱和数据量,基于denovo组装进行微生物群结构多样性,深度全面的了解微生物群体的构成,甚至获得单个菌株的完整基因组。

宏基因组检测的优缺点

优点:

宏基因组可以更加精细化开展其基因构成、分布,次生代谢合成,抗生素耐药基因及其演化,微生物群体基因组成及功能等分析。

缺点:

总的来说,宏基因组测序仍存在技术瓶颈和生物学解释的局限性。然而,针对某些特殊情况研究需要,宏基因组测序也是一种有用的微生物组学研究工具。

特殊应用场景

对于一些复杂的多菌种感染,宏基因组能够更精细化鉴定感染菌群的构成,为临床辅助诊疗提供依据。

与传统方法相比,宏基因组学诊断真菌感染的敏感性和特异性更高,适用于一些真菌感染疾病。也可能鉴定出可疑的新病原体,为后续的病原学研究、药物和疫苗开发奠定基础。

谷禾数据库构建

肠道菌群在人体健康和疾病中扮演着重要角色,因此构建一个完善的肠道菌群宏基因组数据库对于研究人体菌群的组成和功能具有重要意义。

宏基因组数据库的物种涵盖范围和菌株构成,直接影响着宏基因组物种鉴定分类的准确性和分类精度。

在选择合适的算法方面也是至关重要的,谷禾整合了最新的NCBIrefseq数据库中包含所有细菌、病毒、真菌和寄生虫等微生物物种信息。

接下来,我们结合谷禾宏基因组精准检测报告中的一些重要模块,包括不同微生物的相对丰度、抗生素耐药、毒力基因等重要信息,更全面的了解宏基因组精准检测报告,包括其在个性化的健康管理和治疗方案制定方面的潜力。

核心菌属

我们将在90%人群检出,人群平均丰度1%以上的菌属为核心菌属,属于人体肠道菌群中最常见和主要的菌属。核心菌属及有益菌累加占总肠道菌群比例低于60%的可能出现肠道菌群紊乱。

有益菌

肠道内的有益菌能够调节肠道内生态平衡,促进人体健康,如双歧杆菌和乳酸杆菌,保持肠道菌群的平衡对于全面提升整体健康水平至关重要。

对于肠道菌群多样性降低、有益菌减少的肠道疾病患者,可根据其菌群特征,定制个性化的益生菌组合,精准调控肠道菌群。

有害菌

机会致病菌

机会致病菌在肠道内广泛分布,是正常肠道菌群的一部分,但当这类菌过多或免疫力下降时有可能会引发疾病,如大肠埃希氏菌。

抗生素耐药

宏基因组对抗生素耐药研究也有意义,可以加深对耐药机制的认识,为临床上抗生素干预的选择提供帮助。

分析耐药基因

宏基因组测序可获得细菌群体的全部基因组信息,通过序列比对和功能注释,可鉴定出各种已知和新型耐药基因,全面评估耐药基因的种类和数量。例如,在人体肠道宏基因组中发现了大量β-内酰胺酶等耐药基因。

追踪耐药基因的传播途径

辅助指导耐药风险评估和防控策略

宏基因组学评估环境和宿主中耐药基因的分布特点,识别高风险区域和人群,为制定针对性的监测和干预措施提供依据。

毒力基因

宏基因组检测技术在病原微生物毒力基因研究中具有独特优势,可在基因组水平系统分析其毒力基因组成及调控网络,加深对致病机理的理解。

以上是谷禾宏基因组精准检测报告的一些节选,其全面、精准、个性化分析肠道菌群的组成和功能,可帮助评估菌群失衡的风险和预后,为个性化诊疗和健康管理提供科学依据。

16S科研项目是一个完整的闭环,前期的课题项目设计方案、取样和重复实验设置决定了后期分析报告的数据完整性和项目类型。

想要拿到一手有利用价值的科研报告和项目数据,前期的实验方案设计和后续的分析都起着关键性的作用。

然而有时候拿到报告不知道如何去解读,这里为大家梳理一下16s科研项目的全过程,帮助大家更好的了解报告内容,快速获取关键信息。

实验方案设计就像一个总工程的设计图纸,决定了未来科研分析报告的类型走向,并且前期的分组设计的越详细,各种理化指标、生化指标、代谢物等信息准备越充分,后续报告的完整度越高。

明确项目课题类型

第一步要做的就是明确项目课题类型:

最常见的就是多分组之间差异分析比较:例如,要比较对照组、模型组、实验组,之间的差异结果。

还有多分组中,任意两组之间比较:例如某实验设计了正常组、疾病组、用药组服用奥氮平、阿立哌唑、氨磺必利、利培酮,像比较不同的用药组和疾病组之间的菌群的差异结果,就用到了分组之间两两差异比较。

举个例子

图中1组与3组、4组、6组组间差异显著

收集理化指标非常重要

例如该项目比较自闭症儿童与正常儿童的菌群差异。客户在样本信息单里还详细搜集了母孕期的各种详细指标,例如孕期天数、出生体重、白细胞介素6、肿瘤坏死因子a、五羟色氨等数值型理化指标。

还搜集了是否顺产、是否妊娠高血压、是否孕期感染、是否妊娠糖尿病、是否先兆流产等因子型理化指标。其中0代表否,1代表是:

小结

其他样本类型还包括人体/动物唾液样本、组织样本、尿液样本等。

粪便样本

目前粪便样本从采样到提取数据分析技术较为成熟、应用较为广泛,谷禾最早在15年就开发了针对粪便样本的取样管,也是最早致力于研发粪菌取样盒的公司,方便实验室、个人日常取样需求,实现了粪菌样本的常温运输。

取样示意图

其他样本

土壤样本也相对较为容易提取出DNA,但需要注意的是土壤样本的菌群特征容易受植物腐殖质基因的影响和干扰,所以提取时要进行纯化。

而口腔、组织、尿液等样本,由于DNA含量较少,在实验阶段提取相对较为困难,所以提前准备样本时,尽量多取一些,并且可以多取几个重复,尽量避免扩增不出来的情况。

并且这些样还很容易受到环境样的污染,所以在实验阶段,可以取空白样本,和阳性样本ST做对照,数据分析时可以用来纯化样本,排除来自环境的干扰序列。

组间差异分析需重复取样

要做组间差异分析时,每组要重复取样,才能做组与组之间的统计检验。理论上,每个组至少3个样就满足基本的统计差异分析需求。所以在重复取样时,每个分组至少取3个样。取样时要保证每个分组内部的样本一致性,如果组内样本之间的个体差异性较大,则会影响后期组间差异结果分析。

例如从该图可以看出,分组之间组间差异较大,并且组内的样本之间较为接近和相似。

但从该图可以看出,Control组中Control3样本明显与组内的其他样本差异较大,与DSS组内的样本较为相近,这样就对后期组间差异分析的时候会产生影响,需要将该样本去除。

又例如在该图中,TA200组中的TA3样本的Anaeroplasmatales物种丰度含量非常高,该样本与组内的其他样本明显差异较大,该样本可能受到环境污染等其他因素干扰,这样就没有办法保证组内样本的均一性,也会影响分组之间的差异分析统计结果,再后期分析的时候建议把该样本去掉重新分析。

建议

为了便于后期数据整理修改,每个分组需要保留一定量的重复样本,假如每个分组只取了3次重复,假如其中有一个样本质量不好需要去除,该分组只剩2个样本,则不满足每组至少3个样的分组条件,整体就没有办法做组间差异分析统计。

所以这里建议每个分组至少取5个样做重复,一般6到10个样就能分析出比较完善的结果。具体分组和组内的重复取样数量视具体的实验设计方案而定。

在经费允许的情况下,建议多取一些重复。假设每组取50到100个重复或者以上,得到的分析结果就基本可以涵盖该分组情况所有的菌群构成情况,可以较为全面的研究分组之间的菌群构成差异情况。

当拿到16S科研分析报告以后,面对纷繁复杂,各式各样的图表分析结果犯了难,不知道如何从这么多的图表中入手,快速找到报告中需要的图表结果。

这里对16S科研分析结果抽丝剥茧,概括出报告中的主要几大内容板块。

16S科研分析究竟是在做什么?

16SrDNA是一种对特定环境样品中所有的细菌进行高通量测序,以研究环境样品中微生物群体的组成,解读微生物群体的多样性、丰富度及群体结构,探究微生物与环境或宿主之间的关系的技术。

主要是对原始数据进行拼接过滤得到的优化序列,降噪方法得到ASV,再对ASV进行物种注释,注释到门、纲、目、科、属、种各层次上的分类结果。

通过ASV表计算Alpha多样性,样本内的多样性指数,Beta多样性,样本间相似性的指标。

对ASV表进行功能预测,例如Picrust2功能预测分析、Bugbase菌群表型特征分析,FAPROTAX生态功能预测等。

原始数据处理

IlluminaNovaSeq测序平台测序得到的双端数据RawPE,经过拼接和质控,根据一定的标准过滤掉低质量数据、接头或PCR错误,得到RawTags。再经过去重复序列,去singleton序列,过滤嵌合体,得到可用于后续分析的有效数据EffectiveTags。

OTU(ASV)表生成

微生物多样性分析中最重要的就是OTU特征表,一切后续分析都围绕OTU表来进行。生成OTU除了传统的聚类的方法(一般按照97%的相似度进行聚类),现在最新用到的技术的是降噪的方法得到ASV。

简单来讲ASV就是在去除了错误序列之后,将Identity的标准设为100%进行聚类,常见的有DADA2、Deblur、Unoise三种降噪方法。项目里用到的是UNOISE2降噪方法获得ASV数据。

物种的分类与注释

采用QIIME2训练分类器方法对ASVs代表序列进行分类学注释,默认选用SILVA138数据库进行物种注释。并在各个分类水平上:domain(域),phylum(门),class(纲),order(目),family(科),genus(属),species(种)对每个样本的群落组成统计。

alpha多样性

Alpha多样性主要反映样本内多样性。对ASV表进行计算可以获得每个样本的simpson,ace,shannon,chao1以及goods_coverage等指数,alpha多样性指数用来来评估样本菌群物种的丰富度(richness)和多样性(diversity)

beta多样性

Beta多样性反映的是样本间多样性,Beta多样性是衡量个体间微生物组成相似性的一个指标。通过计算样本间距离可以获得β多样性矩阵,基于OTU的群落比较方法报告中给出了,欧式距离、braycurtis距离、UnweightedUniFrac距离和WeightedUniFrac距离等。

功能预测

PICRUSt2用来预测功能,通常指的是基因家族,PICRUSt2支持基于多个基因家族数据库的预测,报告中包括了KEGG同源基因,KO直系同源物,EC酶分类编号,MetaCyc途径的丰度,CAZy碳水化合物活性酶数据库,GMM是肠道代谢模块和GBM是肠脑模块。

BugBase能进行表型预测,其中表型类型包括革兰氏阳性(GramPositive)、革兰氏阴性(GramNegative)、生物膜形成(BiofilmForming)、致病性(Pathogenic)、移动元件(MobileElementContaining)、氧需求(OxygenUtilizing,包括Aerobic、Anaerobic、facultativelyanaerobic)及氧化胁迫耐受(OxidativeStressTolerant)等7类。

科研分析报告结果文件夹

01_pick_otu/文件夹主要是对样本ASV表格统计

02_sequence_statistic/文件夹是对样本序列数据的统计

03_diversity-metrics/文件夹是对样本的alpha多样性指数、beta多样性指数的统计

04_Taxonomic/文件夹是对物种分类注释的统计(门到种水平)

Groups/文件夹下是对组间差异分析结果

★拿到样本后需要进行统计分析

当我们拿到这些样本大量的数据结果,之后关键的一步就是做对这些数据进行处理,做统计分析,比较分组之间的差异结果,找出菌群和环境之间的关联性等,对数据进一步做研究,找出课题方案对应的结果。

不同的数据用到的统计检验方法也不太一样,接下来我们对报告中的不同的分析结果对应的统计差异分析方法进行介绍说明。

alpha多样性指数组间差异统计分析用到的检验方法是:单因素方差分析(如果只有两个分组,用Wilcoxon秩和检验,3个及以上的分组用Kruskal-Wallis检验),图上方显示P值

beta多样性指数的统计检验方法有ANOSIM相似性分析和Adonis多元方差分析,这两种都是基于距离矩阵的检验方法。

Anosim相似性分析

Anosim分析是一种非参数检验,用来检验组间的差异是否显著大于组内差异,从而判断分组是否有意义。

报告中给出了加权距离和非加权距离的Anosim结果图,图中给出了R值和P值。

R值用于比较不同组间是否存在差异,R-value介于(-1,1)之间,R-value>0,说明组间差异大于组内差异。R-value<0,说明组间差异小于组内差异。R只是组间是否有差异的数值表示,并不提供显著性说明。

统计分析的可信度用P-value表示,P<0.05表示统计具有显著性。

图中能看出R>0,说明组间差异大于组内差异,P<0.05,说明差异显著,证明该分组情况效果较好。

Adonis多元方差分析

Adonis多元方差分析,其实就是PERMANOVA,亦可称为非参数多元方差分析。

其原理是利用距离矩阵(比如基于Bray-Curtis距离、Euclidean距离)对总方差进行分解,分析不同分组因素对样品差异的解释度,并使用置换检验对其统计学意义进行显著性分析。

它与Anosim的用途相似,也能够给出不同分组因素对样品差异的解释度(R值)与分组显著性(P值)。

报告中PCoAbray距离、PCoAweighted_unifrac距离、PCoAunweighted_unifrac距离的图片右下角有给出PERMANOVA检验的P值和R值。

图中看出PCoabray距离得到的检验P<0.05组间差异显著,并且分组之间区分较为明显。

PCoabray距离的PERMANOVA检验结果路径:

多组间检验结果:

Groups/betadiv/pcoa_bray_analysis/PERMANOVA.result_all.csv

两组间检验结果:

Groups/betadiv/pcoa_bray_analysis/PERMANOVA_paired_result.csv

不同分类水平下的检验方法

在很多分析报告当中,例如在不同疾病的肠道菌群分组中,本身样本个体之间肠道菌群的物种多样性,丰富度差异并不大,alpha多样性组间差异并不显著,beta多样性分组间区分不是很明显,这样就需要进一步找出分组之间的差异物种或者差异功能来进行分析。

对于不同分类水平的物种和功能预测结果用到以下几种检验方法:

Tukey检验

Tukey主要应用于3组或以上的多重比较,适合于各组例数相等的每两两分组之间比较。

Tukey检验的一个重要的优点是非常简单,而且所需实验样本相对较少。

其检验结果的可信度达到95%的置信水平时,最少的情况下只需6个样本进行验证(改善前3个样本、改善后3个样本)。

图中的字母代表显著性差异的字母表示法,只要含有相同的字母,就表明两组之间没有显著性差异。

例如a和ab含有相同字母“a”,表示两组之间没有显著性差异。ab中的“b”表示这一组和其他含有字母b的组(比如bc)没有显著性差异,但是a和bc就有显著性差异了。

图中只展示Tukey检验差异显著的物种或功能,如果数量较多,则只展示前10个。

路径:Groups/diff_analysis/TukeyHSD/

图中显示的都是Tukey检验组间差异显著的物种,依次按照丰度从高到底排列,如果差异结果较大,则显示前10个物种。例如在该图中,Tukey检验结果,门水平物种Actinobacteriota在BB与MG1组、BB与MG2、BF与GG组、BF与MG1组、BF与MG2组,这些分组之间组间差异显著。

组间差异箱型图

组间差异箱型图用到的检验方法是通过单因素方差检验(只有两个分组,用的是Wilcoxon秩和检验,3个及以上的分组用的是Kruskal-Wallis检验),Var检验和one-way相结合,筛选出组间差异性物种。

路径:Groups/diff_analysis/TaxaMarkers

图中每一个箱型图代表一个组间差异显著的物种

图中显示的都是统计方法得到的差异显著的物种,图中能看出这3个物种分组之间差异显著。

命名格式是,例如:Cen_Nitrosopumilus指的是,当前分类水平(属水平)的名字g__Nitrosopu加上一级分类水平(科水平)的名字f__Cenarchaeaceae的前3个字母简写Cen,如果当前水平没有注释到名字则以全称的名字表示。

统计结果表:Groups/diff_analysis/TaxaMarkers/xxx.Groups.sig.meanTests.csv

例如这是一个表格的截图

红框mean_是分组组间的平均值

蓝框sd_代表组间的标准差

粉色.test代表不同统计检验结果的P-valueP值,这里有var检验T检验Wilcoxon检验(或Kruskal-Wallis检验)

绿色_BH例如Wilcoxon.test_BH代表Wilcoxon.test检验BH矫正的Q-value,Q值

UnivarTest检验(单因素方差分析)

单因素方差分析是指如果只有两个分组,用Wilcoxon秩和检验,3个及以上的分组用Kruskal-Wallis检验。

路径:Groups/diff_analysis/UnivarTestXXX

Groups\diff_analysis\UnivarTestKEGG\figure文件夹下有做成柱状图、箱型图和单个物种之间的图,其中有横着排列和竖着排列的,有用原始值计算的,还有对原始值取log后进行统计的。图中只展示Univar检验组间差异显著的物种/功能。

统计结果表:Groups/diff_analysis/UnivarTestXXX/UnivarTest_sign.txt

图中显示的是该统计检验差异显著的物种的柱状图或箱型图,按照丰度从高到低排列,如果差异物种/功能较大,则只显示前10个。例如该图中Therobifida、Staphylococcus、Streptomyces等物种用Kruskal-Wallis检验得到的组间显著差异物种。

该图展示了Bacillus物种Kruskal-Wallis检验差异结果,所有分组中P<0,001多组间差异显著,两组间BB与GG、BB与MG1、BB与MG2、BF与GG、BF与MG1、BF与MG2,组间差异显著。

LEfse分析

LEfSe用到的统计分析方法是将线性判别分析与非参数的Kruskal-Wallis以及Wilcoxon秩和检验相结合。

LEfse分析结果中一般会出现两个图,一张表(LDA值分布柱状图、进化分支图以及特征表)。

LDA值分布柱状图

这个条形图主要为我们展示了LDAscore大于预设值的显著差异物种,即具有统计学差异的Biomaker,默认值为2.0(看横坐标,只有LDA值的绝对值大于2才会显示在图中);柱状图的颜色代表各自的分组,长短代表的是LDAscore,即不同组间显著差异物种的影响程度。

路径:

Group/Lefse_Analysis/out_formant.cladogram.png

图中展示了不同分组特有的Lefse组间差异标记物,例如BB组的标记物是目水平的Bacillales和科水平的Bacillaceae,不同的分组标记物也不同,图中如果只展示了部分分组,则代表只有部分分组通过Lefse分析筛选出组间差异标记物。

进化分支图

小圆圈:图中由内至外辐射的圆圈代表了由门至属的分类级别(最里面的那个黄圈圈是界)。不同分类级别上的每一个小圆圈代表该水平下的一个分类,小圆圈的直径大小代表了相对丰度的大小。

颜色:无显著差异的物种统一着色为黄色,差异显著的物种Biomarker跟随组别进行着色,红色节点表示在红色组别中起到重要作用的微生物类群,蓝色节点表示在蓝色组别中起到重要作用的微生物类群。

未能在图中显示的Biomarker对应的物种名会展示在右侧,字母编号与图中对应(为了美观,右侧默认只显示门到科的差异物种)。

路径:Group/Lefse_Analysis/out_formant.png

图中右侧展示了分支图中的字母对应的物种信息,例如a代表GG组的标记物目水平的Microtrichales,b代表GG组的标记物刚水平的Acidimicrobiia。在分支图的最外层显示的是各分组门水平物种的标记物,例如BF组的是Actinobacteriota、MG1组的是Proteobacteria、

MG2组的是Cyanobacteria

特征表

路径:Group/Lefse_Analysis/out_formant.res.csv

第一列是样本中从门到属水平所有分类单位的列表

Lefse会逐一判断这些分类单位的在分组之间是否具有统计学显著性差异。

第二列:各组分丰度平均值中最大值的log10,如果平均丰度小于10的按照10来计算;如果该分类单位未体现出显著组间差异,则后三列为空。

对于具有统计学差异的分类单位:

第三列:差异基因或物种富集平均丰度最高的分组组名;

第四列:LDA差异分析的对数得分值;

第五列:Kruskal-Wallis秩和检验的p值,若不是Biomarker用“-”表示。

默认LDA>2,P<0.05

通常根据第4列的LDA差异分析对数得分值和第五列的P值,可以描述组间具有显著差异的分类单位统计学效力强弱。

metagenomeSeq

metagenomeSeq是用R开发的一个包,metagenomeSeq的基本思想,用normalization实现分类注释时的biases处理,同时用零膨胀高斯分布(zero-flatedGaussiandistribution)处理了测序深度所带来的影响,在此基础上,利用线性模型找到存在的差异所在。

路径:Groups/diff_analysis/metagenomeRXXX

metagenomeSeq差异显著物种/功能热图

metagenomeSeq差异菌属于功能代谢关联分析

随机森林模型

一种非线性分类器,随机森林属于集成类型的机器学习算法,挖掘变量之间复杂的非线性的相互依赖关系。通过随机森林重要性点图,可以找出分组间差异的关键物种/功能。

反映了分类器中对分类效果起主要作用的特征,按重要性从大到小排列。

Errorrate:表示使用下方的特征进行随机森林方法预测分类的错误率,数值越高表示基于特征分类准确度不高,可能分组之间特征不明显。分值越低证明分组效果比较好。

图中按照随机森林模型效果筛选出的对分组效果有重要性作用的物种,按照重要性从高到低进行排列,例如图中最终要的是a,依次往下是b、c等。错误率较小,表明该分组效果较好。

ROC曲线

ROC曲线分析是一种常用的统计学分析方法,在医学研究中主要用于评价诊断试验的效能。在16S测序报告中,我们通过绘制ROC曲线,并计算ROC曲线下面积(AUC),来确定分组对于菌群是否有诊断价值。

ROC曲线图是反映敏感性与特异性之间关系的曲线。ROC曲线下的面积值在1.0和0.5之间。在AUC>0.5的情况下,AUC越接近于1,说明诊断效果越好。

AUC在0.5~0.7时有较低准确性,AUC在0.7~0.9时有一定准确性,AUC在0.9以上时有较高准确性。AUC=0.5时,说明诊断方法完全不起作用,无诊断价值。AUC<0.5不符合真实情况,在实际中极少出现。

从图中能看出各分组的AUC都大于大于0.9,各分组的分组效果较好,BF组AUC等于1,该分组效果最好,可能样本之间较为相近,并且跟其他分组组间差异也比较大。

以上是组间统计差异的方法介绍,其他的还包括关联分析。

关联性分析

CCA图

可以分析样本、菌群、理化指标之间的关联关系。图中使用点代表不同的样本,从原点发出的箭头代表不同的环境因子。

图像中坐标轴标签中的数值,代表了坐标轴所代表的环境因子组合对物种群落变化的解释比例。

RDA冗余分析

Envfit分析

回归拟合分析结果:

Network网络分析

还可以做菌属之间的网络分析关联图,共发生网络图为研究复杂微生物环境的群落结构和功能提供了新的视角。

由于不同环境下微生物的共发生关系截然不同,通过物种共发生网络图,可以直观看出不同环境因素对微生物适应性的影响,以及某个环境下占互作主导地位的优势物种、互作紧密的物种群,这些优势物种以及物种群往往对维持该环境的微生物群落结构和功能稳定发挥着独特以及重要的作用。

报告里涵盖了大部分16S所需要的图片,不过也有个别个性化的图需要单独用到软件去做,可以单独完成个性化图表生成。

随着16s分析报告的不断升级,报告中的图表以及相应的解读也会越来越精细完善,谷禾也将尽可能为大家的科研之路带来更多便利。

宏基因组测序可以使我们深度全面地了解微生物群的构成,对于缺乏深度研究和高质量参考基因组的样本,宏基因组获得的较为完整的基因组不仅可以丰富参考基因组数据库,同时可以提供更加准确的物种分类。

更多关于宏基因组科研服务详询:

近年的研究热点集中于环境和生物体相互作用的微生物群体,而大量复杂的微生物群体存在培养困难,构成复杂(包括细菌、古菌、真菌、原生生物、病毒甚至小型真核生物)。为了克服传统纯培养技术的不足,充分挖掘此类未培养微生物所蕴涵的巨大潜能,发展了宏基因组学的研究方法,该方法绕过纯培养技术来研究微生物的多样性及功能。

此外对于缺乏深度研究和高质量参考基因组的样本,如土壤和特殊环境下的样本,宏基因组获得的较为完整的基因组不仅可以丰富参考基因组数据库,同时可以提供更加准确的物种分类。

建库流程1)将检测合格的基因组DNA样品用酶切随机打断成400bp-500bp的片段并末端修复加A;2)将测序引物连接到DNA片段上;3)进行PCR扩增引入测序index4)对构建的文库进行质量检测;5)将质量检测合格的文库上机测序。

粪便、动物肠道内容物、皮肤、组织、痰液、血液、唾液、牙菌斑、尿液,阴道分泌物、发酵物,瘤胃,废水,火山灰,冻土层、病害组织、淤泥、土壤、堆肥、污染河流,养殖水体、空气等有微生物存在的样本都可以用于宏基因组测序。

测序平台:IlluminaNovaseq,PE150,默认:5-6G/样,每增加一个G加100元。

周期:2-3周

第一项研究是关于肥胖患者减肥手术后的宏基因组和代谢数据的分析研究。

研究纳入了61名严重肥胖的受试者,他们是可调节胃束带术(AGB,n=20)或Roux-en-Y胃旁路术(RYGB,n=41)的候选人。减肥手术后1、3和12个月随访24名受试者。使用宏基因组学测序和LC-MS分析肠道菌群和血清代谢组。另外纳入了10人和147人分别作为宏基因组和代谢检测的验证集。

研究思路

这样的设计分别有什么作用?

第一点持续的动态采样可以获得持续变化情况,尤其是在一个特定变化后(减肥手术),持续的最终采样有助于确认菌群的变化出现和特定事件或生理病理变化的前后,尤其是在确定因果中有重要帮助。

第二点获得多维的数据有助于帮助我们全方位的了解菌群变化背后的带来的生理和代谢变化以及之间的关联。

第三点独立验证集的存在将大大增强研究的可信度,尤其是该研究纳入的样本量并不多,无法全面有效的控制无关因素,使得很多统计检验的效力无法显现。这也导致该研究仅在基因总量和多样性上获得较好的重复效果,而更多的菌群精细特征以及具体基因和代谢通路没有得到深入分析。但是独立验证集保证了核心结论的可靠性和重复性,这点在宏基因组研究中非常重要。

上图的研究可以通过patternsearch的方法寻找特定变化模式的菌种。

总体而言该项研究可以使用浅宏基因组来完成所有测序和分析,进一步扩大样本数量,如果能同时获得人的转录组数据甚至能更加明确的找到菌群变化与特定代谢通路的关联关系。

<案例二>食物与人类肠道微生物组

可以看到,研究同时记录了粪便样本的菌群宏基因组和每日的饮食记录。研究的核心在于将每日饮食的食物通过营养构成进行量化,并构建类似物种进化树的食物物候树。

最后基于菌群数据和前一日饮食来构建模型预测判断后一日的菌群状态,帮助我们了解食物对于个体菌群的影响因素并实现定量和预测。

研究中对数据的处理过滤标准如下:删除所有具有低读取计数(每个样品<23,500个读取)的样品。物种级别的分类表仅限于研究对象中至少存在25%的研究日,且在10%的研究样本对象中发现的那些物种。

最后,相对丰度<0.01%的稀有物种被丢弃,将物种数量限制为290个注释。将得到的分类表汇总到较高的分类级别(即属,科,门等),以进行下游分析。

菌群和饮食以及营养构成的堆叠图很好展现了变化和对应。

本研究虽然有大量样本,但并未进行组装,而是直接使用了Refseq的细菌完成基因组序列作为参考。研究由于样本数量众多,测序深度也很有限,类似研究也可以使用浅宏基因组方式完成。

接下来的一个研究是比较典型的宏基因组组装并与疾病进行关联分析的案例,研究的是类风湿关节炎人群的肠道微生物组的全基因组关联研究。

研究使用较高深度的宏基因组shotgun测序(每个样本平均13Gb)对日本人群(病例=82,对照=42)进行了RA肠道微生物组的MWAS分析。MWAS由三个主要的生物信息学分析渠道(系统发育分析、功能基因分析、途径分析)组成。

使用了之前研究中6139个完成拼接日本人肠道宏基因组作为参考序列以及其他几项研究的参考基因组,在过滤部分种过多的基因组之后,最后一共使用了7881个参考基因组。

将QC后的序列直接比对到参考基因组,并根据基因组长度计算对应物种的相对丰度。

基因方面选择denovo组装,使用MegaHIT,然后再contig上完成ORF预测和CD-HIT聚类去冗余,最后与UniRef和KEGG数据库比对。

最后使用bowtie2将测序序列比对到注释后的unigene序列上获得基因丰度,经过KEGG注释得到代谢途径的丰度。研究的数据处理流程图如下:

在数据分析流程和方案选择上人体肠道菌群由于研究众多,以及有多个深度测序拼接完成的Binning参考基因组数据集,确实可以直接使用参考基因组直接比对。

对于菌属的关联分析,最终将显著性结果以火山图和GraPhlAn图的形式展现如下:

上面其中D图使用每个菌的丰度进行UMAP分析,并映射关联效应的展示比较有意思。

不过在基因层面上并未找到相应的关联,可以看到下图UniRef90的NMDS分布图两组之间无法有效区分,多样性也没有显著差异。

这项研究在菌层面发现了多个普雷沃氏菌属的菌在日本人群中与类风湿性关节炎存在关联,不过除此之外其他方面的发现并不多,仅找到一个基因存在显著关联,涉及的临床调查也相对有限,且人群队列数量不算多,并无独立验证集,因此亮点并不多。如果能纳入免疫相应指标可能能研究的更细致一些。

最后这项研究是对来自永冻土融化梯度的214个样品的宏基因组测序组装了1,529个基因组,揭示了参与有机物降解的关键种群,包括其基因组编码先前未描述的木糖降解真菌途径的细菌。

通过宏基因组denovo组装和分箱Binning,最终获得了1529个永冻土菌群基因组。基于这些数据描绘了永冻土融化梯度下的菌群构成特征,如下图。

论文是2018年发表的,测序是在2011和12年测的,使用的是CLCGenomicsWorkbench较早的4.4版分单样本组装,然后使用MetaBAT进行分箱,最后的标准是70%完成度和低于10%的污染。

其中糖苷水解酶基因使用dbCAN数据库的HMM进行预测,碳代谢使用KEGG数据。

研究还同时选择了部分样本进行了宏转录组和宏蛋白组的测序,对碳代谢同时结合转录组和蛋白组的数据,展现了特定通路下不同永冻土的菌群构成和表达丰度差异。

基因组拼接的分布情况,以及不同地域样本分布和菌属丰度情况如下:

木糖降解途径在每个样本中的分布和维恩图,另外详细的展现了主要门对每个代谢途径的贡献和基因表达丰度,如下图:

这张图分析了特定菌与地理位置和CO2以及甲烷的浓度的关联性,如下图:

总结一下这项研究,永冻土的菌群参考基因组数据缺乏,该研究从大量地点采集样本重建了1500多个参考基因组。

首先从物种构成特征上与永冻土融化阶段特征进行分析,并与重要环境因子进行分析,锁定重要的特征菌。

研究基本上从头构建了一个生态环境下的菌群结构数据,并利用获得的基因组深度解析特定代谢途径和基因的构成和表达变化,应该说既宽又深。很多样本采集和测序是2011年和2012年就开展的,虽然测序技术远不如现在成本低和成熟,但是其独特的研究对象和全面深入的分析仍然使整项研究和目前的一些研究相比完成的更加出色。

样本需求量低:常规宏基因组建库建议样本量在500ng以上,公司研发实现了低当量微生物样本提取和建库,保证提取丰度以及片段完整性同时,样本量需求低于同行其他公司要求;对于样本获取困难的样本,也可以选择微量建库,样本量可低至10ng。

免费取样盒和针对性取样建议:粪便及环境样本提供取样盒助力临床/科研取样,人体口腔、痰液、腹水、脑脊液、尿液、皮肤等高寄主细胞含量样本可根据我们的处理方案简单处理后大幅降低宿主DNA比例。

严格标准的实验流程:自动化样品处理平台辅助,每轮设置阳性对照,上轮检测样本对照,阴性对照。评估污染,轮次比对,最大化减少误差,保证样本重复性和稳定性

Illumina测序平台:宏基因组测序(PE150)采用先进的IlluminaNovaseq测序平台,快速、高效地读取高质量的测序数据、结合样品特点和数据的产出,充分挖掘环境样品中的微生物菌群和功能基因

大数据分析流程质量流程控制严格:优化的数据质量控制,包括过滤比对质量低、非特异性扩增、覆盖度低、低复杂度的序列,从而快速准确获得样本中微生物信息及其丰度信息,最大化提高质量数据

分析内容丰富全面:物种分析,基因预测与分析,多样性和相似性分析,功能分析,网路互作分析,代谢网络,关联分析等

完整详细的报告:提供质检实验报告,分析统计报告,分析报告解读,原始数据

高效个性化服务:在线项目系统方便您及时查看项目动态和下载报告以及与分析人员高效交流,免费支持个性化图表修改以及重新分组出报告。

价格低,周期快:包括提取,测序到分析,最快2周出报告。

大数据分析团队和多中心大项目分析经验(团队主要源自浙江大学,包括生物信息学,计算机,微生物以及统计分析等专业,积累了多年的大健康项目多中心项目分析经验,有助于宏基因组大数据,多样本,多表型,多组学联合分析

兼容性强的合作模式:有专门团队负责,提供切实可行的项目方案,兼顾临床和科研双需求模式。

16SrRNA基因是编码原核生物核糖体小亚基的基因,长度约为1542bp,其分子大小适中,突变率小,是细菌系统分类学研究中最常用和最有用的标志。

16SrRNA基因序列包括9个可变区和10个保守区,保守区序列反映了物种间的亲缘关系,而可变区序列则能体现物种间的差异。

16SrRNA基因测序以细菌16SrRNA基因测序为主,核心是研究样品中的物种分类、物种丰度系统进化、功能预测以及微生物与环境互作关系等。

粪便、动物肠道内容物、皮肤、组织、痰液、血液、唾液、牙菌斑、尿液,阴道分泌物、发酵物,瘤胃,废水,火山灰,冻土层、病害组织、淤泥、土壤、堆肥、污染河流,养殖水体、空气等有微生物存在的样本都可以用于16s测序分析

取样:人/动物粪便,口腔,唾液,阴道,尿液,皮肤等可提供免费常用保存运输取样盒,其他样本可直接送样测序平台:IlluminaNovaseq测序区域:V4,V3V4测序数据量:10万reads(V4);5万reads(V3V4)周期:1-2周(V4);2-4周(V3V4)

①粪便样本包括肠道内容物:我们提供专门取样盒(免费)。人、大鼠、猪等,直接用取样盒里的棉签沾取约绿豆至黄豆大小的粪便至粪便保存液即可。颗粒状粪便,如小鼠,可根据粪便大小取几颗至粪便保存液即可。

备注:取样盒里有详细的粪便取样操作说明。

②人或者动物其他部位:例如口腔,鼻腔,阴道等:我们提供专门取样盒(免费)。取样方式也是用棉签沾取相应部位菌至保存液。但是根据研究项目,取样部位以及方式略有不同,这个不能一概而论,特殊项目最好单独咨询便于提供最佳方案。

③土壤,底泥水,污泥:需要5-10g的鲜样,土壤,底泥样若有沙石等需要先过筛后再送样。

④水体样,包括河流,湖畔,自来水等:需要先过滤膜,根据水体中含菌量选择一定体积的水体过滤膜,如自来水,一般需要5-15升水过滤膜,然后将滤膜送过来即可。

⑤DNA:浓度不低于5ng/ul,总体积不少于40ul。

但仍然会有零星小问题,如何“跑赢最后一公里”?

售后服务:

高效个性化服务:在线项目系统方便您及时查看项目动态和下载报告以及与分析人员高效交流,支持个性化图表修改以及重新分组出报告。

价格低,周期快:包括提取,测序到分析,最快一周出报告。

研究背景:全球塑料产量飞速增长,而且呈持续上升的趋势,因此导致大量塑料废物排放到环境中,从沿海河口到大洋环流,从东大西洋到南太平洋海域。塑料废弃物具有化学稳定性和生物利用率低的特点,可长期存在于海洋中,从而影响海洋环境包括海洋生物的生存。

主要图表

两两群落差异指数的PCoA图

PCoA图可以清楚地看到,SW区细菌群落的置信椭圆与pd和sd的置信椭圆有显著的偏差(p<0.05),而sd上细菌群落的置信椭圆几乎覆盖了pd的置信椭圆(p>0.05),这表明pd和sd上的细菌群落有相似之处。

不同样本和处理下的细菌群落(前10位)丰度分布

底物(SW、SD和Pd)上的主要属为细菌和假互斥单胞菌,暴露两周后,这些菌可能是分布广泛和适应性强的三种底物(SW、SD和PD)。暴露4周后,弧菌相对丰度增加.此外,暴露6周后,自养细菌(如扁平菌和硝酸菌)的数量增加。这三种底物上个细菌群落的生长模式也与3.2的结果一致。图5还显示,在6个星期内,在429个原位点中,假单胞菌在pd上的相对丰度高于sw和sd(anova,p<0.05)。

研究背景:研究表明遗传和环境影响都在I型糖尿病的发展中起作用,增加的遗传风险不足以引起疾病,环境因素也是需要的,而且起着至关重要的作用。肠道菌群也许就是这个重要的环境因素,肠道菌群在免疫系统的成熟中起重要作用,此外还影响自身免疫疾病发展。

不同遗传风险儿童的LDA差异菌群

不同遗传风险分组中包含的常见菌属,部分存在特定分组中

PCoA分析揭示不同遗传风险儿童肠道菌群的在不同地域样本中均存在显著差异

点评:针对I型糖尿病疾病发生过程中遗传HLA分型风险和对应肠道菌群菌的关联分析,揭示了特定肠道菌群与宿主特定遗传风险共同作用推进疾病发生。某些特定菌属可能无法在遗传高风险儿童肠道内定植,可能对疾病发生存在特定作用。此外对于其他遗传风险的自身免疫疾病也具有重要提示意义,例如乳糜泻和类风湿性关节炎。

KhanA,RehmanA,AyubQ,etal.Thecompositionofthebloodmicrobiotaanditsrelationshiptoosteoporosis-relatedclinicalparameters[J].MedicineinMicroecology,2023,100097.

XuS,LiuW,GongL,etal.AssociationofADRB2genepolymorphismsandintestinalmicrobiotainChineseHanadolescents[J].OpenLifeSciences,2023,18(1),20220646.

WangX,WengY,GengS,etal.Maternalprocymidoneexposurehaslastingeffectsonmurinegut-liveraxisandglucolipidmetabolisminoffspring[J].FoodandChemicalToxicology,2023,174,113657.

LiuH,XingY,WangY,etal.DendrobiumofficinalePolysaccharidePreventsDiabetesviatheRegulationofGutMicrobiotainPrediabeticMice[J].Foods.2023,8;12(12):2310.

YanX,YanJ,XiangQ,etal.Early-lifegutmicrobiotainfoodallergicchildrenanditsimpactonthedevelopmentofallergicdisease[J].ItalJPediatr.2023,9;49(1):148.

XiangQ,YanX,LinX,etal.IntestinalMicrofloraAlteredbyVancomycinExposureinEarlyLifeUp-regulatesType2InnateLymphocyteandAggravatesAirwayInflammationinAsthmaticMice[J].Inflammation.2023,46(2):509-521.

QiuJ,ZhaoL,ChengY,ChenQ,etal.Exploringthegutmycobiome:differentialcompositionandclinicalassociationsinhypertension,chronickidneydisease,andtheircomorbidity[J].FrontImmunol.2023,14;14:1317809.

JiangS,ZhangB,FanX,etal.GutmicrobiomepredictsseleniumsupplementationefficiencyacrossdifferentChineseadultcohortsusinghybridmodelingandfeaturerefining[J].FrontMicrobiol.2023,Oct17;14:1291010.

LiuT,LiuJ,WangP,etal.EffectofslurryiceonqualitycharacteristicsandmicrobiotacompositionofPacificwhiteshrimpduringrefrigeratedstorage[J].JournalofAgricultureandFoodResearch,2023,14,100792.

ChenB,XuJ,LuH,etal.Remediationofbenzo[a]pyrenecontaminatedsoilsbymoderatechemicaloxidationcoupledwithmicrobialdegradation[J].SciTotalEnviron.2023,1;871:161801.

Shouhua,Z.,&Meilan,L.MicrobialDiversityandAbundanceinPulmonaryTissueofPatientswithEarly-StageLungCancer[J].JundishapurJournalofMicrobiology,2023,16(5).

WeiT,LiaoY,WangY,etal.ComparablyCharacterizingtheGutMicrobialCommunitiesofAmphipodsfromLittoraltoHadalZones[J].JournalofMarineScienceandEngineering,2023,11(11),2197.

JiC,LuoY,YangJ,etal.Polyhalogenatedcarbazolesinducehepaticmetabolicdisordersinmiceviaalterationingutmicrobiota[J].JEnvironSci(China).2023,127:603-614.

HanB,YangF,ShenS,etal.Effectsofsoilhabitatchangesonantibioticresistancegenesandrelatedmicrobiomesinpaddyfields[J].SciTotalEnviron.2023,15;895:165109.

LiS,NiuZ,WangM,etal.Theoccurrenceandvariationsofextracellularantibioticresistancegenesindrinkingwatersupplysystem:Apotentialrisktoourhealth[J].JournalofCleanerProduction,2023,402,136714.

GaoX,ZhaoJ,ChenW,etal.Foodanddrugdesignforgutmicrobiota-directedregulation:Currentexperimentallandscapeandfutureinnovation[J].PharmacolRes.2023,194:106867.

HanB,ShenS,YangF,etal.Exploringantibioticresistanceloadinpaddy-uplandrotationfieldsamendedwithcommercialorganicandchemical/slowreleasefertilizer[J].FrontiersinMicrobiology,2023,14,1184238.

AlsholiDM,YacoubGS,RehmanAU,etal.LactobacillusrhamnosusAttenuatesCisplatin-InducedIntestinalMucositisinMiceviaModulatingtheGutMicrobiotaandImprovingIntestinalInflammation[J].Pathogens,2023,11;12(11):1340.

XieX,XuH,ShuR,etal.ClockgenePer3deficiencydisruptscircadianalterationsofgutmicrobiotainmice[J].ActaBiochimBiophysSin(Shanghai).2023,15;(12):2004-2007.

XiaoW,ZhangQ,ZhaoS,etal.CitricacidsecretionfromricerootscontributestoreductionandimmobilizationofCr(VI)bydrivingmicrobialsulfurandironcycleinpaddysoil[J].SciTotalEnviron.2023,1;854:158832.

LiR,LiuR,ChenL,etal.MicrobiotafromExerciseMiceCounteractsHigh-FatHigh-CholesterolDiet-InducedCognitiveImpairmentinC57BL/6Mice[J].OxidMedCellLongev.2023,20;2023:2766250.

LiaoJ,DouY,YangX,etal.Soilmicrobialcommunityandtheirfunctionalgenesduringgrasslandrestoration[J].JournalofEnvironmentalManagement,2023,325,116488.

LiuF,DuJ,LinH,etal.Thebladdermicrobiomeofchronickidneydiseasewithassociationstodemographics,renalfunction,andserumcytokines[J].medRxiv,2023-05.

UllahH,DengT,AliM,etal.SeaConchPeptidesHydrolysateAlleviatesDSS-InducedColitisinMicethroughImmuneModulationandGutMicrobiotaRestoration[J].Molecules.2023,28;28(19):6849.

ZouS,LiuR,LuoY,etal.Effectsoffungalagentsandbiocharonodoremissionsandmicrobialcommunitydynamicsduringin-situtreatmentoffoodwaste[J].BioresourTechnol.2023;380:129095.

WuJ,ZhangD,ZhaoM,etal.GutMicrobiotaDysbiosisandIncreasedNLRP3LevelsinPatientswithPregnancy-InducedHypertension[J].CurrMicrobiol.2023,6;80(5):168.

LiR,LiuR,ChenL,etal.MicrobiotafromExerciseMiceCounteractsHigh-FatHigh-CholesterolDiet-InducedCognitiveImpairmentinC57BL/6Mice[J].OxidMedCellLongev.2023,20:2766250.

XiaoW,ZhangQ,ZhaoS,etal.CitricacidsecretionfromricerootscontributestoreductionandimmobilizationofCr(VI)bydrivingmicrobialsulfurandironcycleinpaddysoil[J].SciTotalEnviron.2023,16:158832.

WangX,WengY,GengS,etal.Maternalprocymidoneexposurehaslastingeffectsonmurinegut-liveraxisandglucolipidmetabolisminoffspring[J].FoodChemToxicol.2023,174:113657.

LiaoJ,DouY,YangX,etal.Soilmicrobialcommunityandtheirfunctionalgenesduringgrasslandrestoration[J].JEnvironManage.2023,Jan1;325(PtA):116488.

LiS,NiuZ,WangM,etal.Theoccurrenceandvariationsofextracellularantibioticresistancegenesindrinkingwatersupplysystem:Apotentialrisktoourhealth[J].JournalofCleanerProduction.2023,20,136714.

HuY,LiJ,NiF,etal.CAR-Tcelltherapy-relatedcytokinereleasesyndromeandtherapeuticresponseismodulatedbythegutmicrobiomeinhematologicmalignancies[J].Naturecommunications,2022,13(1):1-14.

LouM,CaoA,JinC,etal.Deviatedandearlyunsustainablestunteddevelopmentofgutmicrobiotainchildrenwithautismspectrumdisorder[J].Gut,2021Dec20:gutjnl-2021-325115.

ChenC,DuY,LiuY,etal.Characteristicsofgastriccancergutmicrobiomeaccordingtotumorstageandagesegmentation[J].AppliedMicrobiologyandBiotechnology,2022,106(19):6671-6687.

ChenC,ShenJ,DuY,etal.Characteristicsofgutmicrobiotainpatientswithgastriccancerbysurgery,chemotherapyandlymphnodemetastasis[J].ClinicalandTranslationalOncology,2022,24(11):2181-2190.

ShenJ,JinCL,ZhangYY,etal.Amultiple-dimensionmodelformicrobiotaofpatientswithcolorectalcancerfromnormalparticipantsandotherintestinaldisorders[J].AppliedMicrobialandCellPhysiology,2022,February26

ZhangG,PangY,ZhouY,etal.EffectofdissolvedoxygenonN2Oreleaseinthesewersystemduringcontrollinghydrogensulfidebynitratedosing[J].ScienceofTheTotalEnvironment.2022,Apr10;816:151581.

ZhaoY,HuangJ,LiT,etal.BerberineamelioratesaGVHDbygutmicrobiotaremodelling,TLR4signallingsuppressionandcolonicbarrierrepairmentforNLRP3inflammasomeinhibition[J].JournalofCellularandMolecularMedicine,2022,26(4):1060-1070.

Hang,ZC,CaiSL,LeiT,etal.TransferofTumor-BearingMiceIntestinalFloraCanAmeliorateCognitioninAlzheimersDiseaseMice[J].JAlzheimersDis.2022,86(3):1287-1300.

ZhuW,YanM,CaoH,etal.EffectsofClostridiumbutyricumCapsulesCombinedwithRosuvastatinonIntestinalFlora,LipidMetabolism,LiverFunctionandInflammationinNAFLDPatients[J].CellularandMolecularBiology.2022,68(2):64-69.

YangF,WangZ,ZhaoD,etal.Food-derivedCrassostreagigaspeptidesself-assembledsupramoleculesforscarlesshealing[J].CompositesPartB:Engineering,2022,246:110265.

YuT,JiL,LouL,etal.FusobacteriumnucleatumAffectsCellApoptosisbyRegulatingIntestinalFloraandMetabolitestoPromotetheDevelopmentofColorectalCancer[J].Frontiersinmicrobiology.2022,13.

QinZ,YuanX,LiuJ,etal.AlbucaBracteataPolysaccharidesAttenuateAOM/DSSInducedColonTumorigenesisviaRegulatingOxidativeStress,InflammationandGutMicrobiotainMice[J].Frontiersinpharmacology.2022,13:833077.

WangR,DengY,ZhangY,etal.ModulationofIntestinalBarrier,InflammatoryResponse,andGutMicrobiotabyPediococcuspentosaceuszy-BAlleviatesVibrioparahaemolyticusInfectioninC57BL/6JMice[J].JournalofAgriculturalandFoodChemistry.2022,70(6):1865-1877.

HuL,SunL,ZhouJ,etal.Impactofahexafluoropropyleneoxidetrimeracid(HFPO-TA)exposureonimpairingthegutmicrobiotainmice.Chemosphere,2022:134951.

YangT,TangG,LiL,etal.Interactionsbetweenbacteriaandeukaryoticmicroorganismsandtheirresponsetosoilpropertiesandheavymetalexchangeabilitynearbyacoal-firedpowerplant.Chemosphere.2022,302:134829.

ChenG,ZengR,WangX,etal.AntithromboticActivityofHeparinoidG2andItsDerivativesfromtheClamCoelomactraantiquata.MarineDrugs,2022,20(1):50.

KhanAI,RehmanAU,FarooquiNA,etal.Effectsofshrimppeptidehydrolysateonintestinalmicrobiotarestorationandimmunemodulationincyclophosphamide-treatedmice.Molecules.2022,27(5):1720.

HeL,XingY,RenX,etal.MulberryLeafExtractImprovesMetabolicSyndromebyAlleviatingLipidAccumulationInVitroandInVivo[J].Molecules,2022,27(16):5111.

RehmanAU,SiddiquiNZ,FarooquiNA,etal.Morchellaesculentamushroompolysaccharideattenuatesdiabetesandmodulatesintestinalpermeabilityandgutmicrobiotainatype2diabeticmicemodel[J].FrontiersinNutrition,2022,9.

WangX,HuL,WangC,etal.Cross-generationaleffectsofmaternalexposuretoimazalilonanaerobiccomponentsandcarnitineabsorptionassociatedwithOCTN2expressioninmice[J].Chemosphere,2022,308:136542.

ZhangG,WangG,ZhouY,etal.Simultaneoususeofnitrateandcalciumperoxidetocontrolsulfideandgreenhousegasemissioninsewers[J].ScienceofTheTotalEnvironment,2022,855:158913.

MaCJ,HeY,JinX,etal.Light-regulatednitricoxidereleasefromhydrogel-formingmicroneedlesintegratedwithgrapheneoxideforbiofilm-infected-woundhealing[J].BiomaterialsAdvances,2022,134:112555.

DongY,SuiL,YangF,etal.Reducingtheintestinalsideeffectsofacarbosebybaicaleinthroughtheregulationofgutmicrobiota:Aninvitrostudy[J].FoodChemistry,2022,394:133561.

JiC,LuoY,YangJ,etal.Polyhalogenatedcarbazolesinducehepaticmetabolicdisordersinmiceviaalterationingutmicrobiota[J].JournalofEnvironmentalSciences,2022,127:603-614.

HuJ,WeiS,GuY,etal.GutMycobiomeinPatientsWithChronicKidneyDiseaseWasAlteredandAssociatedWithImmunologicalProfiles[J].Frontiersinimmunology,2022,13.

XiaoW,ZhangQ,ZhaoS,etal.CitricacidsecretionfromricerootscontributestoreductionandimmobilizationofCr(VI)bydrivingmicrobialsulfurandironcycleinpaddysoil[J].ScienceofTheTotalEnvironment,2022,854:158832.

GuY,ChenH,LiX,etal.LactobacillusparacaseiIMC502amelioratetype2diabetesbymediatinggutmicrobiota‐SCFAs‐hormone/inflammationpathwayinmice[J].JournaloftheScienceofFoodandAgriculture,2022.

SunD,WangC,SunL,etal.PreliminaryReportonIntestinalFloraDisorder,FaecalShort-ChainFattyAcidLevelDeclineandIntestinalMucosalTissueWeakeningCausedbyLitchiExtracttoInduceSystemicInflammationinHFAMice.Nutrients.2022,14(4):776.

ZhouSP,ZhouHY,SunJC,etal.Bacterialdynamicsandfunctionsdrivenbybulkingagentstoenhanceorganicdegradationinfoodwastein-siturapidbiologicalreduction(IRBR)[J].BioprocessandBiosystemsEngineering,2022,45(4):689-700.

WenY,FengS,DaiH,etal.Intestinaldysbacteriosis-propelledThelper17cellsactivationmediatetheperioperativeneurocognitivedisorderinducedbyanesthesia/surgeryinagedrats[J].NeuroscienceLetters,2022,783:136741.

GuY,LiX,ChenH,etal.Antidiabeticeffectsofmulti-speciesprobioticanditsfermentedmilkinmiceviarestoringgutmicrobiotaandintestinalbarrier.FoodBioscience.2022,Volume47

WangR,DengY,ZhangY,etal.ModulationofIntestinalBarrier,InflammatoryResponse,andGutMicrobiotabyPediococcuspentosaceuszy-BAlleviatesVibrioparahaemolyticusInfectioninC57BL/6JMice.JAgricFoodChem.2022,16;70(6):1865-1877.

ZhangM,SunQ,ChenP,etal.Howmicroorganismstellthetruthofpotentiallytoxicelementspollutioninenvironment[J].JournalofHazardousMaterials,2022,431:128456.

WangQ,GuanC,HanJ,etal.MicroplasticsinChinaSea:analysis,status,source,andfate[J].ScienceofTheTotalEnvironment,2022,803:149887.

SunD,WangC,SunL,etal.GooneratneR.PreliminaryReportonIntestinalFloraDisorder,FaecalShort-ChainFattyAcidLevelDeclineandIntestinalMucosalTissueWeakeningCausedbyLitchiExtracttoInduceSystemicInflammationinHFAMice.Nutrients.2022,Feb12;14(4):776.

SunY,LingC,LiuL,etal.EffectsofWheyProteinorItsHydrolysateSupplementsCombinedwithanEnergy-RestrictedDietonWeightLoss:ARandomizedControlledTrialinOlderWomen.Nutrients.2022,28;14(21):4540.

YeS,WangL,LiS,etal.Thecorrelationbetweendysfunctionalintestinalfloraandpathologyfeatureofpatientswithpulmonarytuberculosis.Front.Cell.Infect.Microbiol.2022,

MaCJ,HeY,JinX,etal.Light-regulatednitricoxidereleasefromhydrogel-formingmicroneedlesintegratedwithgrapheneoxideforbiofilm-infected-woundhealing.BiomaterAdv.2022,134:112555.

WangX,HuL,WangC,etal.Cross-generationaleffectsofmaternalexposuretoimazalilonanaerobiccomponentsandcarnitineabsorptionassociatedwithOCTN2expressioninmice.Chemosphere.2022,308(Pt3):136542.

XiaoW,ZhangQ,ZhaoS,etal.CitricacidsecretionfromricerootscontributestoreductionandimmobilizationofCr(VI)bydrivingmicrobialsulfurandironcycleinpaddysoil.ScienceofTheTotalEnvironment,2022,16:158832.

GuY,ChenH,LiX,etalLactobacillusparacaseiIMC502amelioratestype2diabetesbymediatinggutmicrobiota-SCFA-hormone/inflammationpathwayinmice.JSciFoodAgric.2022,11.

LiaoJ,DouY,YangX,etal.Soilmicrobialcommunityandtheirfunctionalgenesduringgrasslandrestoration.JEnvironManage.2023,1;325(PtA):116488.

Ou-YangYN,YuanMD,YangZM,etal.RevealingthePathogenesisofSalt-SensitiveHypertensioninDahlSalt-SensitiveRatsthroughIntegratedMulti-OmicsAnalysis.Metabolites.2022,7;12(11):1076.

DongY,SuiL,YangF,etal.Reducingtheintestinalsideeffectsofacarbosebybaicaleinthroughtheregulationofgutmicrobiota:Aninvitrostudy.FoodChem.2022,15;394:133561.

ZhangG,WangG,ZhouY,etal.Simultaneoususeofnitrateandcalciumperoxidetocontrolsulfideandgreenhousegasemissioninsewers.SciTotalEnviron.2023,10;855:158913.

FangZ,ChenY,LiY,etal.OleicAcidFacilitatesCdExcretionbyIncreasingtheAbundanceofBurkholderiainCd-ExposedMice.IntJMolSci.2022,25;23(23):14718.

SiddiquiNZ,RehmanAU,YousufW,etal.Effectofcrudepolysaccharidefromseaweed,Dictyopterisdivaricata(CDDP)ongutmicrobiotarestorationandanti-diabeticactivityinstreptozotocin(STZ)-inducedT1DMmice.GutPathog.2022,17;14(1):39.

HuJ,WeiS,GuY,etal.GutMycobiomeinPatientsWithChronicKidneyDiseaseWasAlteredandAssociatedWithImmunologicalProfiles.FrontImmunol.2022,16;13:843695.

君验肠道菌群健康检测是面向全年龄段人群检测人体肠道菌群构成和健康状态的专业检测服务。使用新一代高通量基因测序技术,提供精确全面的肠道菌群构成分析。该版本为消费者提供了便捷精准的探索自身肠道菌群的方式,背后是谷禾多年技术研发和专业肠道菌群检测的支持。

健康评估总分

肠道年龄评估(将上线)

肠道菌群检测

肠道菌群平衡指数、菌群多样性指数

有害菌、有益菌丰度

超过7万5千种肠道菌群丰度

致病菌检测:艰难梭菌、沙门氏菌、志贺氏菌、弯曲杆菌

检测技术:高通量基因测序

检测样品:粪便

检测基因:16SrDNA

技术平台:IlluminaHiseq

测序深度:10万

有效期:2年

检测周期:1-2周

肠道菌群种类数量从200~2000种,个体差异巨大

粪便取样简单无创,棉签变色即可

在家就可取样,无需前往医院,手机电脑查看或打印报告

高通量基因测序技术精确检测肠道菌群

致病菌涵盖:艰难梭菌、沙门氏菌、志贺氏菌、弯曲杆菌

近40万例人体肠道菌群样本数据库,部分可精确到种

针对肠道菌群研究,谷禾进行了一系列的研发和优化,为菌群研究人员提供全套的技术服务。

一水体样本

01研究背景

迅速的工业化、城市化和人口增长导致河流污染和水生生态系统的退化。几十年来,许多研究评估了水生生态系统的健康状况,并监测和恢复了河流和湖泊的功能。然而传统的生物指示物种,例如无脊椎动物和硅藻,在严重污染的河流中面临更高的灭绝风险。因此,需要新的敏感和可靠的指标来识别和监测污染严重的河流,如黑臭河的变化。

02主要图表

03主要结论

二小鼠肠道样本

抑郁症是一种精神疾病,导致显著和持续的情绪和兴趣下降。不健康的饮食或生活方式会导致抑郁。抑郁症的发病率逐年上升,预计到2020年将成为仅次于心脏病的第二大人类疾病。研究发现抑郁症患者表现为脑、内分泌、免疫和肠脑功能异常,脑-肠轴向功能障碍可能是抑郁症的主要病理机制。越来越多的证据表明,膳食补充益生菌可改善重度抑郁症患者或面临社会压力的人的压力引起的抑郁和抑郁行为或情绪。

三土壤样本

多环芳烃(PAHs)是广泛存在于土壤中一类持久性有机污染物,具有毒性、致突变性和致癌性,可通过食物链进行生物积累,威胁人类健康。

表面活性剂强化植物修复技术(SEPR)是一种高效、经济的有机污染土壤修复技术。植物促进微生物降解是去除污染土壤中多环芳烃的主要贡献。PAHs的去除是由于污染土壤中微生物群落组成改变和PAHs降解微生物数量的增加所致。此外,微生物群落中PAHs的降解是土壤中PAHs消散的主要因素。因此,有必要研究土壤中残留多环芳烃的生物可利用部分和其它组分,以便更好的了解污染土壤中多环芳烃组分的动态变化。

合作服务整体流程如下:

部分分析内容一览表:

谷禾的优势

一体化服务

我们在高通量测序行业服务长达8年,无论是科研设计的思路,实验技术支持还是数据分析甚至整个流程的把控都有了非常丰富的经验。

专注于解决肠道菌群实际研究中的各种问题并进行全方位针对性优化。

为研究者提供从项目系统、取样、DNA提取、质控、扩增、测序、科研数据分析、肠道菌群参考数据集、人工智能模型分析并给出全面的科研分析报告。

取样便捷稳定

取样:检测方案为客户提供肠道菌群专用取样盒,没有经过训练的普通人也可以完成稳定可靠的取样。稳定可靠的保存液可在室温下有效完整保存样品DNA至少60天。

简便的样品取样,助力肠道菌群研究

稳定存储样品,提供常温运输能力

运输条件:全程常温运输。

取样管内稳定液经过海量样本测试,并通过大量样本的极端条件重复测试。测试结果表明君验的样品保存可在常温下有效保存超过1个月,4度保存6个月以上。

专利提取技术

实验过程用到严格的提取,建库技术(包括发明专利提取技术、高保真酶、循环数控制、空白和对照试验、独立barcode控制数据切分、凝胶电泳+荧光定量双重质检)。发明专利号:ZL201511009389.7。DNA提取:用户仅需将取样管通过普通快递寄回,实验室按照严格测试和优化的粪便DNA提取试剂盒进行DNA提取。

质控:因粪便样品易受环境因素和污染干扰,实验室对每一批次样品设置空白和阳性对照,从提取过程到扩增完成均进行全面对照质控。

扩增:经过多年数万例样本的测试,君验将PCR扩增循环数控制在24个循环之内,尽最大可能减少偏差。

测序平台和技术

测序:使用Illumina高通量测序平台,提供高达10万reads的高质量测序,提供达远超饱和的测序深度

IlluminaHiseq/Novaseq高通量测序

2*150bp或者2*250

Q30质量大于93%

平均10万reads,最低5万reads

肠道菌群样本70%到种

致病菌95%特异性

扩增引物

V4区:

515F:GTGCCAGCMGCCGCGGTAA

806R:GGACTACHVGGGTWTCTAAT

V3-V4区:

注:一般情况下默认是测V4区,如果特殊要求测V3-V4区也可以做,周期会相应延长至一个月。护

数据分析全覆盖

科研数据分析:提供完整全面的16s菌群分析流程和图表内容,基因功能和代谢途径预测以及个性化图表和自助分析平台帮助。

肠道菌群参考数据集:近20万例肠道菌群样本数据针对性构建的肠道菌群参考数据库远超Greengene或SILVA的覆盖度,提供史无前例的分辨精度。

人工智能分析模型:肠道菌群的复杂程度以及不同样品之间的巨大差异已无法使用简单的统计模型来解析,专业的人工智能专家对数万例样本和40多种疾病深度模型分析之后的结晶,精细化区分各种环境及影响因素的干扰,数量化评估每个特征的贡献。

微生物多样性测序结果如何看?

做过16s测序的小伙伴们都知道

测完之后会拿到一份结果报告

看似一大堆数据图表却不知如何下手

这是很多人头疼的地方

那么怎样给报告中的数据赋予灵魂

让它真正成为对你有帮助的分析呢?

一文扫除困惑

首先什么是16SrRNA?

16SrRNA基因测序以细菌16SrRNA基因测序为主,核心是研究样品中的物种分类、物种丰度以及系统进化。

二代高通量测序原理

目前二代测序是一个边合成边测序的过程,使用的是荧光可逆终止子。每个可逆终止子的碱基3’端都有一个阻断基团,而在侧边带有一种荧光。由于有4种不同的碱基(ATCG),因此也会有对应4种不同颜色的荧光。开始扩增每次结合上一个碱基,DNA的扩增便会停止,此时能收到一种荧光信号。然后放试剂除去阻断基团,进行下一个碱基的结合,以此类推得到一连串的荧光信号组合序列。而根据荧光的颜色我们便可以确定每一个位点的基因型,即可以得到这一段DNA片段的序列。

环境样品高通量分析需要重复么

基于高通量测序主要是为了了解样品的菌群构成和功能分析,以及寻找不同环境之间的差异,包括菌和功能基因以及代谢。如果仅做单一样本,很可能结论只能代表这个单一取样样本的信息,无法排除不同样本重复之间的差异,也就可能得不到真正代表环境差异的结果。

所以环境样品不仅要重复而且还应该以分组方式取尽量多的样本以全面的代表一个环境条件下的各种变异情况。

测序区段如何选择

确定做重复后,又面临该怎么选择测序区段的问题。目前市面上有v1-v3区/v3-v4区/v4区等可供选择。

16SrRNA编码基因序列共有9个保守区和9个高可变区。其中,V4区其特异性好,数据库信息全,我们通过大量的测序试验证明用v4区扩增出菌群结果的可以很好的反应样本的菌群结构用于后续的数据建模分析,是细菌多样性分析注释的最佳选择。

基本确定好后,就要着手开始实验,实验完送样又是个问题,以往给测序公司送样往往是低温运输,且不说麻烦,还要提心吊胆怕运输过程会不会有什么问题。为此我们免费提供常温保存取样盒,就不用有这样的顾虑,取样及运输全程都只需要常温即可。

16s分析结果详解

很多小伙伴有过这样的经历,在拿到公司出具的报告之后,仍然一头雾水,几十页的报告内容看着丰富却不知该怎么运用。我们一起来理一下关键图表的含义。

OTU是我们要搞清的一个重要概念,可以说是后续分析的基石。

OTU(operationaltaxonomicunits)是在系统发生学研究或群体遗传学研究中,为了便于进行分析,人为给某一个分类单元(品系,种,属,分组等)设置的同一标志。通常按照97%的相似性阈值将序列划分为不同的OTU,每一个OTU通常被视为一个微生物物种。相似性小于97%就可以认为属于不同的种,相似性小于93%-95%,可以认为属于不同的属。样品中的微生物多样性和不同微生物的丰度都是基于对OTU的分析。

有了OTU这个概念之后,就不难理解下表。对每个样本的测序数量和OTU数目进行统计,并且在表栺中列出了测序覆盖的完整度。

其中SampleName表示样本名称;SampleSize表示样本序列总数;OTUsNumber表示注释上的OTU数目;OTUsSeq表示注释上OTU的样本序列总数。

Coverage是指各样品文库的覆盖率,其数值越高,则样本中序列没有被测出的概率越低。该指数实际反映了本次测序结果是否代表样本的真实情况。计算公式为:C=1-n1/N其中n1=只含有一条序列的OTU的数目;N=抽样中出现的总的序列数目。

下表是对每个样本在分类字水平上的数量进行统计,并且在表栺中列出了在每个分类字水平上的物种数目

其中SampleName表示样本名称;Phylum表示分类到门的OTU数量;Class表示分类到纲的OTU数量;Order表示分类到目的OTU数量;Family表示分类到科的OTU数量;Genus表示分类到属的OTU数量;Species表示分类到种的OTU数量。

我们可以看到绝大部分的OTU都分类到了属(Genus),也有很多分类到了种(Species)。但是仍然有很多无法完全分类到种一级,这是由于环境微生物本身存在非常丰富的多样性,还有大量的菌仍然没有被测序和发现。

当然,对这些种属的构成还可以进行柱状图展示:

横坐标中每一个条形图代表一个样本,纵坐标代表该分类层级的序列数目或比例。同一种颜色代表相同的分类级别。图中的每根柱子中的颜色表示该样本在不同级别(门、纲、目等)的序列数目,序列数目只计算级别最低的分类,例如在属中计算过了,则在科中则不重复计算。

我们还需要对样本之间或分组之间的OTU进行比较获得韦恩图:

样品构成丰度

稀释曲线

微生物多样性分析中如何验证测序数据量是否足以反映样品中的物种多样性?

稀释曲线(丰富度曲线)可以派上用场。它是用来评价测序量是否足以覆盖所有类群,并间接反映样品中物种的丰富程度。

不免有同学有疑惑,稀释曲线怎么来的?

它是利用已测得16SrDNA序列中已知的各种OTU的相对比例,来计算抽取n个(n小于测得reads序列总数)reads时出现OTU数量的期望值,然后根据一组n值(一般为一组小于总序列数的等差数列)与其相对应的OTU数量的期望值做出曲线来。

至此,我们虽然知道了稀释曲线的由来,那么这个五彩缤纷的稀释曲线该怎么看呢?

当曲线趋于平缓或者达到平台期时也就可以认为测序深度已经基本覆盖到样品中所有的物种,增加测序数据无法再找到更多的OTU;

反之,则表示样品中物种多样性较高,还存在较多未被测序检测到的物种。

横坐标代表随机抽取的序列数量;纵坐标代表观测到的OTU数量。样本曲线的延伸终点的横坐标位置为该样本的测序数量。

Shannon-Winner曲线

Shannon-Wiener曲线,是利用shannon指数来进行绘制的,反映样品中微生物多样性的指数,利用各样品的测序量在不同测序深度时的微生物多样性指数构建曲线,以此反映各样本在不同测序数量时的微生物多样性。

当曲线趋向平坦时,说明测序数据量足够大,可以反映样品中绝大多数的微生物物种信息。

横坐标代表随机抽取的序列数量;纵坐标代表的是反映物种多样性的Shannon指数,样本曲线的延伸终点的横坐标位置为该样本的测序数量。

其中曲线的最高点也就是该样本的Shannon指数,指数越高表明样品的物种多样性越高。

好奇的同学又有疑问,Shannon指数怎么算的?

这里有Shannon指数的公式:

其中,Sobs=实际测量出的OTU数目;

ni=含有i条序列的OTU数目;N=所有的序列数。

Rank-Abundance曲线

该曲线用于同时解释样品多样性的两个方面,即样品所含物种的丰富程度和均匀程度。

横坐标代表物种排序的数量;纵坐标代表观测到的相对丰度。

样本曲线的延伸终点的横坐标位置为该样本的物种数量

物种的丰富程度由曲线在横轴上的长度来反映,曲线越宽,表示物种的组成越丰富;

物种组成的均匀程度由曲线的形状来反映,曲线越平坦,表示物种组成的均匀程度越高。

如果曲线越平滑下降表明样本的物种多样性越高,而曲线快速陡然下降表明样本中的优势菌群所占比例很高,多样性较低。

但一般超过20个样本图就会变得非常复杂而且不美观!所以假如没超过20个样可以考虑该图哦~

Alpha多样性(样本内多样性)

Alpha多样性是指一个特定区域或者生态系统内的多样性,常用的度量指标有Chao1丰富度估计量(Chao1richnessestimator)、香农–威纳多样性指数(Shannon-wienerdiversityindex)、辛普森多样性指数(Simpsondiversityindex)等。

计算菌群丰度:Chao、ace;

计算菌群多样性:Shannon、Simpson。

Simpson指数值越大,说明群落多样性越高;Shannon指数越大,说明群落多样性越高。

看了那么多指数,可能觉得有点晕,到底每个指数是什么意思呢?

当然要解释下咯:

Chao1:是用chao1算法计算群落中只检测到1次和2次的OTU数估计群落中实际存在的物种数。Chao1在生态学中常用来估计物种总数,由Chao(1984)最早提出。Chao1值越大代表物种总数越多。

Schao1=Sobs+n1(n1-1)/2(n2+1)

其中Schao1为估计的OTU数,Sobs为观测到的OTU数,n1为只有一条序列的OTU数目,n2为只有两条序列的OTU数目。

Shannon:用来估算样品中微生物的多样性指数之一。它与Simpson多样性指数均为常用的反映alpha多样性的指数。Shannon值越大,说明群落多样性越高。

Ace:用来估计群落中含有OTU数目的指数,由Chao提出,是生态学中估计物种总数的常用指数之一,与Chao1的算法不同。

Simpson:用来估算样品中微生物的多样性指数之一,由EdwardHughSimpson(1949)提出,在生态学中常用来定量的描述一个区域的生物多样性。Simpson指数值越大,说明群落多样性越高。

Alpha多样性指数差异箱形图

分别对Alphadiversity的各个指数进行秩和检验分析(若两组样品比较则使用R中的wilcox.test函数,若两组以上的样品比较则使用R中的kruskal.test函数),通过秩和检验筛选不同条件下的显著差异的AlphaDiversity指数。

Beta多样性分析(样品间差异分析)

也许我们有听说Beta多样性在最近10年间成为生物多样性研究的热点问题之一。具体解释下:

PCoA分析

PCoA(principalco-ordinatesanalysis)是一种研究数据相似性或差异性的可视化方法,通过一系列的特征值和特征向量进行排序后,选择主要排在前几位的特征值,PCoA可以找到距离矩阵中最主要的坐标,结果是数据矩阵的一个旋转,它没有改变样品点之间的相互位置关系,只是改变了坐标系统。

每一个点代表一个样本,相同颜色的点来自同一个分组,两点之间距离越近表明两者的群落构成差异越小。

另一种相似的是PCA分析

主成分分析(Principalcomponentanalysis)PCA是一种研究数据相似性或差异性的可视化方法,通过一系列的特征值和特征向量进行排序后,选择主要的前几位特征值,采取降维的思想,PCA可以找到距离矩阵中最主要的坐标,结果是数据矩阵的一个旋转,它没有改变样品点之间的相互位置关系,只是改变了坐标系统。

案例解析

NMDS分析(非度量多维尺度分析)

NMDS(NonmetricMultidimensionalScaling)常用于比对样本组之间的差异,可以基于进化关系或数量距离矩阵。

横轴和纵轴:表示基于进化或者数量距离矩阵的数值在二维表中成图。与PCA分析的主要差异在于考量了进化上的信息。

排序分析

PCA,PcoA,NMDS分析都属于排序分析(Ordinationanalysis)。

排序(ordination)的过程就是在一个可视化的低维空间或平面重新排列这些样本。

目的:使得样本之间的距离最大程度地反映出平面散点图内样本之间的关系信息。

排序又分两种:非限制性排序和限制性排序。

1、非限制性排序(unconstrainedordination)

——只使用物种组成数据的排序

(1)主成分分析(principalcomponentsanalysis,PCA)

(2)对应分析(correspondenceanalysis,CA)

(3)去趋势对应分析(Detrendedcorrespondenceanalysis,DCA)

(4)主坐标分析(principalcoordinateanalysis,PCoA)

(5)非度量多维尺度分析(non-metricmulti-dimensionalscaling,NMDS)

2、限制性排序(constrainedordination)

——同时使用物种和环境因子组成数据的排序

(1)冗余分析(redundancyanalysis,RDA)

(2)典范对应分析(canonicalcorrespondenceanalysis,CCA)

比较PCA和PCoA

在非限制性排序中,16S和宏基因组数据分析通常用到的是PCA分析和PCoA分析,两者的区别在于:

PCA分析是基于原始的物种组成矩阵所做的排序分析,而PCoA分析则是基于由物种组成计算得到的距离矩阵得出的。

在PCoA分析中,计算距离矩阵的方法有很多种,包括如:Euclidean,Bray-Curtis,andJaccard,以及(un)weightedUnifrac(利用各样品序列间的进化信息来计算样品间距离,其中weighted考虑物种的丰度,unweighted没有对物种丰度进行加权处理)。

组间菌群比较选取物种标志物

(属水平)样本-物种丰度关联circos弦装图

样本与物种的共线性关系circus图是一种描述样本与物种之间对应关系的可视化圈图,该图不仅反映了每个样本的优势物种组成比例,同时也反映了各优势物种在不同样本之间的分布比例。

图解读:样本与物种的共线性关系图,左半边表示样本属物种丰度情况。右半边表示属水平在不同样本中的分布比例情况。在最内一圈:左边不同颜色代表不同物种,宽度表示物种丰度,圈外数值表示物种丰度刻度值。一端连接右边的样本,不同颜色代表不同样本,条带端点宽度表示该样本中对应物种的比例分布。最外两圈:左边不同颜色表示不同样本在某一物种的比例,右边不同颜色表示不同物种在某一样本中的比例。

Ternary三元相图

三元相图是重心图的一种,它有三个变量,在一个等边三角形坐标系中,图中某一点的位置代表三个变量间的比例关系。这里表示三组样本之间优势物种的差异,通过三元图可以展示出不同物种在分组中的比重关系。

图解读:三角分别代表三个或三组样本,图中的圆分别代表排名最高哦的属水平的物种,三种颜色分别代表三组不同分组的优势物种,圆圈大小代表物种的相对丰度,圆圈理哪个顶点接近,表示此物种在这个分组中的含量较高。该分析仅限三个样本或三组样本之间分析比较。

LDA差异贡献分析

如果说PCA,它所作的只是将整组数据整体映射到最方便表示这组数据的坐标轴上,映射时没有利用任何数据内部的分类信息,是无监督的。

那么LDA是有监督的,增加了种属之间的信息关系后,结合显著性差异标准测试(克鲁斯卡尔-沃利斯检验和两两Wilcoxon测试)和线性判别分析的方法进行特征选择。

两者相同点:

都可以对数据进行降维。

降维时都采用了矩阵特征分解的思想。

差异:

1)LDA是有监督学习的降维方法,而PCA是无监督的降维方法。(注:监督学习是从标记的训练数据来推断一个功能的机器学习任务。)

2)LDA选择分类性能最好的投影方向,而PCA选择样本点投影具有最大方差的方向。

不同颜色代表不同样本或组之间的显著差异物种。

使用LefSe软件分析获得,其中显著差异的logarithmicLDAscore设为2。

LDA分析究竟能做什么

组间差异显著物种又可以称作生物标记物(biomarkers),这个LDA分析主要是想找到组间在丰度上有显著差异的物种。

物种进化树的样本群落分布图

这是另一款和LDA长得有点像的图,当然功能可完全不一样。它是将不同样本的群落构成及分布以物种分类树的形式在一个环图中展示。数据经过分析后,将物种分类树和分类丰度信息通过这款软件GraPhlAn进行绘制

其目的是将物种之间的进化关系以及不同样本的物种分布丰度和最高分布样本的信息在一个视觉集中的环图中一次展示,其提供的信息量较其他图最为丰富。

中间为物种进化分类树

不同颜色的分支代表不同的纲(具体的代表颜色见右上角的图例),

接着的外圈的灰色标示字母的环表示的是本次研究中比例最高的15个科(字母代表的科参见左上角的图例)。

之后的外圈提供的是热力图,如果样本数<=10个则绘制样本,如果样本数超过10个则按照分组绘制,每一环为一个样本,根据其丰度绘制的热力图。

最外圈为柱状图,绘制的是该属所占比例最高的样本的丰度和样本颜色(样本颜色见环最下方的样本名字的颜色)。其中热力图和柱状图取值均为原比例值x10000后进行log2转换后的值。

怎么画的?

网络图采用两种不同的形式表现出来。

○图中每一个点代表一个物种

○点的大小表示与其他物种的关联关系的多少

研究背景:气候变化导致美国中部草原的降水模式发生变化,对土壤微生物群落构成及代谢影响很大。

研究希望明确土壤微生物群落对土壤水分变化的反应,并确定响应的特定代谢特征。

同一样本在不同水分含量孵化处理下土壤菌群的变化

受到水分条件影响的土壤菌群代谢途径和网络分布

研究结论:土壤干燥导致土壤微生物组的组成和功能发生显着变化。相反,润湿后几乎没有变化。由于干旱导致的土壤水分减少对土壤碳循环和土壤微生物组进行的其他关键生物地球化学循环的影响很大。导致渗透保护剂化合物产生的代谢途径受到较大影响。

点评:

相对简单的样本和实验设计,但是从多个维度探寻支持土壤微生物群落对湿润和干燥表型的反应。

与常见的环境采样检测不同,针对同一样本在对照环境下进行环境控制孵化,然后比较菌群变化可以更为有效的控制背景差异。

聚类分析

根据OTU数据进行标准化处理(1wlog10)之后,选取数目最多的前60个物种,基于Rheatmap进行作图

○热图中的每一个色块代表一个样品的一个属的丰度

○样品横向排列,属纵向排列

○差异是是否对样品进行聚类,从聚类中可以了解样品之间的相似性以及属水平上的群落构成相似性。

Tips:

如果聚类结果中出现大面积的白或黑是因为大量的菌含量非常低,导致都没有数值,可以在绘制之前进行标准化操作,对每一类菌单独自身进行Z标准化。

研究背景:妊娠期糖尿病(GDM)的患病率在全球范围内迅速增加,构成一个重要的健康问题和产科实践的重大挑战(Ferrara,2007)。高脂血症是妊娠常见的合并症。在GDM患者中,血脂的生理变化可能导致怀孕期间潜在的代谢紊乱。肠道失调在宿主代谢异常中起着至关重要的作用,最近关于2型糖尿病(T2D)和肥胖的研究就证明了这一点。这些研究表明,妊娠期间肠道微生物ME的主要变化可能在GDM的发展中起着至关重要的作用。

研究结论:我们的结果表明,血脂水平可能反映了GDM发展过程中的一些异常变化。所鉴定的多种生物标志物对GDM合并高脂血症的防治有一定的参考价值。

组间物种差异性箱形图

组间物种差异性盒形图描述在不同分组之间具有差异显著的某一物种做盒形图,图中以属水平为例做物种差异性盒形图,展示如下:

○图中不同颜色代表不同的分组,更直观显示组间物种差异

○每一个盒形图代表一个物种,图上方是物种名。

Anosim检验

Anosim分析是一种非参数检验,用来检验组间的差异是否显著大于组内差异,从而判断分组是否有意义

展示如下:

R-value介于(-1,1)之间,R-value大于0,说明组间差异显著。

R-value小于0,说明组内差异大于组间差异。

对Anosim的分析结果,基于两两样本之间的距离值排序获得的秩(组间的为between,组内的为within),这样任一两两组的比较可以获得三个分类的数据,并进行箱线图的展示(若两个箱的凹槽互不重叠,则表明它们的中位数有显著差异)

随机森林分类树属分类效果

随机森林是机器学习算法的一种,它可以被看作是一个包含多个决策树的分类器。

其输出的分类结果是由每棵决策树“投票”的结果。由于每棵树在构建过程中都采用了随机变量和随机抽样的方法,因此随机森林的分类结果具有较高的准确度,并且不需要“减枝”来减少过拟合现象。

随机森林可以有效的对分组样品进行分类和预测。

物种重要性点图。横坐标为重要性水平,纵坐标为按照重要性排序后的物种名称。上图反映了分类器中对分类效果起主要作用的菌属,按作用从大到小排列。

Errorrate:表示使用下方的特征进行随机森林方法预测分类的错误率,越高表示基于菌属特征分类准确度不高,可能分组之间菌属特征不明显。图中以所有水平为例,取前60个作图。

ROC曲线图

ROC曲线指受试者工作特征曲线(receiveroperatingcharacteristiccurve),是反映敏感性和特异性连续变量的综合指标,通过构图法揭示敏感性和特异性的相互关系。

ROC曲线将连续变量设定出多个不同的临界值,从而计算出一系列敏感性和特异性,再以敏感性为纵坐标、(1-特异性)为横坐标绘制成曲线。

曲线下面积越大,诊断准确性越高。展示如下:

FAPROTAX生态功能预测

FAPROTAX对环境样本更友好

如果说PICRUSt(后续会介绍)在肠道微生物研究更为适合,那么FAPROTAX尤其适用于生态环境研究,特别是地球化学物质循环分析。

FAPROTAX适用于对环境样本(如海洋、湖泊等)的生物地球化学循环过程(特别是碳、氢、氮、磷、硫等元素循环)进行功能注释预测。因其基于已发表验证的可培养菌文献,其预测准确度可能较好,但相比于上述PICRUSt和Tax4Fun来说预测的覆盖度可能会降低。

基于BugBase的表型分类比较

GramNegative革兰氏阴性菌

Picrust群落功能差异分析

通过对已有测序微生物基因组的基因功能的构成进行分析后,我们可以通过16s测序获得的物种构成推测样本中的功能基因的构成,从而分析不同样本和分组之间在功能上的差异(PICRUStNatureBiotechnology,1-10.82013)。

Picrust对肠道菌群样本更友好

通过对宏基因组测序数据功能分析和对应16s预测功能分析结果的比较发现,此方法的准确性在84%-95%,对肠道微生物菌群和土壤菌群的功能分析接近95%,能非常好的反映样品中的功能基因构成。

怎么做出来的?

为了能够通过16s测序数据来准确的预测出功能构成,首先需要对原始16s测序数据的种属数量进行标准化,因为不同的种属菌包含的16s拷贝数不相同。

然后将16s的种属构成信息通过构建好的已测序基因组的种属功能基因构成表映射获得预测的功能结果。(根据属这个水平,对不同样本间的物种丰度进行显著性差异两两检验,我们这里的检验方法使用STAMP中的two-sample中T-TEST方法,Pvalue值过滤为0.05,作Extenterrorbar图。)

此处提供COG,KO基因预测以及KEGG代谢途径预测。当然,跃跃欲试的小伙伴也可自行使用我们提供的文件和软件(STAMP)对不同层级以及不同分组之间进行统计分析和制图,以及选择不同的统计方法和显著性水平。

这里提到的STAMP有些小伙伴说不太了解,别急,后面会有更多介绍。

COG构成差异分析图

图中不同颜色代表不同的分组,列出了COG构成在组间存在显著差异的功能分类以及在各组的比例,此外右侧还给出了差异的比例和置信区间以及P-value。

KEGG代谢途径差异分析图

通过KEGG代谢途径的预测差异分析,我们可以了解到不同分组的样品之间在微生物群落的功能基因在代谢途径上的差异,以及变化的高低。为我们了解群落样本的环境适应变化的代谢过程提供一种简便快捷的方法。

本例图所显示的是第三层级的KEGG代谢途径的差异分析,也可以针对第二或第一层的分级进行分析。

图中不同颜色代表不同的分组,列出了在第三层级的构成在组间存在显著差异的KEGG代谢途径第三层分类以及在各组的比例,此外右侧还给出了差异的比例和置信区间以及P-value。

研究背景:尽管普遍认为肠道微生物组的生态多样性和分类组成在肥胖和T2D中发生改变,但与单个微生物或微生物产物的关联在研究之间不一致。缺乏大样本群体研究,从而确定肠道微生物组,血浆代谢组,肥胖和糖尿病表型以及环境因素之间的几种关联。

主要图表:

按照肥胖和糖尿病对人群分为三组,同时进行了16S,代谢和宏基因组的检测。

相对大人群的队列研究,同时涵盖了菌群、代谢和疾病表型以及膳食补充调查的数据。

从结果看菌属和血浆代谢存在关联,但是贡献度都较低,如果样本数量不足很可能找不到显著的联系,这也是这类大样本队列研究的意义。

本研究在人群分组时针对性的研究了肥胖-II型糖尿病和菌群的关联,因而构建了三个主要分组人群,结果显示肥胖与菌群的关联度更大,解释了大部分的菌群差异,而糖尿病的菌群变化较小。

本研究其中较为重要的是发现了不同膳食补充对菌群的影响,并在小鼠实验中得到证实。

基因的差异分析图

除了能对大的基因功能分类和代谢途径进行预测外,我们还能提供精细的功能基因的数量和构成的预测,以及进行样本间以及组间的差异分析,并给出具有统计意义和置信区间的分析结果。

这一分析将我们对于样本群落的差异进一步深入到了每一类基因的层面。

图中不同颜色代表不同的分组,列出了在组间/样本间存在显著差异的每一个功能基因(酶)以及在各组的比例,此外右侧还给出了差异的比例和置信区间以及P-value。

很多小伙伴总希望能亲自上手做点分析,机会来了!

在获得标准报告后如果希望单独修改分组或对某些组之间进行显著性差异分析,可以使用STAMP软件在自己的电脑上进行数据分析。STAMP提供了丰富的统计检验方法和图形化结果的输出。

在使用STAMP之前需要首先准备需要的spf格式文件和样品分组信息表,但是如果数据不会处理,那也很不便。

而在我们的报告中已经将KEGG和KO以及COG的结果文件后经过转换生成了适用于STAMP软件打开的spf格式文件,还有对应的分组信息表文件groupfile.txt。

STAMP可以直接使用来自QIIME的biom文件和PICUST的KEGG和ko文件,groupfile.txt文件的格式为tab-saperatedvalue(tab键隔开的数据)

2、分组问题?

导入数据之后,viewàgrouplegend,在窗口右侧会出现分组栏,根据需要进行分组。

3、Unclassiffied选项中,remainUnclassiffiedreads、removeUnclassiffiedreads、和useonlyforcalculatingfrequencyprofiles方法的区别?

remainUnclassiffiedreads和useonlyforcalculatingfrequencyprofiles方法会保留所有的数据,而removeUnclassiffiedreads仅仅保留有确定分组信息的数据。

4、Statisticaltest中,Welch’st-test、t-test、white’snon-parametrict-test的区别,各自优缺点?

为了确保统计学意义和准确度和精确性,需要足够多的样本数目,t-test检验可以在最少样本数为4的时候确保高的准确度和精确性。

当两个样本之间具有相同方差的时候,用t-test更为准确,当两个样本没有相同方差,Welch’st-test更为准确。

5、Two-group中type:oneside和twoside的区别?

Oneside只会显示前一个group与后一个group差异的比例,而twoside两者之间的比例均会显示。

6、STAMP在使用时首先打开了一个分析文件,如果新打开一个可能会导致显示错误?

目前版本的STAMP存在一些小问题,一次分析只能使用一个数据文件,如果要打开新的需要关闭软件后再打开。

详细的STAMP使用教程可以参考我们提供的STAMP使用教程。

环境因子分析

冗余分析(redundancyanalysis,RDA)或者

典范对应分析(canonicalcorrespondenceanalysis,CCA)都是基于对应分析发展的一种排序方法,将对应分析与多元回归分析相结合,每一步计算均与环境因子进行回归,又称多元直接梯度分析。主要用来反映菌群与环境因子之间的关系。

RDA是基于线性模型,CCA是基于单峰模型。分析可以检测环境因子、样品、菌群三者之间的关系或者两两之间的关系。

○冗余分析可以基于所有样品的OTU作图,也可以基于样品中优势物种作图;

○箭头射线:箭头分别代表不同的环境因子;

○环境因子数量要少于样本数量,同时在分析时,需要提供环境因子的数据,比如pH值,测定的温度值等。

21.贡献图

我们通过计算每个变量正常计数中值,进一步确定每个被选择的OTU的特征。如果某一变量的中位数数高于任何其他变量,则OTU被定义为对变量有贡献。其中每个OTU条长度对应于多元模型中特征的重要性(对于每个组件上的特定特征,具有正号或负号的多元回归系数)通过从底部开始降低重要性进行排序,并且颜色与贡献变量相匹配。贡献图可以显示任意指定级别的细菌分类。

图解读:加载在comp1组件和comp2组件上贡献最大的OTU图。颜色代表不同分组。条形图越长说明对应OTU在此分组中贡献最大。

25.spls(稀疏偏最小二乘)回归分析

sPLS回归允许整合微生物群落数据矩阵和临床变量矩阵以进行多元回归。它可以处理数据中的共线性和噪声,并且适合对多个响应变量进行建模。

图解读:

c图.分别在Component1和Component2上贡献最大的OTU的荷载图。长方形条状是根据它们所属的簇而着色的。各OTU的分类信息根据颜色着色(图例见b图)

答疑小课堂

Q1

原始数据形式以及数据如何上传?

原始fastq格式是一个文本格式用于存储生物序列(通常是核酸序列)和其测序对应的质量值。这些序列以及质量信息用ASCII字符标识。通常fastq文件中一个序列有4行信息:如

第一行:序列标识,以@开头。格式自由,允许添加描述信息,描述信息以空格分开。

第二行:序列信息,不允许出现空格或制表符。一般是明确的DNA或RNA字符,通常大写

第三行:用于将序列信息和质量值分隔开。以+开头,后边是描述信息或者不加。

第四行:质量值,每个字符与第二行的碱基一一对应,按照一定规则转换为碱基质量得分。进而反映该碱基的错误率,因此字符数必须和第二行保持一致。

Fasta格式

fasta是一种基于文本用于表示核苷酸序列或氨基酸序列的格式。在这种格式中碱基对或氨基酸用单个字母来编码,且允许在序列前添加序列名及注释。由两部分信息组成:如

第一行:序列标记,以>开头,接序列的标识符,序列标识符以空格结束,后接描述信息。为保证分析软件能区分每条序列,每个序列的标识必须具有唯一性。

第二行:序列信息,使用既定的核苷酸或氨基酸编码符号。

数据提交

原始数据(Rawdata),常见的是illumina机器产生的fastq文件,这一类文件需要向NCBI的SRA数据库进行提交,SRA是NCBI为了并行测序的高通量数据(massivelyparallelsequencing)提供的存储平台。完整提交SRA需要一些独立项目的分步提交,包括BioProject、BioSample、Experiment、Run等,每一部分用以描述数据的不同属性。

Q2

如何判断测序质量是否合格?

原始的Tags数据会经过质控、过滤、去嵌合体,最终得到有效数据(EffectiveTags)。所以在判断测序质量是否合格时应该从几个方面去判断。

打开文件01_sequence_statistic/sumOTUPerSample.txt

报告里所有的txt打开如果格式不对的话,可以用excel表打开。

其中tags为经质量过滤后能正确overlap包含正确barcode和高质量序列的数据。

Singleton为非完全相同的序列,只要有1个碱基的差异即为不同序列,该值的高低与OUT数量并无直接关系,OTU是以97%的相似度聚类,测序质量较低导致的碱基错误、PCR扩增过程中的碱基错误、菌种内部的多样性以及OTU数量均会影响该数量。

Chimeras为通过与RDP等标准数据库比对分析判断可能由于PCR过程错误扩增导致的嵌合体比例,chimeras%为百分比,一般低于1。

首先判断下机数据tags和有效数据cleantags的数据量是否满足测序要求,一般下机数据量达到3万条reads以上满足测序需要,谷禾16s样本的测序深度可以达到10万条reads左右。如果数据量不够则需要重新补测样本。通过观察嵌合体数chimras和嵌合体所占百分比chimeras%,可以反应出有效序列的转化率,嵌合体的比例越小序列的利用转化率就越高。

根据稀释曲线可以判断测序深度是否达到饱和,如图中曲线都逐渐趋于平缓,就证明样本的测序深度较好,测序深度基本覆盖能测到的该样本所有的物种,测序深度比较好。同时曲线趋于水平纵坐标的高低也能够反映各样本的微生物多样性情况,曲线越高,证明测到的物种种类越多,样本的微生物多样性就越高。

而从该图可以看出,个别样本的曲线未趋于平缓,证明该样本测序深度不够,测序深度未能很好的反映出该样本的完整菌群构成。如果测序数据量更大的的话会检测到更多物种。

Q3

如何了解分组内部的多个样本的重复性以及多样性情况?

观察分组内部多个样本的重复性如何可以从以下几个方面考虑。

首先在各分类水平的柱状图的菌属构成来看

从构成图来看,Flu组和ZW3.7组,组内样本重复性较好。Ctrl组中Ctrl.2明显区别于组内另外两个样本,可以去掉该样本。而ZW3.8组内样本间差异性较大。

比如人体肠道或小鼠肠道样本本身个体差异性较大,菌群结构组成复杂,即便通过不同疾病的分类的样本,但营养饮食、代谢以及环境的影响都会改变肠道菌群的构成,所以有可能组内样本间差异性会比较大。而经过单因素处理的样本组内差异会比较小。

所以在前期实验设计时,尽量选择同一批次相同处理的小鼠或其他样本,避免组内差异的影响。并且要预留好多余的样本,比如组内只有3个样本,如果去掉一个差异性较大的样本,一个分组内只有2个样本,会影响后续组间差异比较,组间差异性比较分析每组要至少要3个样本。

通过beta多样性分析PCA,PCoA,MNDS也可以大致观察组内样本重复性情况,左图组内样本重复性较好,右图组内样本间差异性较大,两组间的区割不是很明显。

在加圈图的beta多样性分析中,右下角有给出PC1和PC2的P值,小于0.05则差异显著。

Alpha多样性是针对单个样品中物种多样性的分析,包括chao1指数、ace指数,shannon指数以及simpson指数等。前面4个指数越大,最后一个指数越小,说明样品中的物种越丰富。

其中chao指数和ACE指数反映样品中群落的丰富度(speciesrichness),即简单指群落中物种的数量,而不考虑群落中每个物种的丰度情况。指数对应的稀释曲线还可以反映样品测序量是否足够。如果曲线趋于平缓或者达到平台期时也就可以认为测序深度已经基本覆盖到样品中所有的物种;反之,则表示样品中物种多样性较高,还存在较多未被测序检测到的物种。

而shannon指数以及simpson指数反映群落的多样性(speciesdiversity),受样品群落中物种丰富度(speciesrichness)和物种均匀度(speciesevenness)的影响。相同物种丰富度的情况下,群落中各物种具有越大的均匀度,则认为群落具有越大的多样性。

稀释曲线是利用已测得序列中已知的各种OTU的相对比例,来计算抽取n个(n小于测得Reads序列总数)Tags时各Alpha指数的期望值,然后根据一组n值(一般为一组小于总序列数的等差数列,本项目公差为500)与其相对应的Alpha指数的期望值绘制曲线。

Q4

不同的样本之间差异大吗?不同分组之间能否用菌群差异来区分?

观察不同分组间差异的大小可以观察随机森林分类效果图。

路径在07_diff_analysis/RF

图中以该分类水平下选取用于区分不同分组间的差异性起到关键性影响因素的物种作为标志物作图。标志物按重要性从大到小排列,图中随机森林值errorrate表示用随机森林方法预测分组之间的错误率,分值越高代表所选取的标志物准确度不高,并不能很好的用于区分各分组,分组差异不显著。分值越低证明分组效果比较好。

上图中的随机森林按照门和属以及代谢途径分别进行分析作图,各自都有单独文件,报告中仅给出了一个图,其他文件需要到目录中查看。可能存在门或属区分效果不佳,但是代谢途径区分效果较好。

随机森林筛选出来的物种是用于区分所有分组的重要标志。分值越高代表该物种用于区分所有组之间的重要性越大。

Q5

二代测序16s能用普通酶扩增吗?

16s测序主要为了鉴定菌种,通常在做鉴定的时候区分标准是97%,区分亚种和菌株的时候相似度更高。

普通TAQ酶的复制错误率较高,可能在扩增过程中引入错误,这些错配可能导致相似度下降从而分类错误。

一般我们不建议使用普通TAQ酶进行扩增,都选择高保真酶。

Q6

利用16srRNA鉴定细菌能确定到种上吗?

16srRNA长度为1.5k多,作为菌种鉴定一般选择相似度97%的标准,相似度超过97%一般定义为同一种菌。

如果是sanger测序获得16s全长的都可以鉴定到种,甚至能区分亚种。有些细菌并不只有1个16s序列,会包含有1-15拷贝的16s序列,所以单一的16s序列鉴定可能会出现偏差。

利用高通量如454或miseq测序一般由于读长的缘故,通常只有300-500多个碱基被测序,所以在物种鉴定上一般比较可靠的是能分类到属,部分能分类到种。

根据我们的经验,不同的样品会有大约10-50的菌能分类到种。利用新的分析方法,我们现在也可以利用16srRNA的群落多样性高通测序数据进行亚种级别的分析。主要是利用16s中共同变化的SNP位点进行分型。这样可以大大提高菌种的分类精度,尤其是在有些菌株之间表型差异巨大的时候。

Q7

听说光测16s就可能预测基因和功能,是真的吗?

16s序列能够区分菌的种属,但是并不包含这些菌的基因和代谢功能的信息。不过由于我们已经对大量的细菌基因组进行了测序,所以可以根据16s的菌种信息,利用这个菌属已经测序的细菌基因组的基因信息和代谢功能信息来估计每类基因的上限和下限。

所以答案是可以利用16s序列测序来预测菌群的功能基因分布和代谢途径分布情况。

目前主要使用的软件是PICRUSt和新发表的Tax4Fun。

从我们实际分析和实验结果来看,预测的准确性还是很高的,不过和样品有很大关系。像肠道菌群和土壤以及一些致病菌的测序较多,所以预测的准确度较高可以到85-90%以上。一些海洋的菌由于测序的菌较少,预测准确性要差一些。目前发表的文献基本都是用PICRUSt,新的软件还有待验证。

Q8

测16srRNA能分到亚种吗?不同菌株都有致病性差异光到种不解决问题啊!

16srRNA如果是使用sanger测序可以细分到亚种甚至有些可以精确区分菌株,但是要看菌种。

如果是高通量测序,目前的常见分析一般以97%为标准,大部分情况只能到属,少部分能区分到种。如果要进一步细分到亚种甚至更小的区分目前是有可能的,我们在使用oligotype一类的方法时可以将相同变化模式的SNP归类,并对原来的OTU进行进一步细分,理论上可以区分到菌株。

仅通过16s高通量测序恐怕不能完全解决菌株致病性差异这种问题,但是通过对常见OTU的进一步深入分析可以提供可能的解释或方向。如果明确了某一特定类型菌株的变化有关,可以采用比如毒力基因或菌株特异性标记等方法详细了解不同菌株的比例和差异。

可变区和测序选择

目前针对扩增子测序可选择的测序平台和方案很多,不同平台的读长和适用的测序区段以及优势各有不同。16s测序主要的测序区段包括V4、V3V4,V1V2,V6,此外还有全长等不同的区段选择,不同可变区或全长由于引物的不同以及不同种属相应区段内的变异多样性差异,对菌属的丰度评估会有一定的差异。

从长度来看,全长16S长度为1.5kb左右,单菌落的16S全长sanger一代测序仍然是菌种鉴定的主要手段,纳米孔和Pacbio的三代测序可以高通量的获得全长序列,对于希望更高分辨率的分析菌种的研究有一定优势。三代的测序准确度目前逐渐改进,直接测序准确度可以在90%以上,纠错后可以提高到97~99%以上,已足够提供高精度的分类。三代目前主要问题在于建库成本相对较高,通过使用barcode可以降低部分但仍然偏高,此外普遍测序深度相对于二代测序要低许多。目前最主要的可变区选择是V4区和V3V4区,V4区长度为256bp左右,加上两侧引物长度为290bp左右,使用双端2x250bp或2x150bp可以测通,此外如454、life、IlluminaHiseq4000的测序平台读长也可以主要涵盖该区段读长。例如采用IlluminaHiseq测序平台对该项目进行双端测序(Paired-end),测序得到了fastq格式的原始数据(样本对应一对序列S_1.fastq和S_2.fastq)。再配对拼接成单条序列。其引物通用性相对是所有可变区中最高的,大量的大规模菌群调查研究都采用V4区作为检测区域,包括人体菌群研究如:HMP,肠道菌群如美国肠道计划AGP,欧洲的FGFP等,以及全球土壤菌群调查,目前仍然是国际研究中使用最广泛和认可的检测区域。

Illumina的Miseq提供了长达2x300bp以及Hiseq2500和最近的NovoSeq提供有2x250bp的测序方案,为进一步利用读长,目前有相当一部分研究选择V3V4区,该区段长度在460bp左右,相较于V4度多出了V3区段约100bp左右的片段,在少部分菌属中可以增加一定分辨率。经过对比,V3V4区的检测结果和V4区在绝大部分菌属中的丰度一致,但由于引物不同,在少量菌属中丰度会有不同偏向,V3V4从OTU层面上并未发现较V4区有明显增加。引物的选择和提取、储存方法是影响菌群检测丰度构成的主要因素,不同研究之间的比较需要考虑到实验方案的一致,相同的方案可以直接比较。目前的高通量测序平台可以较低成本的进行大规模的测序,从测序深度角度,土壤菌群的多样性最高,一般需要5万条以上序列可以达到饱和,肠道样本在3万条以上,水体和尿液等1万条以上基本可以到达饱和。

同一批小鼠粪便样本v4(10万cleanreads)和v3v4(5万cleanreads)测序数据比较:

原始序列数据:

V4

V3V4

以上两表是对原始序列数据进行统计,表中可以看出有效序列tags、高质量序列clean_tags、otus数量V4区都远高于v3v4区。V4区测序获得下机数据在13万条左右,v4区测序获得的下机数据在5万条左右。

Alpha多样性指数比较:

以上两个表分别是对Alpha多样性指数计算的结果比较

Chao1指数和ACE指数是用来评估样本中所含OTU数目的指数,从Chao1指数和ACE指数可以看出,用v4测序获得的结果要明显大于v3v4的结果。这是因为v4测序通量更高,测序深度更好,每个样下机的测序数据可以到10万条以上,一般在13万条左右,所以经过序列比对获得的OTU数目更多,相比较用v3v4测序每个样下机的数据大约在4到5万条左右,经过序列比对获得的OTU相对少一点。

Shannon指数和Simpson指数是用来评估菌群的丰富度和均一度的。从Shannon指数和Simpson指数,用v4和v3v4测序指数相差不大,或v4比v3v4略高一点,证明两种测序之间菌群的丰富度多样性和均一度叫接近。

物种主要构成比较:

V3v4

属水平前10个物种构成:Lactobacillus、Adlercreutzia、Flexispira、Allobaculum、Desulfovibrio、Prevotella、Odoribater、Oscillospira、[Prevotella]、Bacteroides

属水平前10个物种构成:Lactobacillus、Akkermansia、Helicobacter、Allobaculum、Desulfovibrio、Adlercreutzia、Odoribacter、Bacteroides、Prevotella、[Prevotella]

从前10个物种构成来看,有8个是相同的,物种的主要构成基本一致,测序的稳定性较好。从种类来看,v3v4测到的属水平个数较多。

各分类水平鉴定到的物种种类比较:

以上两张表代表了每个样本在各分类水平上鉴定到的物种种类数。从整体上来看,分别用v4和v3v4测序得到的数据,在各分类水平上鉴定到的物种个数相对比较稳定和接近,(尤其在目水平和科水平上)用v3v4测序获得的物种数比v4相对较多一点,单相差不大,在属水平和种水平则不一定是这种规律,最终鉴定到的物种个数也跟该样本的测序质量有关。

在线系统沟通和下载报告非常方便

项目系统:检测方案将为每一位合作者建立项目系统,全程了解样品和项目情况,并可直接与相应人员沟通。

(16Slibrarypreparationandsequencing.16SrRNAgenelibrariestargetingtheV4regionofthe16SrRNAgenewerepreparedbyfirstnormalizingtemplateconcentrationsanddeterminingoptimalcyclenumberbywayofqPCR.Two25μLreactionsforeachsamplewereamplifiedwith0.5unitsofPhusionwith1XHighFidelitybuffer,200μMofeachdNTP,0.3μMof515F(5′-AATGATACGGCGACCACCGAGATCTACACTATGGTAATTGTGTGCCAGCMGCCGCGGTAA-3′)and806rcbc0(5′-CAAGCAGAAGACGGCATACGAGATTCCCTTGTCTCCAGTCAGTCAGCCGGACTACHVGGGTWTCTAAT-3′).

(Weprofiledstoolsamplesfrom616healthyindividualsfromtheFGFPcohortaswellas107patientswithIBDusingampliconsequencingtargetingtheV4variableregionofthe16SrRNAand18SrRNAgenes).

(GutcontentsandmucosalsampleswerecollectedandanalyzedformicrobialprofilesbysequencingtheV4regionofthe16SrRNAgene.MetabolomicprofilesofcecalcontentsandplasmawereanalyzedbyLC/GCmassspectrometry).

(Inthisstudy,C57BL/6Jmicewerefedlow-orhigh-saltdiets(0.25vs.3.15%NaCl)for8weeks,andthengutcontentsandfeceswerecollected.FecalmicrobiotawasidentifiedbysequencingtheV4regionof16SribosomalRNAgene).

(AGPsequencedtheV4regionof16SrRNAgene).

(Theassociationbetween25(OH)Dandfecalmicrobiota(16SrRNAsequencing,V4region)wastestedbymultiplelinearregression).

(Childfecalsampleswerecharacterizedby16SrRNAgeneampliconsequencingoftheV4region.WeusedDeblur,anovelsub-operationaltaxonomic-unit(sub-OTU)approachthatprovidesahigherresolutionthanOTU-basedanalyses).

(Weperformedamplicon-basedsequencingofthe16SrRNAgeneV4regionon550stoolsamples(onesampleperparticipant).

(For16Sampliconpyrosequencing,PCRamplificationwasperformedspanningtheV4regionusingtheprimers515F/806Rofthe16SrRNAgeneandsubsequentlysequencedusing2X250bppaired-endsequencing(IlluminaMiSeq).

(For16Sampliconpyrosequencing,PCRamplificationwasperformedspanningtheV4regionusingtheprimers515F/806Rofthe16SrRNAgeneandsubsequentlysequencedusing2×250bppaired-endsequencing(IlluminaMiSeq).

(Specifically,theV4regionofthe16SrRNAgene(515F-806R)wasPCR-amplifiedwithregion-specificprimersthatincludesequenceradaptersequencesusedintheIlluminaflowcell).

(Ampliconsgeneratedfromvariableregion4(V4)ofbacterial16SrRNAgenespresentinthese2455fecalsamplesweresequenced,andtheresultingreadswereassignedtooperationaltaxonomicunitswith≥97%nucleotidesequenceidentity(97%IDOTUs).

(CharacterizinghumanfecalmicrobialcommunitiesMethodsforV4-16SrRNAgenesequencinganddataanalysis,calculationofMAZscoresandfunctionalmicrobiomematurity,andquantificationofenteropathogenburdenbymeansofmultiplexquantitativepolymerasechainreaction(qPCR)aredescribedinthesupplementarymaterials).

(Inbrief,bacterialgenomicDNAwasextractedfromthetotalmassofthebiopsiedspecimensusingtheMoBIOPowerLyzerTissueandCellsDNAisolationkitandsterilespatulasfortissuetransfer.The16SrDNAV4regionwasamplifiedfromtheextractedDNAbyPCRandsequencedintheMiSeqplatform(Illumina)usingthe2×250bppaired-endprotocol,yieldingpair-endreadsthatoverlappedalmostcompletely).

Multi-omicsofthegutmicrobialecosystemininflammatoryboweldiseases.Nature.2019

emporaldevelopmentofthegutmicrobiomeinearlychildhoodfromtheTEDDYstudy.Nature.2019

(BacterialDNAwasextractedusingthePowerMagMicrobiomeDNAisolationkitfollowingthemanufacturer’sinstructions.TheV4regionofthe16SrRNAgenewasamplifiedbyPCRandsequencedontheMiSeqplatform(Illumina)usingthe2×250bppaired-endreadprotocol).

AcommunalcataloguerevealsEarth’smultiscalemicrobialdiversity.Nature.2018

(Wesurveyedbacterialandarchaealdiversityusingampliconsequencingofthe16SrRNAgene,acommontaxonomicmarkerforbacteriaandarchaea12thatremainsavaluabletoolformicrobialecologydespitetheintroductionofwhole-genomemethods(e.g.,metagenomics)thatcapturegene-levelfunctionaldiversity13.Weamplifiedthe16SrRNAgene(V4region)usingprimers14showntorecoversequencesfrommostbacterialtaxaandmanyarchaea).

Rootmicrobiotadrivedirectintegrationofphosphatestressandimmunity.Nature.2017.

(Forwildsoilexperiment16Ssequencing,weprocessedlibrariesaccordingtoCaporaso,etal.28.ThreesetsofindexprimerswereusedtoamplifytheV4(515F-806R)regionofthe16SrRNAgeneofeachsample.Ineachcase,thereverseprimerhadauniquemolecularbarcodeforeachsample).

THE END
1.8个数据库设计典型实例PowerBuilder进行信息系统开发的基本知识。下面将通过一个个实例来说明如何利用 PowerBuilder作为数据库前端开发工具,开发出具有使用价值的管理信息系统。 人事管理系统实例是本书的第一个例子。因此对于实例开发过程中所涉及到的一些知 识会有重点讲述。 随着计算机技术的飞速发展,计算机在企业管理中应用的普及,利用计算机...http://www.360doc.com/document/14/0214/20/15804455_352536542.shtml
1.一个简单数据库设计例子一个简单数据库设计例子 一个曾经做过的简单的管理系统中数据库设计的例子,包括设计表、ER图、建模、脚本. +++++++++++++++++++++++++++++++++++++++++++++++ 项目信息 Project Name:Book Manager System DB:MySQL5.5 DB Name:db_library Tables...https://blog.csdn.net/Jerry_1126/article/details/44337973
2.sqlserver架构设计mob649e8162842c的技术博客在开始设计之前,了解一些基本要素是非常重要的。这些要素包括: 表:数据存储的基本单元。 字段:表中的列,每个字段都有数据类型。 索引:用于提高查询性能。 关系:表与表之间的联系。 约束:用于限制数据的输入(如主键、外键、唯一约束等)。 三、设计一个简单的数据库 ...https://blog.51cto.com/u_16175492/12561233
3.AlphaFold3来了!全面预测蛋白质与所有生命分子相互作用及结构...(d) VMD:一个分子可视化程序,用于使用 3D 图形和内置脚本显示、动 态化和分析大型生物分子系统。 1.4 蛋白质设计的常用评估指标:NSR、RMSD、GDT、能量评分函数、可 溶性、与靶标之间的结合强度和特异性 3. 蛋白质数据库介绍 1.1 一级蛋白质序列数据库:UniProtKB ...https://cloud.tencent.com/developer/article/2437597
4.MySQL数据库实验实现简单数据库应用系统设计Mysql这篇文章主要介绍了MySQL数据库实验实现简单数据库应用系统设计,文章通过理解并能运用数据库设计的常见步骤来设计满足给定需求的概念模和关系数据模型展开详情,需要的朋友可以参考一下+ 目录 GPT4.0+Midjourney绘画+国内大模型 会员永久免费使用!【 如果你想靠AI翻身,你先需要一个靠谱的工具!】 观前提示:本篇内容为...https://www.jb51.net/article/252268.htm
5.蓝蓝高频面试之数据库系列第一期数据库基础20题前言[toc] 大家好,我是蓝蓝。数据库在国企,银行,研究所的面试过程中,是占比非常大的,也是及其可能被问的知识点,我将其分为四个部分,分为基础理论篇,事务篇,优化篇,大概一共100个题目,最后一部分是最高频的题目,大家加油哈,星球打卡时间为15天,完成打卡一定有https://m.nowcoder.com/discuss/353158849412669440
6.全国计算机二级考试哪个最简单全国计算机二级考试是全国计算机等级考试简称NCRE,是四个等级中的一个等级。包含语言程序设计,包括C、C++、Java、Visual Basic、WEB程序设计;数据库程序设计(包括VisualFoxPro、Access、MySql);MS office高级应用包括Word、EXCEL、PPT办公软件高级应用。计算机二级考试哪个最简单?下面百分网小编带大家一起来看看详细内容,希望...https://www.oh100.com/kaoshi/ncre2/tiku/482381.html
7.软件工程导论作业控制类:是用于对特定于一个或一些用例的控制行为建模的类。 实体类:是用来对必须存储的信息及关联行为建模的类。 5.6 按照设计模型的不同层次和功能,设计元素可以分哪些方面? 答:(1)体系结构元素;(2)构件级元素;(3)接口/界面元素:用户界面、构件接口、系统接口;(4)数据元素:数据库设计、数据结构设计;(5)部署...https://www.unjs.com/zuixinxiaoxi/ziliao/20170805000008_1416273.html
8.java毕业实习报告(精选11篇)在三个月里,所学知识的确有很多,java基础,数据库操作(oracle,mysql),SSH框架(hibernate,struts,spring),网页设计jsp技术等,总之学到了很多曾经陌生的技术。受益匪浅。 一、实习计划 7月10日:简单地了解公司的基本情况,进一步学习了java的基本知识。7月11日—7月13日:学习java相关的编程环境和运行环境的材料,准备...https://www.fwsir.com/Article/html/Article_20141119170516_283897.html
9.软件工程—精选习题集(含参考答案)总复习60道简答题因此,工程网络图是系统分析和系统设计的强有力的工具。19、动态联编答:动态联编指应用系统在运行过程中,当需要执行一个特定服务的时候,选择(或联编)实现该服务的适当算法的能力。20、系统流程图答:一个概括地描绘物理系统的传统工具,表达了数据在系统各部件之间流动的情况。https://www.jianshu.com/p/6875e17271d0
10.案例数据库设计9篇(全文)校企合作的此类实训项目中,进行数据库设计与实现所用知识、技术,基础来自于校内所学,但又远高于校内简单的数据库理论知识,是学生按软件工程流程做项目开发最重要的一个环节,数据库设计的好坏,直接影响后期软件开发和维护。 摘要:该文介绍了如何使用UML进行数据库设计。首先建立静态模型,然后根据映射策略将模型映射为数据...https://www.99xueshu.com/w/ikey3pf3ms57.html
11.什么是BI?企业数字化的规划和落地第三层,数据源层- 即BI的数据层,各个业务系统底层数据库的数据通过 ETL 的方式抽取到BI的数据仓库中完成 ETL 过程,建模分析等等,最终支撑到前端的可视化分析展现。 02、BI在企业IT信息化中的位置 这一点是所有企业如果规划要上BI项目的时候必须弄明白的:BI在IT信息化中到底处于一个什么样的位置?弄清楚定位是信息...https://maimai.cn/article/detail?fid=1778763808&efid=IIU4kC9omHSMNDd9brumRg
12.ASP.NETCore适用于.NET的开源Web框架.NET 是一个开发人员平台,由工具、编程语言、库组成,用于构建许多不同类型的应用程序。 ASP.NET Core 通过专门用于生成 web 应用的工具和库扩展了.NET 开发人员平台。 更深入发掘: 什么是 ASP.NET Core? 了解ASP.NET Core 通过我们的教程、视频课程和文档,了解 ASP.NET Core 提供的所有功能。 https://asp.net/
13.豆瓣967450 个成员 你来替我吃/用 27984 个成员 下班新生活计划 109315 个成员 再见爱人讨论组 2557 个成员 博士互助组---今天你毕业了吗 96234 个成员 法盲互助协会 149802 个成员 我又买鲜花啦 126005 个成员 人间情侣观察 203772 个成员 电影票房·资料库 49664...https://www.douban.com/
14.保障性理论基础在实施保障性分析的过程中,将收集的大量有关保障的数据与保障性分析记录(logistics support analysis record,LSAR),以一定的格式储存到电子计算机内,建立一个包括可靠性、维修性、测试性及各综合技术保障要素等信息在内的独立的保障性分析记录数据库,并在分析过程中不断地更新数据。该数据库用于装备综合技术保障和保障...https://mp.ofweek.com/im/a645693221836
15.积分商城数据库设计:构建一个完美的线上积分兑换平台(积分商城...随着互联网的发展,越来越多的企业开始在线上销售产品和服务。与此同时,也出现了越来越多的积分兑换平台,为消费者提供了更加便捷的积分兑换服务。然而,在构建一个完美的线上积分兑换平台的过程中,数据库设计是非常关键的。 本文将从以下三个方面来介绍积分商城数据库的设计: ...https://www.idc.net/help/150689/