感染性疾病的检测和预测的制作方法

本申请要求于2018年11月21日提交的题为“感染性疾病的检测和预测(detectionandpredictionofinfectiousdisease)”的美国临时申请第62/770,182号、于2018年11月21日提交的标题为“直接到文库的方法、系统和组合物(direct-to-librarymethods,systemsandcompositions)”的美国临时申请第62/770,181号以及于2019年5月17日提交的题为“片段长度分布和使用此类片段的方法(fragmentlengthdistributionsandmethodsofusingsuch)”的美国临时申请第62/849,618号的优先权和利益,所述美国临时申请的全部内容出于所有目的通过引用并入本文。

本发明涉及使用核酸文库中的片段长度分布来鉴定微生物、鉴定宿主-微生物生物学相互作用的类型、鉴定感染位点或定位位点、选择疗法或治疗、监测治疗、监测细胞毒性、检测移植排斥、监测免疫系统反应或活性、鉴定感染阶段、监测移植排斥,以及用于癌症诊断。

背景技术:

此外,无形阶段的感染通常在无症状或可能类似于多种其它疾病的非特异性症状的情况下存在。因此,此类感染通常诊断不出、误诊或症状性地治疗,从而允许微生物存留并且增加患者的感染将进展为侵入性疾病的风险。

用于诊断幽门螺杆菌疾病的当前金标准是执行用于文档化(通过活检)由于幽门螺杆菌入侵引起的特定病理改变,如炎症、萎缩和肠化生的上内窥镜检查结合对活检样品中的幽门螺杆菌的检测。dixon,m.f.等人,《幽门螺杆菌(helicobacter)》,1997.2增刊1:p.s17-24。然而,存在来自此程序的严重风险和潜在并发症,包含有时可能需要输血的流血、感染和gi道撕裂。

总体而言,遵从幽门螺杆菌感染的主要治疗的约75%患者在首次治疗之后,基于对活跃感染的阴性幽门螺杆菌诊断测定而被视为是治愈的,所述活跃感染先前在发起治疗之前是阳性的。如果在一线疗法完成之后,对活跃胃肠幽门螺杆菌感染的诊断测试仍为阳性,则存在抗生素耐药性的幽门螺杆菌的可能性,并且在获得阴性诊断测试结果之前将需要另外的治疗。

已经使用了包含ngs的各种方法来鉴定宿主中存在的微生物,但是这些方法中的大多数方法都集中于微生物读段的丰度,而不是被读取的分子的物理性质。例如,许多提取方案、文库生成方案和测序方案都包含被设计成去除短核酸片段长度的步骤或过程。通常还牺牲短核酸片段长度,以最小化提取、文库生成或扩增的不期望的或不完全的副产物,如引物二聚体或衔接子二聚体。微生物的游离核酸是靶核酸的由于其片段长度在约100bp以下而特别容易受到短核酸的偏差和耗竭的影响的实例。

用于在无形或潜伏阶段感染与鉴定潜在病原体之后的其它阶段的感染之间进行分区分的当前方法有时可能需要侵入性活检程序。非侵入性测试,如血清学可以检测暴露于微生物的标志物,但不能指示感染是活跃的或有进展为侵入性疾病的风险。因此,需要用于确定患者的器官是否已被感染并且区分哪些患者将停留在定殖阶段,以及哪些患者有发展继发性侵入性疾病的风险的精确非侵入性方法。本公开提供了用于检测受试者的感染并且确定感染是否处于定殖或侵入性疾病阶段的非侵入性方法、组合物和试剂盒。本公开还提供了用于确定在受试者体内的定位位点和/或受试者的感染阶段的非侵入性方法。

技术实现要素:

本申请的实施例提供了一种来自核酸文库的片段长度谱,其中通过无偏差方法、使得能够进行偏差校正的方法或具有可再现偏差的方法从样品中获得了用于制备所述核酸文库的核酸。在各个方面,所述核酸文库由初始样品生成,并且在制备所述核酸文库之前或在发起文库生成过程之前,不从初始样品中提取用于生成所述核酸文库的核酸。所述方法的各方面可以包括核酸测序,作为在核酸制备之后并且在确定靶核酸、多个靶核酸或核酸的子集在核酸文库内的片段长度谱之前的步骤。在实施例的各方面,片段长度谱包括一个或多个选自包括以下的组的特性:分布的形状、分段幅度、分段分数、峰形状、峰的数量、峰中的最大峰的位置、两个或更多个分段的片段计数比率、螺旋定相峰的高度、两个不同片段长度处的片段计数比率、两个不同片段长度范围内的片段计数的比率、分段内的片段的量、分段内的片段长度范围、两个或更多个分段的最大幅度的比率、以及读段的子集内的片段长度分布、分段内的斜率、峰宽度、分段内的计数衰减或增加的速率、峰的数量、分段内的计数衰减或增加的缩放比例。

提供了监测受试者体内的移植物状态的方法。所述监测移植物状态的方法包括以下步骤:从获得自所述受试者的样品生成来自核酸文库的基线片段长度谱;生成从获得自所述受试者的第二样品生成的核酸文库的第二片段长度谱;以及将所述第二片段长度谱与所述基线片段长度谱进行比较。如果所述第二片段长度谱与所述基线片段长度谱不同,则对所述受试者内部施用增加量的抗排斥疗法,其中在施用所述抗排斥疗法之后,具有移植物的受试者体内排斥的风险降低。如果所述第二片段长度谱与所述基线片段长度谱相似,则维持或减少抗排斥疗法,其中所述抗排斥疗法在所述受试者体内的副作用风险低于所述受试者接受增加量的所述抗排斥疗法的副作用风险。所述方法的各方面包括以下步骤:将来自获得自具有移植物的受试者的样品的核酸文库或整个文库中的靶核酸的片段长度谱进行比较,以及将所述谱与参考片段长度谱进行比较。

本发明涉及预测存在于宿主体内的生物(或多种生物)产生局部或全身性环境改变或侵入器官或解剖系统,对健康具有实质负面结果的风险的方法。如果生物穿过屏障或从一个器官或解剖结构易位到另一个,侵入超出其在定殖状态下占据的组织层的结构以产生局部侵入,则所述生物是侵入性的,其会改变结构的环境使得其对结构产生显著负面影响或导致dna突变或发炎,或者其另外压垮宿主的免疫系统。

在某些实施例中,风险水平基于宿主体内的生物相比于无症状对照或感染对照的丰度。在其它实施例中,丰度是阈值或范围。在又其它实施例中,基于以下中的一个或多个将风险水平计算为临床决策评分:生物的丰度、患者的临床历史、疾病的慢性化、基因生物标志物因素和患者特性(如年龄、性别等)、片段长度分布谱以及片段长度分布谱特性。

在一方面,提供了一种确定疑似患有微生物感染的受试者的感染阶段的方法,所述方法包括:

(a)对来自所述生物样品的核酸执行高通量测序;

(b)执行生物信息学分析以鉴定存在于所述生物样品中的微生物核酸序列;以及

(c)计算所述核酸的测量结果并且将所述测量结果与对照进行比较,由此确定在所述生物样品中鉴定的任何微生物的感染阶段。

在一些实施例中,所述方法进一步包括选自由以下组成的组的一个或多个步骤:(a)从获得自所述受试者的生物样品的一部分提取核酸,以及(b)添加合成核酸加标物(spike-in)。

在一个实施例中,步骤(c)的测量结果选自游离微生物核酸序列的绝对丰度、核酸序列的片段长度的分布、核酸片段长度分布谱的特性或其组合。在另一个实施例中,步骤(c)的测量即如果是靶病原体的绝对丰度和片段长度的分布。

在第二实施例中,所述受试者具有感染症状或有感染风险。

在第五实施例中,所述方法进一步包括基于确定的感染阶段向所述受试者施用治疗方案。

在第六实施例中,高通量测序测定是下一代测序、大规模平行测序、焦磷酸测序、逐次合成测序、单分子实时测序、聚合酶克隆测序、dna纳米球测序、直升机单分子测序、纳米孔测序、桑格测序(sangersequencing)、鸟枪测序或gilbert测序。

在第七实施例中,所述样品是血液、血浆、血清、脑脊液、滑液、支气管-肺泡灌洗液、痰、尿液、粪便、唾液或鼻样品。

在第八实施例中,方法进一步包括鉴定靶病原体的一个或多个抗生素耐药性基因。

在第九实施例中,方法进一步包括鉴定受试者的基因组dna中的至少一种风险因素。

在第十实施例中,核酸是游离dna和/或游离rna。核酸可以包括游离病原体dna。核酸可以包括游离病原体rna。核酸可以包括游离微生物dna。核酸可以包括游离微生物rna。

在第十一实施例中,靶病原体是幽门螺杆菌、艰难梭菌、流感嗜血杆菌(haemophilusinfluenza)、沙门氏菌(salmonella)、肺炎链球菌(streptococcuspneumoniae)、巨细胞病毒(cytomegalovirus)、肝炎病毒b、肝炎病毒c、人乳头瘤病毒、爱泼斯坦-巴尔二氏病毒、人t细胞淋巴瘤病毒1、梅克尔细胞多瘤病毒(merkelcellpolyomavirus)、卡波氏肉瘤病毒(kaposi'ssarcomavirus)、人疱疹病毒(humanherpesvirus)8、衣原体病毒(chlamydia)、淋病(gonorrhea)、梅毒(syphilis)或毛滴虫病。

在第十二实施例中,受试者先前进行了另一测试或其它临床测试。在一个实施例中,其它临床测试是粪便抗原测试、尿素呼吸测试、血清学、脲酶测试、组织学、细菌培养和敏感性测试、活检或内窥镜检查。

在第十三实施例中,靶病原体核酸是dna和/或rna。病原体核酸包括游离dna。核酸包括病原体游离rna。

在第十四实施例中,合成核酸加标物包括样品的至少1000个独特合成核酸,其中所述1000个独特合成核酸中的每一个包括(i)识别标签;以及(ii)包含至少5个退化碱基的可变区。在另外的实施例中,所述方法进一步包括

(a)任选地从所述加标的样品中提取核酸;

(b)生成加标的样品文库;

(c)任选地富集所述加标的样品文库;

(d)执行高通量测序测定,以从所述加标的样品文库获得序列读段;

(e)计算1,000个独特合成核酸的多样性损失值;以及

(f)计算所述核酸的测量结果并且将所述测量结果与对照进行比较,由此确定所述受试者的感染阶段。

在又另外的实施例中,所述至少1,000个独特合成核酸是如u.s.9,976,181中所述的合成核酸。

在另一方面,存在一种确定受试者的幽门螺杆菌的感染阶段的方法,所述方法包括:

a)任选地,从获得自所述受试者的生物样品中提取游离核酸;

b)向所述样品中添加合成核酸加标物;

c)对来自所述生物样品的核酸执行高通量测序;

d)执行生物信息学分析以鉴定存在于所述生物样品中的幽门螺杆菌核酸序列;以及

e)计算所述幽门螺杆菌核酸的测量结果并且将所述测量结果与对照进行比较,由此确定所述受试者的幽门螺杆菌的感染阶段。

在第一实施例中,所述测量结果是幽门螺杆菌的绝对丰度或片段长度的分布或其组合。

在一个实施例中,所述测量结果是幽门螺杆菌的绝对丰度。在另一实施例中,所述测量结果是幽门螺杆菌的片段长度的分布。在又另一实施例中,所述测量结果是幽门螺杆菌的绝对丰度和片段长度的分布。在各个实施例中,所述方法的步骤可以以变化的顺序执行。

在第二实施例中,所述受试者具有幽门螺杆菌感染的症状或有幽门螺杆菌感染的风险。

在一个实施例中,感染阶段是无形期、有症状感染期、治疗期或根除阶段。

在一个方面,存在一种确定受试者的幽门螺杆菌的感染阶段的方法,所述方法包括:

(a)通过从受试者获得包括游离核酸的样品并且添加一种或多种过程控制分子来制成加标的样品;

(b)任选地,从所述加标的样品中提取所述核酸;

(c)生成加标的样品文库,其中所述生成包括(i)将衔接子与核酸连接;以及(ii)扩增;

(d)任选地,富集所述加标的样品文库;

(e)执行高通量测序测定,以从所述加标的样品文库获得序列读段;

(f)计算1,000个独特合成核酸的多样性损失值;以及

(g)计算所述游离核酸的测量结果并且将所述测量结果与对照进行比较,由此确定所述受试者的幽门螺杆菌的感染阶段。

在第二实施例中,高通量测序测定是下一代测序、大规模平行测序、焦磷酸测序、逐次合成测序、单分子实时测序、聚合酶克隆测序、dna纳米球测序、直升机单分子测序、纳米孔测序、桑格测序、鸟枪测序或gilbert测序。

在第三实施例中,样品是血液、血浆、血清、脑脊液、滑液、支气管-肺泡灌洗液、尿液、粪便、唾液或鼻样品。

在第四实施例中,方法进一步包括向所述受试者施用治疗方案,其中所述治疗可以在感染周期的任何阶段施用。

在第五实施例中,方法进一步包括鉴定靶病原体的一个或多个抗生素耐药性基因。

在第六实施例中,游离核酸是dna和/或rna。核酸包括游离病原体dna。核酸包括游离病原体rna。

在第十二实施例中,受试者先前进行了另一种其它临床测试。在一个实施例中,其它临床测试是粪便抗原测试、尿素呼吸测试、血清学、脲酶测试、组织学、细菌培养和敏感性测试、活检或内窥镜检查。

在第八实施例中,靶病原体核酸是dna和/或rna。病原体核酸包括游离dna。核酸包括病原体游离rna。靶病原体核酸包括游离dna和游离rna的混合物。

另一方面提供了一种确定被病原体感染的受试者体内的定位位点的方法,所述方法包括:

(a)获得来自受试者的包括核酸的样品,以及添加一种或多种过程控制分子,从而生成加标的样品;

(c)从所述加标的样品生成文库,其中生成包括将衔接子与核酸连接并且扩增;

(d)任选地,富集所述加标的样品;

(e)通过比较参考基因组来执行高通量测序测定,以从所述加标的样品获得序列读段;

(f)任选地,计算多样性损失值;以及

(g)计算所述核酸的测量结果并且将所述测量结果与对照进行比较,由此确定所述受试者的定位位点。

在第一实施例中,所述测量结果是靶病原体的绝对丰度或片段长度的分布或其组合。在一个实施例中,所述测量结果是靶病原体的绝对丰度。在另一实施例中,所述测量结果是靶病原体的片段长度的分布。在又另一实施例中,所述测量结果是靶病原体的绝对丰度和片段长度的分布。

在第二实施例中,所述定位位点是组织。在另外的实施例中,所述定位位点是组织类型。在又另外的实施例中,所述定位位点是器官。在另一另外的实施例中,所述定位位点是包括器官的组织类型。

在第三实施例中,所述受试者具有感染的症状或有感染的风险。在另外的实施例中,所述受试者先前被鉴定为感染了幽门螺杆菌、艰难梭菌、流感嗜血杆菌、沙门氏菌、肺炎链球菌、巨细胞病毒、肝炎病毒b、肝炎病毒c、人乳头瘤病毒、爱泼斯坦-巴尔二氏病毒、人t细胞淋巴瘤病毒1、梅克尔细胞多瘤病毒、卡波氏肉瘤病毒、人疱疹病毒8、衣原体病毒、单纯疱疹病毒、奈瑟氏菌属、密螺旋体属或毛滴虫属。

在第六实施例中,所述至少1,000个独特合成核酸是如u.s.9,976,181中所述的合成核酸。

在第七实施例中,高通量测序测定是下一代测序、大规模平行测序、焦磷酸测序、逐次合成测序、单分子实时测序、聚合酶克隆测序、dna纳米球测序、直升机单分子测序、纳米孔测序、桑格测序、鸟枪测序或gilbert测序。

在第八实施例中,样品是血液、血浆、血清、脑脊液、滑液、支气管-肺泡灌洗液、尿液、粪便、唾液、鼻或组织样品。

在第九实施例中,方法进一步包括鉴定病原体的一个或多个抗生素耐药性基因。

在第十实施例中,方法进一步包括鉴定受试者的基因组dna中的风险因素。

在第十一实施例中,靶病原体核酸是dna和/或rna。病原体核酸包括游离dna。核酸包括病原体游离rna。靶病原体核酸包括游离dna和游离rna的混合物。

在第十二实施例中,游离核酸是dna和/或rna。核酸包括游离病原体dna。核酸包括游离rna。核酸包括游离病原体rna。核酸包括游离受试者rna。核酸包括病原体和受试者游离rna。

(a)提供来自所述受试者的包括核酸的样品;

(b)向所述样品中添加至少1000个独特合成核酸,从而生成加标的样品;

(c)从所述加标的样品生成文库;

(d)执行高通量测序测定,以从所述加标的样品获得序列读段;

(e)基于所述序列读段确定所述受试者的所述感染阶段。

在一个实施例中,所述样品选自血液、血浆、血清、脑髓液、滑液、支气管-肺泡灌洗液、尿液、粪便、唾液、鼻和组织样品。所述样品是血液、血浆、血清、脑髓液或滑液。

在另外的实施例中,高通量测序测定是下一代测序、大规模平行测序、焦磷酸测序、逐次合成测序、单分子实时测序、聚合酶克隆测序、dna纳米球测序、直升机单分子测序、纳米孔测序、桑格测序、鸟枪测序或gilbert测序。

在另一另外的实施例中,感染阶段的确定基于靶病原体的绝对丰度或片段长度分布谱或其组合。在一个实施例中,所述确定基于靶病原体的绝对丰度。在另一实施例中,所述确定基于靶病原体的片段长度的分布。在又另一实施例中,所述确定基于靶病原体的绝对丰度和片段长度的分布。

在一个实施例中,本应用提供了一种确定受试者的幽门螺杆菌的感染阶段的方法,所述方法包括从获得自所述受试者的生物样品中提取核酸,向所述样品中添加合成核酸加标物,对来自所述生物样品的核酸执行高通量测序,执行生物信息学分析以鉴定存在于生物样品中的游离幽门螺杆菌核酸序列,以及计算所述游离幽门螺杆菌核酸的测量结果,以及将所述测量结果与对照进行比较,由此确定所述受试者的幽门螺杆菌的感染阶段。

在一个实施例中,本应用提供了一种确定受试者的幽门螺杆菌的感染阶段的方法,所述方法包括:通过从受试者获得包括游离核酸的样品并且添加一种或多种过程控制分子来制成加标的样品;从所述加标的样品中提取核酸;生成加标的样品文库,其中所述生成包括(i)将衔接子与核酸连接;以及(ii)扩增;任选地,富集所述加标的样品文库;执行高通量测序测定,以从所述加标的样品文库获得序列读段;计算1,000个独特合成核酸的多样性损失值;以及计算所述游离核酸的测量结果并且将所述测量结果与对照进行比较,由此确定所述受试者的幽门螺杆菌的感染阶段。

一个实施例提供了确定受病原体感染的受试者体内的定位位点的方法,所述方法包括从受试者获得包括核酸的样品,向初始样品中添加一种或多种过程控制分子以提供加标的样品,任选地从所述加标的样品中提取所述核酸,从所述加标的样品生成文库,其中生成包括将衔接子与所述核酸连接并且扩增;任选地,富集所述加标的样品,通过比较参考基因组来执行高通量测序测定,以从所述加标的样品获得序列读段;确定所述核酸文库的一个或多个片段长度特性,生成由所述样品生成的核酸文库的片段长度谱,将所述片段长度谱与一个或多个源位点的参考片段长度谱进行比较,以及如果来自所述样品的所述片段长度谱与来自第一源位点的片段长度谱相似,则将所述第一位点鉴定为定位位点;如果来自所述样品的所述片段长度谱与来自第二源位点的片段长度谱相似,则将所述第二位点鉴定为定位位点。

一方面提供了一种确定受病原体感染的受试者体内的定位位点的方法,所述方法包括从受试者获得包括游离核酸的样品,以及添加一种或多种过程控制分子,由此生成加标的样品;任选地从所述加标的样品中提取核酸;从所述加标的样品生成文库,其中生成包括将衔接子与所述核酸连接并且扩增;任选地,富集所述加标的样品;通过比较参考基因组来执行高通量测序测定,以从所述加标的样品获得测序读段;计算1000个独特合成核酸的多样性损失值;以及计算所述游离核酸的测量结果并且将所述测量结果与对照进行比较,由此确定所述受试者的定位位点。

通过引用并入

本说明书中所提到的所有出版物、专利和专利申请均通过引用以其整体在此并入,其程度就如同明确且单独地指明了每个单独出版物、专利或专利申请通过引用并入。

附图说明

本发明的新颖特征在所附权利要求书中具体地阐述。通过参考阐述了说明性实施例的以下详细说明,将获得对本发明的特征和优点的更好理解,在所述实施例中利用了本发明的原理,并且在其附图中:

图1描绘了本公开的方法。

图2描绘了本公开的无细胞方法。

图3示出了示例性感染的示意图。

图4描绘了本公开的感染位点检测方法之一。

图5描绘了用于确定多样性损失值的方法的基本方案。

图6示出了终止于针对幽门螺杆菌的阳性诊断的治疗的诊断性工作流。

图7描绘了被编程或另外被配置为实施本文提供的方法的计算机控制系统。

图9提供了涉及分布分段幅度和分段幅度比率的片段长度特性的实例。图描绘了来自三种不同临床样品的相同病原体(热带假丝酵母(candidatropicalis))的读段的片段长度的分布。在每个图中,y轴线上示出了归一化的读段数量,并且x轴线指示片段长度。出于此图的目的,将临床样品编号为1到3。与临床样品3中的热带假丝酵母相比,临床样品1和2中的热带假丝酵母示出了相对于50bp峰具有更高长分数(>65bp)的分布,而所有片段长度谱具有大约45-50bp的清晰峰。短读段(<40bp)相对于50bp峰的比率在三个样品之间也有所变化。分布分段振幅和分段幅度比率(<40bp到50bp峰和并且>65bp到50bp峰)反映了从一个实验获得的结果。

图10描绘了来自两种临床样品的wu多瘤病毒的片段长度分布。左图示出了单个峰为50个左右碱基对(bp)片段长度的分布。右图示出了包括指数分布形状贡献、峰和长分数贡献的组合模式。不受机制限制,短指数状分数可能表明通过与生成“50bp峰”内的片段的过程不同的过程而在人类基因组中掺入了病毒或使微生物核酸降解。

图11提供了涉及呈不同分布的片段计数比率的片段长度特性的实例。图描绘了“50bp峰”分数中的片段计数与短类指数分数(读段密度为40-55bp/读段密度为23-35bp,x轴线)相对于归一化计数(y轴线)的比率。添加了相同的人类和人类线粒体分数,以供参考。比率在王国类型之间变化。细菌读段的比率变化很大,而真菌读段的比率示出双峰模式。还示出了病毒读段的比率。

图12提供了母体(虚线)和胎儿(实线)游离核酸的片段长度分布的汇总。“50bp峰”在胎儿分布中显得较窄,这指示在来自胎儿核酸的峰内片段长度范围较小。另外,与核小体长度片段(例如150-200bp区)相比,“50bp峰”区中的胎儿与母体读段的比率更高。

图13提供了以病原体形式或以共生微生物形式存在的微生物的片段长度分布的汇总。在基于端部可修复双链dna的测定中,病原体的片段长度趋向于比共生微生物更长。

图14提供了病原体在从通过尿液或血液培养确认感染的样品生成的核酸文库中的片段长度分布的汇总。相比于在来自利用正交尿液培养物的样品的核酸文库中检测到的病原体,在来自利用正交血液培养测试的样品的核酸文库中检测到的病原体示出更高的长读率。读段长度在x轴线上示出;读段的分数在y轴线上示出。在图中示出了尿液培养物样品的平均值(浅实线)和血液培养样品的平均值(浅虚线),以及尿液与血液之间的差异(粗虚线)。

图17a示出了疑似感染了肺部的微生物的归一化片段长度分布,其中每个图示出了所指示物种的微生物的一个分布,并且样品id在每个图的顶部指示。频率被定义为与特定读段(片段)长度的所指示微生物的参考比对的读段计数,所述计数是由与所指示微生物的参考比对的读段的总计数归一化的。图17b示出了疑似感染了血流的微生物的归一化片段长度分布,其中每个图示出了所指示物种的微生物的一个分布,并且样品id在每个图的顶部指示。频率被定义为与特定读段(片段)长度的所指示微生物的参考比对的读段计数,所述计数是由与所指示微生物的参考比对的读段的总计数归一化的。

图22描绘了在对所感染受试者进行治疗期间人片段长度分布的三种主要应答模式。左图示出了其中在治疗期间长人分数(>60bp)降低的实例。中图示出了其中在治疗期间长人分数(>60bp)浮动的实例。右图示出了其中在治疗期间长人分数(>60bp)增加的实例。

图23提供了来自巴氏链球菌(pasteuranius)的样品的片段长度信息和gc含量的汇总。相对频率在y轴线上示出;gc含量在x轴线上示出。示出了少于45个碱基对、45-54个碱基对、55-64个碱基对、65-74个碱基对以及长于74个碱基对的片段长度范围。片段长度分布与gc含量信息的组合表明过程诱导此微生物的温度偏差。

具体实施方式

片段长度谱包括核酸文库或来自核酸文库内的读段的子集的一个或多个片段长度特性。片段长度谱可以包括1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个或更多个片段长度特性。可以向片段长度谱中的一个或多个片段长度特性分配加权值,使得一个或多个片段长度特性在片段长度谱内可以具有相等或不同的权重或值。片段长度特性包含但不限于分布的形状、分段幅度、峰形状、两个或更多个分段的片段计数比率、螺旋定相峰的高度、两个不同片段长度处的片段计数比率、两个不同片段长度范围内的片段计数的比率、分段内的片段长度范围、两个或更多个分段的最大幅度的比率、一个或多个峰的位置以及读段的子集内的片段长度分布。意图是“2个或更多个分段之间”的比率涵盖但不限于来自一个核酸文库的两个或更多个分段、来自两个或更多个核酸文库的两个或更多个分段、相同峰形状的两个或更多个分段、不同峰形状的两个或更多个分段、来自相似或不同核酸文库类型的两个或更多个分段以及来自出自核酸文库的读段的相似或不同子集的两个或更多个分段。

分布类型包含但不限于单个峰形状、多个峰形状、指数或类指数分布、长或短片段的膨胀的分布、平坦或均匀分布、复杂分布形状和其组合。复杂分布可以包含至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个或更多个峰形状的方面。单个峰形状可以存在于任何片段长度左右,包含但不限于50个左右碱基对片段长度。长片段可以包含以下片段长度:大于约60个碱基对、约65个碱基对、约70个碱基对、约75个碱基对、约80个碱基对、约85个碱基对、约90个碱基对、约95个碱基对、约100个碱基对、约150个碱基对、约175个碱基对、约200个碱基对、约250个碱基对、约300个碱基对、约350个碱基对和约400个碱基对。短片段可以包含以下片段长度:短于约500bp、约400bp、约300bp、约200bp、约100bp、约50bp、约40bp、约35bp、约30bp、约25bp、约20bp。峰形状的各方面包含但不限于分段范围、分段幅度和分段内的读段的总数、峰宽度、峰的斜率、峰的导数;峰形状的各方面可以变化。

单个峰形状分布可以涵盖一定范围的片段长度,包含但不限于在分段内至少约5个碱基对、至少约10个碱基对、至少约15个碱基对、至少约20个碱基对、至少约30个碱基对、至少约35个碱基对、至少约40个碱基对或大于至少约45个碱基对片段长度范围。分段内的片段长度范围可以变化。例如,50个左右碱基对单峰分布的片段长度的范围包含但不限于30个到60个碱基对、35个到60个碱基对、40个到60个碱基对以及45个到55个碱基对的片段长度。

在一些情况下,靶核酸可以仅构成整个样品的非常小的部分,例如样品中的总核酸的小于0.1%、小于0.01%、小于0.001%、小于0.0001%、小于0.00001%、小于0.000001%、小于0.0000001%。通常,原始样品中的总核酸可以变化。例如,总游离核酸(例如,dna、mrna、rna)可以在0.01-10,000ng/ml的范围内(例如,约0.01、0.1、1、5、10、20、30、40、50、80、100、1000、5000、10000ng/ml)。在一些情况下,样品中的游离核酸的总浓度在此范围之外(例如,小于0.01ng/ml;换言之,总浓度大于10,000ng/ml)。主要由人dna和/或rna构成的游离核酸(例如,dna)样品也是如此。在此类样品中,病原体靶标核酸的存在可以比人或宿主核酸少。

靶核酸的长度可以变化。在一些特定实施例中,靶核酸相对短;在其它实施例中,靶标相对长。在一些特定实施例中,靶核酸短于110bp。

如本文所用,“核酸”是指核苷酸的聚合物或寡聚物,并且通常与术语“多核苷酸”或“寡核苷酸”同义。核酸可以包括以下、由以下组成或基本上由以下组成:脱氧核糖核苷酸、核糖核苷酸、脱氧核糖核苷酸类似物、经化学修饰的典型脱氧核糖核苷酸、核糖核苷酸和/或核糖核苷酸类似物、具有经修饰的骨架的核酸或其任何组合。

也涵盖用提取由样品生成核酸文库的方法。

过程控制分子可以是一个或多个id加标物、spank、spark或gc加标物小组、去磷酸化控制分子、变性控制分子和/或连接控制分子中的一种或多种。参见例如发表的美国专利申请第2015-0133391号和发表的美国专利申请第2017-0016048号,所述美国专利申请中的每一个的完整公开内容出于所有目的通过引用以其整体并入本文。在一些实施例中,初始样品包括循环供体核酸、由循环供体核酸组成或基本上由循环供体核酸组成(参见例如us20150211070,其通过引用以其整体并入本文,包含任何附图)。

如本文所用,“变性”是指其中如蛋白质或核酸等生物分子失去其天然或更高阶结构的过程。天然和更高阶结构可以包含,例如但不限于,四级结构、三级结构或二级结构。例如,双链核酸分子可以变性为两个单链分子。

如本文所用,术语“去磷酸化(dephosphorylation)”或“去磷酸化(dephosphorylating)”是指从核酸,如dna中去除磷酸盐,如5'和/或3'端磷酸盐。

在一些实施例中,将3'端衔接子与核酸,例如经变性的或去磷酸化的核酸连接,和/或连接5'端衔接子包括与酶连接、由与酶连接组成或基本上由与酶连接组成,所述酶包括连接酶,例如t4dna连接酶、circligaseii,由连接酶组成或基本上由连接酶组成。在一些实施例中,连接酶是单链连接酶。在一些实施例中,将3'端衔接子与核酸,例如经变性的或去磷酸化的核酸连接,和/或连接5'端衔接子包括利用模板切换反应、由利用模板切换反应组成或基本上由利用模板切换反应组成。在一些实施例中,将3'端衔接子与核酸,例如经变性的或去磷酸化的核酸连接包括利用酶延伸、由利用酶扩展组成或基本上由利用酶延伸组成,所述酶包括聚合酶,例如tdt聚合酶,由聚合酶组成或基本上由聚合酶组成。在一些实施例中,方法进一步包括以下、由以下组成或基本上由以下组成:利用dna聚合酶,例如klenow片段、superscriptiv逆转录酶、smartmmlv逆转录酶等,以扩展与核酸或经衔接的核酸杂交的引物并且生成互补链。在一些实施例中,靶核酸可以与一个或多个衔接子连接。在一些实施例中,靶核酸在两个端部处与同一衔接子或不同衔接子连接。

如本文所用,“gc偏差”是指不同gc含量但具有相同长度的核酸的差别性能、处理或恢复。

如本文所用,“gc含量”或“鸟嘌呤-胞嘧啶含量”是指核酸,如dna或rna分子中的含氮碱基的百分比,所述含氮碱基为鸟嘌呤或胞嘧啶或其化学修饰。

如本文所用,“宿主”是指具有另一种生物的生物。后者被定义为“非宿主”生物。例如,人可以是具有微生物、病原体或胎儿的宿主,所述微生物、病原体或胎儿是非宿主。宿主核酸或材料衍生自宿主。非宿主核酸或材料可以衍生自非宿主生物、衍生自移植的材料或衍生自宿主体内的胎儿或胎儿材料。

多种宿主-微生物的生物学关系或相互作用是本领域已知的。宿主-微生物的生物学相互作用包含但不限于共生、互利共栖、偏害共栖、寄生、共栖和竞争。公认的是,当微生物位于宿主体内的某些位点时,其可能表现出与宿主的一种类型相互作用,但是当其位于另一位点时,则可能表现出与宿主的另一种类型的相互作用。例如,微生物可以与宿主在宿主的皮肤上以共生性关系存在,但是可以在宿主内部以寄生或竞争关系存在。如本文所用,“病原体”是指引起或可以引起或疑似可引起疾病的微生物。

如本文所用,短语“加标的初始样品”是指在开始生成测序文库之前已经向其添加了过程控制分子的初始样品。

在一些实施例中,初始样品包括以下、由以下组成或基本上由以下组成:固体或体液,如血液、血浆、血清、脑髓液、滑液、支气管肺泡灌洗液、尿液、粪便、唾液、腹腔液、腹液、腹膜灌洗液、胃液、间质液、淋巴液、胆汁、脓肿液、组织、羊膜液、胎便、窦抽出物、淋巴结、骨髓、头发、指甲、脸颊拭子、皮肤拭子、尿道拭子、宫颈拭子、鼻咽拭子、鼻咽抽出物、阴道拭子、上皮细胞、精液、阴道溢液、细胞间液、心包液、直肠拭子、骨骼、皮肤组织、软组织、眼泪和/或鼻样品。在一些实施例中,初始样品包括血浆、由血浆组成或基本上由血浆组成。在一些实施例中,初始样品包括尿液、由尿液组成或基本上由尿液组成。在一些实施例中,初始样品包括脑髓液、由脑髓液组成或基本上由脑髓液组成。在一些实施例中,初始样品来自人类受试者。

在一些实施例中,初始样品可以全部或部分地由细胞和/或组织构成。初始样品可以是游离的或细胞耗竭的。初始游离样品可以包括源自身体中的不同位点,如病原体感染位点的核酸、由所述核酸组成或基本上由所述核酸组成。在血液、血清、淋巴或血浆的情况下,游离样品或细胞耗竭的初始样品可以含有源于除了所讨论的液体的体液收集位点之外的解剖学位置处的“循环”游离核酸。在尿液的情况下,游离核酸可以是源于身体内的不同位点的游离核酸。游离样品或细胞耗竭的初始样品可以借助于通过已知技术,如通过离心或过滤来耗竭或去除细胞、细胞碎片或外来体来获得。

如本文所用,术语“游离”是指在即将从身体获得样品之前,核酸在其出现在身体内时处于细胞、病毒颗粒或病毒体之外的状况。例如,样品中的循环游离核酸可能起源于在受试者的血流中循环的游离核酸。相反,从完整微生物,如血源性病原体收集后提取或从血浆样品中的完整病毒体中收集后去除的核酸通常不被视为是“游离的”。

在一些实施例中,初始样品包括循环肿瘤或胎儿核酸、由循环肿瘤或胎儿核酸组成或基本上由循环肿瘤或胎儿核酸组成。(参见,例如美国专利第8,877,442号和第9,353,414号中描述的对血清或血源性核酸,如循环肿瘤或胎儿核酸的分析,或在如在发表的美国专利申请第2015-0133391号和发表的美国专利申请第2017-0016048中描述的通过例如分析循环微生物或病毒核酸进行的病原体鉴定,所述美国专利的全部公开内容出于所有目的通过引用以其整体并入本文)。在一些实施例中,初始样品包括循环供体核酸、由循环供体核酸组成或基本上由循环供体核酸组成(参见例如us20150211070,其通过引用以其整体并入本文,包含任何附图)。

人类受试者可以是男性或女性。在一些实施例中,样品可以来自人类胚胎或人类胎儿。在一些实施例中,人类可以是婴儿、儿童、青年、成人或老人。在一些实施例中,受试者是怀孕、疑似怀孕或计划怀孕的女性受试者。

在一些实施例中,受试者是已经进行器官移植或计划进行器官移植的人类受试者。

在一些实施例中,受试者是农场动物、实验室动物或家养宠物。在一些实施例中,动物可以是昆虫、狗、猫、马、牛、小鼠、大鼠、猪、鱼、鸟、鸡或猴子。

受试者可以是生物,如单细胞或多细胞生物。在一些实施例中,样品可以从植物、真菌、真细菌、古细菌、原生生物或任何多细胞生物获得。受试者可以是培养的细胞,所述培养的细菌可以是原代细胞或来自已确立的细胞系的细胞。

初始样品可以来自患有特定疾病、病状或感染,或疑似患有特定疾病、病状或感染(或有患特定疾病、病状或感染的风险)的受试者。例如,初始样品可以来自癌症患者,疑似患有癌症的患者或有患癌症的风险的患者。在一些实施例中,初始样品可以来自患有感染的患者、疑似感染的患者或有感染的风险的患者。在一些实施例中,初始样品来自已经进行或将进行器官移植的受试者。

可以用dna依赖性聚合酶或rna依赖性聚合酶或逆转录酶或其组合执行引物延伸反应。在一些实施例中,引物延伸反应可以通过具有链置换活性的dna或rna聚合酶执行。在一些实施例中,引物延伸反应通过具有非模板化活性的dna或rna聚合酶执行。在一些其它实施例中,引物延伸反应可以通过具有链置换活性的dna或rna聚合酶和具有非模板化活性的dna或rna聚合酶执行。在一些实施例中,引物延伸用klenow片段执行。

本公开的方法和系统可以通过一种或多种算法来实施。算法可以在由中央处理单元执行时通过软件的方式实施。算法可以例如促进病原体或微生物或其它靶核酸的富集、测序和/或检测,或片段长度谱的生成。

毒性包含但不限于细胞毒性。进一步认识到,毒性可以优先发生于特定类别的细胞中,所述特定类别的细胞包含但不限于癌细胞和病原体。

本申请的片段长度谱和方法可以用于非侵入性产前测试(nipt)。方法允许非侵入性地监测、诊断和跟踪胎儿状况。

本文提供的方法包含用于受试者遭受感染、有受到感染的风险的受试者和/或经历模仿多种其它疾病的未定义的症状的受试者的各种非侵入性方法。本文提供的方法可以用于多种目的,如诊断或检测感染、确定感染阶段、预测微生物的感染阶段、预测感染是否将进展到侵入性疾病阶段、监测对治疗或程序的功效和/或反应、终止治疗、确定感染位点、确定定殖位点、或修改或优化疗法以获得更好的临床反应。因此,本文提供的方法可以减少由误诊断或由用于确定受试者的器官是否受到感染、受试者的哪些器官受到感染以及受试者的器官如何受到感染的侵入性程序,如活检造成的不利影响。

在一些情况下,可以将方法与测序方法组合,以鉴定可能被感染的器官或组织,或者排除受试者的器官被感染的可能性(参见kohw.等人,“人类体内的组织特异性全球基因表达的非侵入性体内监测(noninvasiveinvivomonitoringoftissue-specificglobalgeneexpressioninhumans)”,《美国科学院院报(pnas)》2014:111(7361-7366),所述出版物出于所有目的通过引用以其整体在此并入)。图4提供了使用游离rna测序的器官位点方法的实例。器官-位点检测测定可以在本公开的方法或另一种临床测试确定了受试者具有处于侵入性疾病阶段的感染的情况下使用。在此情况下,方法可以进一步包括进行本文提供的器官-位点方法之一来检测器官是否已被感染。

本公开还提供了用于个体化治疗受感染受试者或易于感染或有感染的风险(例如,免疫抑制的、免疫受损的、生活条件下的或导致感染的易感性增加的遗传变异)的受试者的方法。本公开提供的个体化治疗包含预测感染是否将进展到侵入性疾病阶段的方法、用于监测受试者的疗法的功效、取决于受试者对疗法的反应来修改治疗方案以及确定病原体对特定治疗剂的耐性或受试者对给定治疗剂的反应的遗传易感性的方法。

可以对根据本发明方法产生的核酸进行分析以获得各种类型的信息,包含基因组、表观遗传(例如,甲基化)和rna表达。甲基化分析可以通过例如转化甲基化的碱基然后进行dna测序来执行。rna表达分析可以例如通过多核苷酸阵列杂交、通过rna测序技术或通过对由rna产生的cdna进行测序来执行。

示例性可检测标记包含放射性标记、荧光标记、蛋白质标记、染料标记、酶标记等。在一些实施例中,可检测标记可以是光学可检测标记,如荧光标记。示例性荧光标记包含花菁、若丹明、荧光素、香豆素、bodipy、alexa或缀合的多染料。

在一些实施例中,测序包括获得配对的端部读段、由获得配对的端部读段组成或基本上由获得成对的端部读段组成。在一些实施例中,测序包括获得共识读段、由获得共识读段组成或基本上由获得共识读段组成。

序列信息的准确度或平均准确度可以大于约80%、约90%、约95%、约99%、约99.98%或约99.99%。序列准确度或平均准确度可以大于约95%或约99%。序列覆盖率可以大于约0.00001倍、0.0001倍、0.001倍、约0.01倍、约0.1倍、约0.5倍、约0.7倍或约0.9倍。序列覆盖率可以小于约200,000倍、约100,000倍、约10,000倍、约1,000倍或约500倍。

在一些实施例中,每核酸模板获得的序列信息多于约10个碱基对、约15个碱基对、约20个碱基对、约50个碱基对、约100个碱基对或约200个碱基对。序列信息可以在少于1个月、2周、1周、2天、1天、14小时、10小时、3小时、1小时、30分钟、10分钟或5分钟内获得。

尽管实例(以下)对某些测序系统,例如illumina系统使用了特定序列,但是应当理解,对这些序列的引用仅出于说明目的,并且本文所述的方法可以被配置成用于与掺入了特定发动、连接、索引的其它测序系统以及这些系统,例如可从iontorrent公司、牛津纳米孔公司(oxfordnanopore)、genia技术公司、太平洋生物科学公司(pacificbiosciences)、completegenomics公司等获得的系统中使用其它操作序列一起使用。

可以使用测序数据来确定遗传序列信息、倍数性状态、一种或多种遗传变体的鉴定以及变体的定量量度,包含相对和完全相对量度。

比对序列读段

可以任选地清洁数据集以检查序列质量,去除测序仪特异性核苷酸(例如衔接子序列)的残余,并且合并重叠的成对的端部读段,以产生具有较小读段误差的更高质量的共有序列。重复值序列可以被鉴定为具有相同起始位点和长度或相同或几乎相同的序列的那些。任选地,可以从分析中去除重复值。

初始地可以将读段的数据集与包含但不限于genbankhg19或genbankhg38参考序列的宿主参考基因组进行比对,从而以生物信息学方式减除宿主dna。可以将每个序列与宿主参考序列中的最佳集合序列进行比对。可以从分析中以生物信息学方式去除被鉴定为宿主的序列。

可以对微生物数据库进行优化以掩盖或去除污染序列。例如,许多公共数据集条目包含不是衍生自微生物的人工序列,例如,引物序列、宿主序列和其它污染物。可能期望的是对数据库执行初始比对或多个比对。在多个样品进行比对时示出读段覆盖率的不规则性的区可以作为伪影进行掩盖或删除。此不规则覆盖率的检测可以通过各个指标来完成,如特定核苷酸的覆盖率与此核苷酸存在的整个重叠群的平均覆盖率之间的比率。通常,表示为大于其参考序列的平均覆盖率约5x、约10x、约25x、约50x、约100x的序列可能是人为的。可替代地,可以在给定重叠群的总体覆盖率的情况下应用二项式测试来提供每库覆盖率似然。从参考数据库去除污染物序列允许准确地鉴定微生物。

每个高置信度读段都可以与给定微生物数据库中的多种生物比对。为了基于此可能的映射冗余来正确地分配生物体丰度,可以使用算法来计算最可能的生物体(例如,参见lindner等人,《核酸研究(nucl.acidsres.)》(2013)41(1):e10)。例如,可以使用grammy或gasic算法来计算给定读段所来自的最可能的生物。

与宿主序列或与非宿主(例如,微生物)序列的比对和对其的指定可以根据本领域公认的方法执行。例如,如果读段长度存在不多于1个错配、不多于2个错配、不多于3个错配、不多于4个错配、不多于5个错配等,则可以将读段50nt.指定为匹配给定基因组。可以使用公开可用的算法来进行比对和鉴定。此比对算法的非限制性实例是bowtie2程序(约翰霍普金斯大学(johnshopkinsuniversity))。

进一步地,可以任选地聚集并展示样品中的由序列表示的微生物生物的数据集和这些微生物的发病率,以用于即时可视化,例如以报告的形式。

本公开提供了归一化方法。在一些情况下,本公开的方法可以包括一种或多种归一化方法。由本公开提供的归一化方法允许在样品中检测到的疾病特异性、病原体特异性或器官特异性核酸的测量结果或量高效且得到改进。

本公开的归一化方法通常使用加标物合成核酸。加标物合成核酸可以用于以多种不同方式对样品进行归一化。加标物核酸可以跨所有样品和测量疾病特异性核酸、病原体特异性核酸或其它靶核酸的所有方法进行归一化。在一些情况下,使用加标物可以增加样品中的病原体核酸(或疾病特异性核酸或靶标核酸)相比于样品中的其它病原体核酸的相对丰度计算的精度。

通常,可以将合成核酸的一种或多种已知浓度的物种加标到每个样品中。在许多情况下,合成核酸的物种可以以每种物种的等摩尔浓度加标。在一些情况下,合成核酸的物种的浓度可以不同。

核酸物种的丰度可以由于样品处置、制备和测量(例如,检测)的固有偏差而改变。在测量之后,可以通过将每种“物种”的加标核酸的所测量丰度与最初加标的量进行比较,来确定恢复每种长度的核酸的效率。这可以得到“基于长度的恢复谱”。

“基于长度的恢复谱”可以用于通过按照最接近长度的加标的分子或按照与不同长度的加标的分子拟合的函数对疾病特异性核酸丰度(或病原体核酸或其它靶核酸的丰度)进行归一化来对所有(或大多数或一些)疾病特异性核酸、病原体核酸或其它靶核酸进行归一化。

此过程可以应用于靶核酸,如病原体特异性核酸,并且可能导致在对样品加标时对“所有病原体特异性核酸的原始长度分布”的估计。“所有靶核酸的原始长度分布”可以示出在对样品加标时靶核酸(例如,病原体特异性核酸或器官特异性核酸)的长度分布谱。正是此长度分布,加标的核酸才可以寻求概括,以实现完美或接近完美的丰度归一化。正是此长度分布,加标的核酸才可以寻求概括,以实现确定靶核酸的内源性片段长度分布。

归一化可以涉及单个步骤或一系列步骤。在一些情况下,可以使用最接近大小的加标的核酸丰度的原始测量结果对疾病特异性核酸(或病原体核酸或其它靶核酸)的丰度进行归一化,以得到“归一化疾病特异性核酸(或病原体核酸或其它靶核酸)丰度”。然后,可以将“归一化疾病特异性核酸丰度”(或病原体核酸或其它靶核酸丰度)乘以“加权因子”,以调整恢复所述长度的相对重要性,从而得到“加权的归一化疾病特异性(或病原体特异性或其它靶)核酸丰度”。此归一化的方法的一个优点可以是,其允许跨测量疾病特异性核酸丰度的所有(或大多数)方法来可比较地测量靶核酸(例如,疾病特异性核酸、病原体核酸)丰度,不论方法如何都是如此。

本公开提供了多样性损失值测量。在一些情况下,本公开的方法可以包括确定多样性损失值。

特定文库中检测到的去重复值的(例如,去除复制品)spank分子的数量是所述文库中可检测到的最小浓度的代替。这可以用于基于所述文库中可检测到的spank分子的最小浓度设置阈值。阈值可以用于确保足够的测序深度以用于检测病原体。阈值还可以用于确保病原体信号不是由于来自其它样品的交叉污染。例如,可以在不同样品之间将相对于通过spank分子设置的阈值的病原体的富集进行比较。更一般地,其与所述文库将原始样品中的dna分子转化为dna测序数据中的读段的效率成正比。

可以使用本公开提供的加标的spank分子来计算多样性损失值。多样性损失值可以如图5所示来确定。在一些情况下,如果spank序列的多样性足够高,则加标到样品中的spank序列可以被假设为基本上都是独特的。因此,测序的任何重复值spank序列可能是由于pcr扩增,而不是由于同一spank序列的多个副本被添加到样品中,并且其可以从分析中去除。另外,如果每个spank序列都是独特的,则最初添加到样品的spank序列总数量基于添加到样品的核酸浓度和体积是已知的,并且测序之后独特spank测序读段的总数量是已知的,这些值一起可以用于计算多样性损失值。

c:绝对丰度(mpm)

本公开提供了绝对丰度测量(也被称为“每微升分子”(mpm))。

通常,样品中的靶核酸(例如,dna或rna)的绝对丰度可以通过利用经验确定的多样性损失值对靶核酸的序列读段的数量进行归一化来确定。

在许多情况下,用于检测每微升分子的方法(以及本文提供的其它方法)可以涉及去除或隔离低质量读段。去除低质量读段可以提高本文提供的方法的准确度和可靠性。在一些情况下,方法可以包括去除或隔离以下(以任何组合):不可映射的读段、由pcr重复值产生的读段、低质量读段、衔接子二聚体读段、测序衔接子读段、非独特映射的读段和/或映射到无信息序列的读段。

本公开提供了可以用于确定本公开提供的测量结果指示受试者有处于某个感染阶段或处于定位位点的感染的各种对照和参考。

通常,方法包括使用本公开的方法处理参考或对照。在一些情况下,可以测量对照或参考值测量作为浓度或测序读段数量。水平可以是定性或定量水平。基于来自对照或参考样品的序列读段,可以确定靶核酸(例如,病原体物种、基因变体、从实验室环境引入或器官衍生的污染物)的基线水平。

在一些情况下,对照或参考值是预定绝对值,其指示游离病原体核酸或游离器官衍生的核酸存在或不存在。对照或参考值可以是通过分析无感染的受试者的游离核酸水平获得的值。在一些情况下,对照或参考值可以是阳性对照值并且可以通过分析来自有特定已知感染或具体器官有特定已知感染的受试者的游离核酸来获得。

在一些情况下,对照可以包含使用来自健康个体的对照样品鉴定引起感染或不引起感染的一组共生微生物或天然微生物区系。可以基于对照样品中的一组共生微生物来设置阈值。

可以使用泊松模型或其它统计模型来确定临床样品的确定的基线水平是否显著高于参考对照。在来自临床样品的序列读段显著高于参考对照的情况下,这指示读段是信息性的。在一些情况下,可以选择此类信息性读段来确定两个不同临床组的阈值。

取决于靶核酸和跨样品观察到的背景的水平,可能期望的是使用一种或多种参考来减除或过滤出序列读段。过滤可以与选择组合,并且在选择之前或之后完成。在一些实施例中,至少一个参考值基于在一个或多个样品中检测到的病原体核酸的水平,所述一个或多个样品选自由以下组成的组:水样品、血液样品、血浆样品、血清样品、尿液样品、体液样品、试剂样品、来自健康受试者的样品或其任何组合。

方法可以包括确定阈值或值的范围。阈值可以用于鉴定某个临床组中的样品(定殖阶段与侵入性疾病阶段或无器官感染与受感染器官)。阈值可以用于鉴定或选择来自临床样品的信息性的序列读段。通常,期望的阈值将是最大化真阳性的数量同时最小化假阳性的数量的阈值。在一些情况下,阈值可以使用roc曲线分析来选择。在一些情况下,阈值可以基于性能指标来选择。

阈值选择

阈值可以通过使用各种统计方法,如接收器操作特性(roc)曲线分析基于其性能来选择。在选择截止阈值之前,可以使用roc分析来评估分类器在其整个操作范围内的性能。为了使用roc曲线来确定哪些阈值截止值应执行最佳的,可以跨范围(例如,0到1.0)逐步移动阈值以在减少假阳性的数量以及增加真阴性数量时找到截止值的结果。

roc分析可以通过如下绘制从本公开的方法获得的数据来执行:tp(敏感性)与fp(1-特异性)。使用roc图,完美或接近完美的分类器通常会沿y轴线并且然后沿x轴线笔直行进,而没有能力对不同临床组中的样品进行分类的分类器通常会就座于对角线上。大多数分类器将介于这两种极端情况之间的某处,并且用户可以基于其最可能或期望的性能来挑选阈值。

可以使用如准确度、敏感性、特异性、阳性预测值或阴性预测值等性能指标来选择阈值。在一些情况下,可以使用一个性能指标来选择阈值。在一些情况下,可以使用多个性能指标来选择阈值。

应用于数据集的任何阈值(其中pp为正种群,并且np为负种群)将产生真阳性(tp)、假阳性(fp)、真阴性(tn)和假阴性(fn)。

在一些情况下,可以使用准确度性能指标来确定正确分类的概率。准确度可以通过应用以下等式来计算:(tp+tn)/(pp+np)。在一些情况下,准确度使用经训练的算法来计算。

在一些情况下,可以使用敏感性性能指标来确定测试检测患病的个体群体中的疾病的能力。敏感性百分比可以通过应用以下等式来计算:tp/(tp+fn)。

在一些情况下,可以使用特异性性能指标来确定测试正确排除无病群体中的疾病的能力。特异性可以通过应用以下等式来计算:tn/(tn+fp)。

在对样品进行分类以用于感染的诊断时,通常存在四种来自二进制分类器的可能结果。如果来自预测的结果为p,并且实际值也为p,则其被称为真阳性(tp);然而,如果实际值为n,则其被称为假阳性(fp)。相反,真阴性发生在预测结果和实际值两者均为n时,并且假阴性是当预测结果为n,同时实际值为p时。对于检测如感染等疾病或病症的测试,假阳性在此情况下可以发生在受试者测试为阳性,但实际没有感染时。另一方面,假阴性可以发生在受试者实际上确实有感染但对此感染测试为阴性时。

阳性预测值(ppv)或精度率或疾病的测后概率是被正确诊断的具有阳性测试结果的患者的比例。其可以通过应用以下等式来计算:ppv=tp/(tp+fp)×100。ppv可以反映阳性测试反映了所测试的潜在病状的概率。然而,其值确实可以取决于疾病的发病率,所述发病率可以变化。

阴性预测值(npv)可以通过以下等式计算:tn/(tn+fn)×100。阴性预测值可以是正确诊断的具有阴性测试结果的患者的比例。ppv和npv测量结果可以使用适当的疾病患病率估计得出。

可以基于用户期望的在特异性和敏感性方面的性能来设置阈值,以在两个临床组之间进行区分。在一些情况下,本公开提供的方法的特异性可以大于70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或99.5%,并且敏感性可以大于95%、95.5%、96%、96.5%、97%、97.5%、98%、98.5%、99%、99.5%或更多。

应用

本公开提供的方法可以用于多种目的,如诊断或检测感染、确定微生物与宿主之间的生物学关系、感染的感染阶段、预测感染是否会进展到侵入性疾病阶段、监测对感染的疗效的功效和反应、修改或优化疗法以用于更好的临床反应、停止治疗或疗法。因此,使用本公开提供的方法,可以根据通过所述方法获得的数据为受试者提供个体化治疗。

预期引起受试者的感染的病原体具有几种特性,如但不限于与无症状参考或对照相比升高的绝对丰度水平、异常的核酸长度分布谱,或者其可以具有两种特性。同样,预期感染受试者的器官的病原体与无症状参考或对照相比具有升高的绝对丰度水平、异常的核酸长度分布谱,或者其可以具有两种特性。引起受试者的感染的病原体可以具有几种特性,如但不限于可与有症状参考或对照相比的核酸长度分布谱。

a:感染阶段

本公开提供的方法可以用于检测、诊断、治疗、监测、预测或预后受试者的感染阶段。引起感染的病原体可以是细菌、病毒、真菌、寄生虫、酵母或其它微生物,尤其是感染性微生物。在一些情况下,可以使用所述方法来确定受试者是否处于定殖或侵入性疾病阶段。在一些情况下,可以使用所述方法来检测受试者是否处于孕育阶段、前驱阶段、疾病阶段、衰退阶段、渐愈阶段、根除阶段、慢性阶段或侵入性阶段。在一些情况下,方法可确定感染处于活跃阶段或潜伏阶段。

本公开的方法可以与其它医学测试结合使用。例如,可以在从受试者进行粪便抗原测试、尿素呼吸测试、血清学、尿素酶测试、组织学、细菌培养和敏感性测试、活检、内窥镜检查之前或之后使用所述方法。在一些情况下,本文所述的方法在不对受试者执行粪便抗原测试、尿素呼吸测试、血清学、尿素酶测试、组织学、细菌培养和敏感性测试、活检或内窥镜检查的情况下执行。

在本文所述方法的一些情况下,所述方法将感染进展到侵入性疾病阶段的风险降低了至少10%、至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%或至少90%。在本文所述方法的一些情况下,所述方法将侵入性疾病阶段的死亡率和/或与并发症有关的死亡率降低了至少10%、至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%或至少90%。

本文所述的方法可以进一步包括衍生自受试者的器官的游离核酸的rna测序(rna-seq)。由感染引起的组织损伤可能导致游离核酸从受感染器官或组织释放到血液中。图3描绘了游离dna的释放的实例。样品中的衍生自器官的例如游离rna的增加可以指示受试者的器官已受到病原体感染。

rna-seq测试可以与用于检测感染的另一种临床方法同时,在用于检测感染的临床方法之后或在检测和感染临床方法之前执行。在其它情况下,rna-seq可以独立用于研究器官健康,或者可以提供对通过本文所述的另一种临床方法检测到的感染是特定器官的感染的增加的置信度。

rna-seq测试(或一系列rna-seq测试)有时可以在本文所述的方法产生阳性测试结果(例如,检测到病原体感染)之后执行。rna-seq测试尤其可用于确认感染或用于鉴定感染位置。例如,所述方法可以通过分析循环游离核酸来检测受试者体内的病原体的存在,但是感染的位点可能不清楚。在此情况下,所述方法可以进一步包括对来自受试者的游离rna进行测序以确认感染在器官内。

器官特异性rna的绝对丰度

在一些情况下,器官特异性rna序列的绝对丰度水平可以用作指示受试者的器官受到病原体感染的指标。器官感染的检测可以涉及将器官特异性核酸的水平与对照或参考值进行比较,以确定器官核酸的存在或不存在和/或器官特异性核酸的数量。水平可以是定性或定量水平。

在一些情况下,对照或参考值是预定绝对值,其指示游离器官衍生的核酸存在或不存在。例如,检测到游离病原体核酸的水平高于对照值可以指示器官中存在感染,而水平低于对照值可以指示器官中不存在感染。

对照值可以是通过分析无感染的受试者(例如,健康对照)的游离核酸水平获得的值。在一些情况下,对照值可以是通过分析来自有特定感染或具体器官有特定感染的受试者的游离核酸获得的阳性对照值。

在一些实施例中,对照或参考绝对丰度值指示受试者体内存在或不存在定位位点。例如,检测到游离病原体核酸的绝对丰度水平高于对照或参考值可以指示感染在器官中,而绝对丰度值低于对照或参考值可以指示感染不在器官中。在一些情况下,检测到游离病原体核酸的绝对丰度水平高于对照或参考值可以指示感染在器官中,而绝对丰度值低于对照或参考值可以指示感染不在器官中。

器官特异性rna的片段长度的分布

在一些情况下,器官特异性rna序列的片段长度的分布指示受试者的器官受到病原体感染。

例如,检测到游离器官特异性核酸的异常分布可以指示器官受到感染,而游离器官特异性核酸的正常分布可以指示器官未受到感染。

在一些实施例中,片段长度的对照或参考分布指示定位位点存在或不存在。例如,检测到游离病原体核酸的异常分布可以指示感染在器官中,而游离病原体核酸的正常分布可以指示感染不在器官中。在一些情况下,检测到游离病原体核酸的异常分布可以指示感染在器官中,而游离病原体核酸的正常分布可以指示感染不在器官中。

器官特异性rna的阈值或值的范围

在一些情况下,可以使用阈值截止值作为受试者的器官受到本文所提供的病原体的感染的指标。阈值截止值可以如本文所提供的通过使用来自受病原体感染的受试者的器官特异性rna序列,并且将这些与对照或参考进行比较来确定。

在一些情况下,样品被鉴定为受感染器官的准确度大于75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更多。在一些情况下,样品被鉴定为受感染器官的敏感性大于75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更多。在一些情况下,样品被鉴定为受感染器官的特异性大于75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或多于95%。

在一些情况下,样品被鉴定为受感染器官的阳性预测值为至少95%、95.5%、96%、96.5%、97%、97.5%、98%、98.5%、99%、99.5%或更多。在一些情况下,样品被鉴定为受感染器官的阴性预测值为至少95%、95.5%、96%、96.5%、97%、97.5%、98%、98.5%、99%、99.5%的受感染器官或更多。

在一些情况下,样品被鉴定为受感染器官的敏感性大于75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更多,并且特异性大于75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更多95%。

b:个体化治疗和监测

本公开还提供了用于个体化治疗受感染受试者或易于感染或有感染的风险(例如,免疫抑制的、免疫受损的、生活条件下的或导致感染的易感性增加的遗传变异)的受试者的方法。个体化治疗可以包含预测感染是否将进展到侵入性疾病阶段、监测受试者的疗法的功效、取决于受试者对疗法的反应来修改治疗方案以及确定病原体对特定治疗剂的耐性。

本公开还提供了调节治疗方案的方法。例如,受试者可以已经施用了用于治疗感染的药物。可以使用本文提供的方法来跟踪或监测药物治疗的功效。在一些情况下,可以取决于感染的上升或下降过程来调整治疗方案。例如,如果本文提供的方法表明感染不能用药物治疗来改善,则可以通过改变药物或治疗的类型、中断药物的使用、继续药物的使用、增加药物的给药或对受试者的治疗方案添加新的药物或疗法来调整治疗方案。

在一些情况下,治疗方案可以涉及特定程序。例如,在一些情况下,所述方法可以指示需要外科手术程序或侵入性诊断程序,如去除肿瘤或执行活检来确定器官是否是受感染的。同样,如果所述方法指示感染通过治疗干预正在改善或已消退,则调整治疗方案可能涉及减少或中断治疗。在其它情况下,可以不给予治疗方案,而是可以使用“观察等待”或“观察和等待”方法来观察在不用任何另外的医疗干预的情况下,感染是否清除。

本公开提供了用于检测、监测、诊断、预后、治疗、监测、预测或预防幽门螺杆菌(幽门螺杆菌)的定殖的方法。幽门螺杆菌定殖可能是无症状的。在一些情况下,定殖可能表现为急性胃炎,伴有腹部疼痛(胃痛)或恶心。本公开提供了用于检测、监测、诊断、预后、治疗或预防侵入性幽门螺杆菌疾病的方法。患有侵入性幽门螺杆菌疾病的受试者可能发展并发症,如慢性胃炎、消化性溃疡疾病、胃腺癌、胃癌和/或淋巴瘤。

本公开提供了用于检测、监测、诊断、预后、治疗、预测或预防艰难梭菌(cdi)的定殖的方法。cdi可能以无症状或有症状形式存在。cdi感染的临床谱的范围可以从轻度到中度、重度或复杂疾病。有轻度到中度cdi的受试者可能出现腹泻、结肠炎,包含发烧、白细胞增多和/或痉挛。cdi腹部和全身症状的严重度可能随感染的严重度而增加。可以使用所述方法来检测、监测、诊断、预后、治疗或预防侵入性cdi疾病。患有复杂或侵入性cdi疾病的受试者可能发展假膜性结肠炎、毒性巨结肠、结肠穿孔和/或败血症。

本公开提供了用于检测、监测、诊断、预后、治疗、预测或预防流感嗜血杆菌的定殖的方法。通常,流感嗜血杆菌定殖受试者的上呼吸道。本公开提供了用于检测、监测、诊断、预后、治疗或预防侵入性流感嗜血杆菌疾病的方法。患有侵入性流感嗜血杆菌疾病的受试者可能发展并发症,如败血症和/或脑膜炎。

本公开提供了用于检测、监测、诊断、预后、治疗、预测或预防肺炎链球菌的定殖的方法。本公开还提供了用于检测、监测、诊断、预后、治疗或预防侵入性肺炎链球菌疾病的方法。患有侵入性肺炎疾病的受试者可能发展菌血症和/或脑膜炎。

本公开提供了用于检测、监测、诊断、预后、治疗或预防巨细胞病毒(cmv)的定殖的方法。感染了cmv的受试者可能没有症状,因为病毒可以循环到休眠期。本公开还提供了用于检测、监测、诊断、预后、治疗、预测或预防侵入性cmv疾病的方法。患有侵入性cmv疾病的受试者可能在其眼睛、肺部和/或消化系统中发展并发症。

本公开提供了用于检测、监测、诊断、预后、治疗、预测或预防人乳头瘤病毒(hpv)的定殖的方法。有hpv定殖的受试者可能表现为非侵入性宫颈上皮内肿瘤和/或生殖器疣。本公开还提供了用于检测、监测、诊断、预后、治疗或预防侵入性hpv疾病的方法。患有侵入性hpv疾病的受试者可能发展宫颈癌、肛门鳞状细胞癌和/或肛门原位癌。

本公开提供了用于检测、监测、诊断、预后、治疗、预测或预防爱泼斯坦-巴尔二氏病毒(ebv)的定殖的方法。定殖有ebv的受试者可能是无症状的或表现为疲劳、发烧、喉咙发炎、颈部淋巴结肿胀、脾脏肿大、肝肿胀和/或红疹。本公开还提供了用于检测、监测、诊断、预后、治疗、预测或预防侵入性ebv疾病的方法。患有侵入性ebv疾病的受试者可能发展感染性单核细胞增多症(例如,腺热)、患有某些自身免疫疾病的风险可能更高、可能发展癌症,如霍奇金淋巴瘤(hodgkin'slymphoma)、伯基特淋巴瘤(burkitt'slymphoma)、胃癌、鼻咽癌、毛状白斑和/或中枢神经系统淋巴瘤。

本公开提供了用于检测、监测、诊断、预后、治疗、预测或预防丙型肝炎病毒(hcv)的定殖的方法。hcv感染可以是急性的或慢性的。通常,hcv定殖可以是无症状的。当存在病征和症状时,其可以包含黄疸,连同疲劳、恶心、发烧和肌肉痛。一些受试者可能具有自发病毒清除,而其它受试者可能会进展到慢性阶段。然而,在hcv感染变为慢性的情况下,其可能会导致侵入性hcv疾病。本公开还提供了用于检测、监测、诊断、预后、治疗、预测或预防侵入性hcv疾病的方法。患有侵入性hcv疾病的受试者可能发展肝硬化、肝细胞癌、肝感染和/或肝衰竭。

本公开提供了用于检测、监测、诊断、预后、治疗或预防淋病的定殖的方法。有定殖感染的受试者可能无症状,而其它受试者可能表现出如排尿灼热、睾丸或骨盆疼痛和/或从生殖器排出等症状。本公开提供了用于检测、监测、诊断、预后、治疗、预测或预防侵入性淋病疾病的方法。患有侵入性淋病疾病的受试者可能发展皮肤病变、关节感染(例如,关节疼痛和肿胀)、心内膜炎和/或脑膜炎。

本公开提供了用于检测、监测、诊断、预后、治疗或预防梅毒的定殖的方法。梅毒感染可以分为第一、第二、潜伏和第三阶段。第一阶段的受试者可能表现为酸痛。第二阶段的受试者可能表现为皮肤红疹、淋巴结肿胀和/或发烧。在梅毒潜伏阶段或无形阶段,受试者通常是无症状的。本公开还提供了用于检测、监测、诊断、预后、治疗、预测或预防侵入性梅毒疾病的方法。患有第三阶段或侵入性疾病的受试者可能在其它器官系统中发展并发症,其它器官系统包含但不限于心脏、血管、脑和/或神经系统。

本公开提供了用于检测、监测、诊断、预后、治疗或预防毛滴虫病的定殖的方法。有定殖感染的受试者可能是无症状的,或者可能在其性区发展炎症。本公开还提供了用于检测、监测、诊断、预后、治疗、预测或预防侵入性毛滴虫病疾病的方法。患有侵入性毛滴虫病疾病的受试者可能发展宫颈癌和/或前列腺癌。

本公开提供了用于检测、监测、诊断、预后、治疗或预防梅克尔细胞多瘤病毒的定殖的方法。有定殖感染的受试者可能是无症状的。本公开还提供了用于检测、监测、诊断、预后、治疗、预测或预防侵入性梅克尔细胞多瘤病毒疾病的方法。患有侵入性梅克尔细胞多瘤病毒疾病的受试者可能发展梅克尔细胞癌(mcc)肿瘤——罕见但攻击形式的皮肤癌。

本公开提供了用于检测、监测、诊断、预后、治疗或预防衣原体的定殖的方法。有定殖感染的受试者可能是无症状的,或者在排尿或从生殖器中排出时可能表现出灼热感。本公开还提供了用于检测、监测、诊断、预后、治疗、预测或预防侵入性衣原体疾病的方法。未经治疗的衣原体可以进展到侵入性疾病阶段,扩散到女性受试者的子宫和/或输卵管。患有侵入性衣原体疾病的受试者可能发展盆腔炎性疾病(pid),这可能导致长期盆腔疼痛、无法怀孕和异位妊娠。

在一些情况下,受试者受到不同感染阶段,如定殖阶段和侵入性疾病阶段的病原体的感染或有衣原体感染的风险。定殖的受试者可能没有临床病征或症状。在其它情况下,定殖的受试者可能具有临床病征或症状。患有侵入性疾病的受试者可能表现出临床病征或症状。在其它情况下,患有侵入性疾病的受试者可能表现出无临床病征或症状。

所述受试者可能患有另一种疾病或病症或有患另一种疾病或病症的风险。例如,受试者可能患有癌症(例如,乳腺癌、肺癌、胃癌、血液学癌症)、有患癌症的风险或疑似患有癌症。

在一些情况下,感染或进展为侵入性疾病的风险因素是受试者基因组dna的遗传变体。可能是感染的风险因素的遗传变体包含但不限于单核苷酸多态性、缺失、插入等。在一些其它情况下,受试者可以具有疾病,如胃癌的家族历史、淋巴细胞性胃炎、增生性胃息肉或妊娠呕吐的家族历史。

所述受试者可能患有另一种疾病或受到多于一种病原体的共感染或有患另一种疾病或受到多于一种病原体的共感染的风险。在一些情况下,受试者是免疫抑制的(例如,器官移植患者)。在一些情况下,受试者是免疫受损的(例如,通过化学疗法治疗、由aids或一般疾病,如糖尿病或淋巴瘤引起的免疫缺陷)。

在一些情况下,受试者可能表现出一种或多种临床症状。临床症状的非限制性实例可以包含腹部疼痛或灼痛、尾部清空时恶化的腹部疼痛、恶心、缺乏食欲、经常打嗝、胃部区域鼓胀、体重减轻、严重或持续性腹部疼痛、吞咽困难、血色或黑色柏油样便和/或血色或黑色呕吐物。其它临床症状是本领域已知的。

受试者可能受到任何类型的病原体或微生物的感染,包含细菌、病毒、真菌、寄生、原核生物、真核生物等。在一些情况下,病原体是已知的,而在其它情况下,其可能是已知共生的。

在一些情况下,受试者可能患有活跃或潜伏感染。在一些情况下,受试者是受感染的,但感染低于先前对受试者执行的其它测试的诊断敏感性的水平。在一些情况下,受试者是受感染的但是无症状的,或感染处于亚临床水平。

在一些情况下,受试者可能先前已进行治疗或者可能用如抗微生物、抗细菌、抗病毒和/或抗寄生虫药物等药物或医学程序进行治疗。在一些情况下,在使用本文的方法之前,受试者可能未进行活检、内窥镜检查、结肠镜检查、血液培养或其它此类程序。在一些情况下,在使用本文的方法之前,受试者可能进行过或可能已经进行过粪便抗原测试、尿素呼吸测试、血清学、尿素酶测试、组织学、细菌培养和敏感性测试、活检或内窥镜检查。

所述方法的实施例可以包括从样品中提取核酸或靶核酸或从反应混合物中的不希望的组分纯化核酸或靶核酸(例如,连接、扩增、限制酶、端部修复等)。在本申请的方法中可以使用本领域已知的提取核酸的任何装置。

提取可以包括将核酸与样品中可能存在的其它细胞组分和污染物分离。可以使用液体提取(例如,trizol、dnazol)技术从样品中提取核酸。在一些情况下,提取借助于通过有机溶剂(例如,乙醇或异丙醇)进行的酚氯仿提取或沉淀执行。在一些情况下,提取使用核酸结合柱执行。

在一些情况下,提取使用可商购的试剂盒执行,如qiagenqiamp循环核酸试剂盒、qiagenqubitdsdnahs测定试剂盒、agilenttmdna1000试剂盒、truseqtm测序文库制备、qiaamp循环核酸试剂盒、qiagendneasy试剂盒、qiaamp试剂盒、qiagenmidi试剂盒、qiaprepspin试剂盒)或核酸结合spin柱(例如,qiagendnamini-prep试剂盒)。在一些情况下,游离核酸的提取可以涉及过滤或超滤。

可以通过使用磁珠提取或纯化核酸。例如,可以使用具有氧化铁芯并且表面涂覆有含有游离羧酸或合成聚合物的分子的磁珠。可以调节盐浓度或聚亚烷基二醇以控制官能团与核酸之间的键的强度,从而允许受控且可逆的结合。最后,可以用洗脱缓冲液从磁粒中释放核酸。在一些情况下,使用可商购的试剂盒执行提取或纯化,如omegabiotek磁珠试剂盒、和/或xp磁珠。

所述方法可以包括纯化靶核酸。纯化可以在用户期望将靶核酸与反应混合物中的不希望的组分分离的情况下执行。非限制性示例性纯化方法包含乙醇沉淀、异丙醇沉淀、酚氯仿纯化和柱纯化(例如,基于亲和力的柱纯化)、透析、过滤或超滤。

生成核酸文库的方法是本领域已知的。

计算机控制系统

本公开提供了被编程为实施本公开的方法的计算机控制系统。图7示出了被编程或另外被配置为实施本公开的方法的计算机系统201。

计算机系统201包含中央处理单元(cpu,在此也被称为“处理器”和“计算机处理器”)205,所述中央处理单元可以是单核或多核处理器、或用于并行处理的多个处理器。计算机系统201还包含存储器或存储器位置210(例如,随机存取存储器、只读存储器、闪速存储器)、电子存储单元215(例如,硬盘)、用于与一个或多个其它系统通信的通信接口220(例如,网络适配器)以及外围装置225,如高速缓存、其它存储器、数据存储区和/或电子显示适配器。存储器210、存储单元215、接口220和外围装置225通过通信总线(实线),如母板与cpu205通信。存储单元215可以是用于存储数据的数据存储单元(或数据储存库)。计算机系统201可以借助于通信接口220可操作地耦接到计算机网络(“网络”)230。网络230可以是英特网、互联网和/或外联网、或与互联网通信的内联网和/或外联网。网络230在一些情况下是电信网络和/或数据网络。网络230可以包含可以实现分布式计算,如云计算的一个或多个计算机服务器。网络230在一些情况下借助于计算机系统201可以实施对等网络,所述对等网络可以实现将装置耦接到计算机系统201以充当客户端或服务器。

cpu205可以执行一系列机器可读指令,所述一系列机器可读指令可以体现在程序或软件中。指令可以存储在存储器位置中,如存储器210。指令可以涉及cpu205,所述指令可以随后编程或另外配置cpu205以实施本公开的方法。由cpu205执行的操作的实例可以包含取得、解码、执行和写回。

cpu205可以是电路,如集成电路的一部分。系统201的一个或多个其它组件可以包含在电路中。在一些情况下,电路是专用集成电路(asic)。

存储单元215可以存储文件,如驱动程序、库和保存的程序。存储单元215可以存储用户数据,例如,用户偏好和用户程序。计算机系统201在一些情况下可以包含一个或多个另外的数据存储单元,所述一个或多个另外的数据存储单元位于计算机系统201外部,如定位在通过内联网或互联网与计算机系统201通信的远程服务器上。

可以通过存储在计算机系统201的电子存储位置上,例如存储器210或电子存储单元215上的机器(例如,计算机处理器)可执行代码实施如本文所描述的方法。机器可执行或机器可读代码可以以软件的形式提供。在使用期间,代码可以由处理器205执行。在一些情况下,代码可以从存储单元215检索并且可以存储在存储器210上以供由处理器205即时访问。在一些情形下,可以排除电子存储单元215,并且机器可执行指令存储在存储器210上。

代码可以被预先编译且被配置成用于与具有被适配成执行所述代码的处理器的机器一起使用或可以在运行期间进行编译。代码可以以编程语言供应,可以选择所述编程语言以实现以预先编译或类编译(as-compiled)的方式执行代码。

因此,机器可读介质(如计算机可执行代码)可以采取许多形式,包含但不限于有形存储介质、载波介质或物理传输介质。非易失性存储介质包含例如光盘或磁盘,如一个或多个任何计算机中的存储装置中的任何存储装置等,如可以用于实施附图中示出的数据库等。易失性存储介质包含动态存储器,如此计算机平台的主存储器。有形传输介质包含同轴电缆、铜线和光纤,包含包括计算机系统内的总线的导线。载波传输介质可以采用电信号或电磁信号的形式,或声波或光波的形式,如在射频(rf)和红外(ir)数据通信期间生成的那些。因此计算机可读介质的常见形式包含例如:软盘、软磁盘、硬盘、磁带、任何其它磁性介质、cd-rom、dvd或dvd-rom、任何其它光学介质、穿孔卡、纸带、带有孔图案的任何其它物理存储介质、ram、rom、prom和eprom、闪速-eprom、任何其它存储器芯片或盒、传输数据或指令的载波、传输此类载波的电缆或链路、或计算机可以从其读取程序代码和/或数据的任何其它介质。计算机可读介质的这些形式中的许多形式可以涉及将一个或多个指令的一个或多个序列承载到处理器以供执行。

计算机系统201可以包含电子显示器235或可以与电子显示器通信,所述电子显示器包括用于提供报告输出的用户界面(ui)240,所述报告输出可以包含对受试者的诊断或对受试者的治疗干预。ui的实例包含但不限于图形用户界面(gui)和基于web的用户界面。分析可以以报告形式提供。可以将报告提供给受试者、医疗保健专业人员、实验室工作人员或其它个体。

本公开的方法和系统可以通过一种或多种算法来实施。算法可以在由中央处理单元205执行时通过软件的方式实施。算法可以例如促进病原体核酸的富集、测序和/或检测。

可以生成电子报告以指示病原体的感染阶段。可以生成电子报告以指示预后。可以生成电子报告以指示诊断。如果电子报告指示存在可治疗的感染,则可以生成电子报告以规定治疗方案或治疗计划。可以使用计算机系统来分析来自本文所述的方法的结果,将结果报告给患者或医生或提出治疗计划。

试剂盒

试剂盒可以包括使用本文所述的方法,如pcr和测序执行核酸提取和/或核酸检测所必需的试剂。所述试剂盒可以进一步包括用于数据分析的软件包,所述软件包可以包含用于与来自临床样品的测试谱进行比较的参考谱,并且具体地可以包含参考数据库。试剂盒可以包括试剂,如缓冲液和水。

此类试剂盒还可以包含指示或确立组合物的活性和/或优点和/或描述信剂量、施用、副作用、药物相互作用的信息,如科学文献参考、包装插页材料、临床试验结果和/或这些的摘要等或对卫生保健提供体有用的其它信息。此类试剂盒还可以包含用于访问数据库的说明书。此类信息可以基于各种研究的结果,例如,使用涉及体内模型的实验动物的研究和基于人类临床试验的研究。可以向包含医师、护士、药剂师、处方官员等健康提供体提供、销售和/或推广本文所述的试剂盒。在一些实施例中,也可以将试剂盒直接销售给消费者。

将理解的是,对以下实例的引用仅出于说明目的,并且不限制权利要求的范围。

实例

实例1:分布形状和微生物状态

临床血浆样品:从36位人类受试者收集了36例诊断阳性的(即用正交测试,例如,血液培养、靶向pcr、karius测试确认的微生物的存在)。对每个样品执行在样品收集的24小时内从全血进行单离心步骤血浆提取过程,如前所述(参见fanhc等人,《美国科学院院报》2008;105(42):16266-16271中的第一离心步骤,所述文献通过引用以其整体并入本文,包含任何附图),并且在使用之前储存在-80℃下。然后将样品解冻,并且向200μl的每种血浆加标2μl的加标物主混合物(参见下文)。

阳性测定对照样品:针对每组18个样品,分别对被称为测定对照样品(ac)的两个阳性对照进行处理。由以纯化形式从atcc(美国典型培养物保藏中心(americantypeculturecollection))购买,加标有人病原体的酶剪切的基因组的人无症状血浆制备ac样品。所选人病原体为烟曲霉(aspergillusfumigatus)、大肠杆菌、铜绿假单胞菌(pseudomonasaeruginosa)和表皮葡萄球菌。每1mlac样品中添加10μl加标物主混合物(参见下文)。

阴性对照样品:由水性缓冲液(10mmtrisph8、0.1mmedta、0.05v/v%tween-20)与5μl加标物主混合物(参见以下)制成每18种样品四种500μl阴性对照样品(ec),并且将其用作环境污染的对照(例如,处理期间通过试剂、仪器、消耗品、操作者和/或空气引入的微生物和病原体核酸污染)。使用这些合成核酸以对样品中的信号进行归一化,以解决样品处理中的变化。

加标物主混合物:在单个加标物主混合物中将一组过程控制分子预混合在一起,每种加标物主混合物均含有独特“id加标”过程控制分子,参见例如美国专利9,976,181。加标物主混合物含有三种类别的分子:id加标分子、spank分子和spark分子。后一组分子由两种类别的spark构成:gcdspark和长spark。加标物主混合物中的id加标、spank分子和长spark分子的摩尔浓度为每分子500pm,而gcdspark分子以每分子50pm存在。

“id加标”分子:每个样品接受特征为50个碱基对长独特序列的独特id加标单链dna分子,所述序列在处理时不存在于可在公共数据库中获得的任何参考基因组中。

spank分子:所使用的spank分子是单链dna分子池,每个分子50个碱基对长,具有相同的3'端和5'端序列,所述序列在处理时不存在于可在公共数据库中获得的任何参考基因组中。另外,存在嵌套在恒定的3'端与5'端序列之间的8个碱基对的两个延伸段,并且在池中完全退化。spank分子池含有416个独特spank分子。由四个非简并碱基的延伸段将两个简并延伸段分开。

spark分子:gc加标物小组是32、42、52和75nt长的分子的集合,其中每个长度包含gc含量为20%、30%、40%、50%、60%、70%和80%的7个不同序列。上面提供的其它分子中的一些一样,gcdspark序列没有出现在可用参考基因组中。长spark序列集合是4个非天然序列的组,每个序列的gc含量为50%并且长度为100nt、125nt、150nt和175nt。spark分子的完整集合含有32个不同序列。

测序:使用illumina公司的nextseqtm500测序仪对样品进行测序以获得序列读段。按照制造商的说明使用76个循环执行测序。

实例2:对来自怀孕受试者的血浆样品的分析

在从宿主获得的样品中可以发现许多类型的非宿主核酸。在母体血液中可以检测到胎儿游离核酸。在此样品中,血浆样品是从15名获得同意的怀孕妇女获得的,并且已去标识。根据在2018年11月21日提交的美国临时申请62/770,181的实例1中所述的基于连接的直接到文库的方法对样品进行处理和测序,所述美国临时申请在此通过引用以其整体并入。在此分析中,考虑了仅来自孕育有男性胎儿的受试者的样品。仅与y染色体比对的读段被视为是胎儿的。使用bowtie2将读段与人基因组比对。然后使用bowtie2将映射到染色体y的读段与从除了y之外的所有人染色体创建的索引进行比对。丢弃与此索引比对的任何读段,使得保留了仅染色体y特有的读段。

图12中呈现了来自一个个体的母体(虚线)和胎儿(实线)游离核酸的片段长度分布。在此实例中,与核小体片段区(例如150-200bp区)相比,“50bp峰”区中的胎儿与母体读段的比率更高。平均而言,在“50bp峰”区内观察到的胎儿片段的浓度比核小体长度片段区高4倍。这里采用的方法可用于富集胎儿分数。

实例3:使用片段长度谱对微生物的分析

实例4:使用片段长度谱对定殖位点的分析

实例5:宿主核酸的长度分布谱和感染状态

宿主核酸的片段长度分布可以帮助告知宿主内的非宿主核酸信号,例如微生物核酸信号或宿主的感染阶段(例如无症状的与有症状的)。例如,来自人类宿主的样品内的微生物核酸的丰度可能会在几个量级上变化(blauwkamp等人,(2016))。尽管从无症状个体获得的样品趋于展现出与受感染个体相比微生物核酸的丰度较低,但在一些无症状样品中测量的丰度可能超过受感染个体中的最低丰度(blauwkamp等人,(2016))。从样品获得的核酸池的另外的性质可以帮助在微生物与宿主的不同感染阶段或生物学关系(例如,共生与病原体)之间进行区分。在此,测试了宿主核酸的长度分布在预测来自宿主的血浆内的微生物的感染状态时的效用。方法使得能够访问具有先前方法通常不会以无偏差方式访问的片段长度的内源片段长度谱。方法使得能够访问具有先前方法通常丢弃、无视或视为不重要的片段长度的内源片段长度谱。

如上所述制备阳性和阴性对照样品。

直接来自血浆的核酸文库生成和测序:直接到文库的生成在于2018年11月21日提交的美国临时申请62/770,181中进行了描述,所述美国临时申请在此通过引用以其整体并入。如以上实例1中所述的制备文库并对文库进行测序。

结果:如以上所述确定每个样品中存在的显著微生物的丰度,并且以血浆样品的浓度单位分子每微升(mpm)给出,所述mpm是给出1微升血浆样品中生物的独特核酸片段的估计数量的归一化数量。此计算源自根据在开始过程之前向血浆样品中添加的独特合成加标物的已知数量归一化的每种生物的存在的独特或去重复值的序列的数量(参见美国专利第9,976,181号)。图9a示出了无症状(ap)和诊断阳性(dp)样品类型中的mpm值的分布。dp样品类型中的较低丰度值与ap样品中观察到的mpm的范围重叠,即使包含仅正交确认的微生物也是如此。(dpngs包含通过karius测试确认的微生物,并且dpmicro包含通过培养或基于pcr的方法确认的微生物)。另外,如果分析限于存在于ap样品的集合以及还有dp样品的集合中的微生物物种(在此数据集中,以下物种符合此描述:凝结芽孢杆菌、肠球菌属、粪肠球菌、流感嗜血杆菌、副流感嗜血杆菌、人哺乳动物腺病毒d、粘液奈瑟球菌、乳酸片球菌、中间普雷沃菌、产黑普雷沃氏菌、酿酒酵母、无乳链球菌、唾液链球菌、嗜热链球菌),则诊断阳性组中的丰度仍不总是更高(图15b)。因此,丰度不足以区分非微生物宿主的感染状态。

然后可以使用几个可测量参数的组合来将无症状/健康患者与经历感染的患者进行区分。为此,作为潜在分类器,研究了mpm微生物丰度和映射到宿主参考(即此样品队列中的人类参考)的核酸片段长度分布的组合。

图15c示出了在文库生成过程完成并且如通过tapestation仪器测量的核酸片段的典型分布的实例。可以观察到片段长度的两个主要峰:(1)“核小体”峰(在电泳图中300-450bp的范围)以及(2)“亚核小体”峰(在电泳图中180-280bp的范围)。此信号是通过人(即宿主)核酸的性质决定的,因为微生物(即非宿主)核酸占这些样品包含dp样品类型中的总核酸群体的微小分数。贡献于两个峰的人片段的摩尔比和质量比在样品之间有所变化并且在ap样品类型与dp样品类型之间是不同的(图15d)。绝大多数ap样品(92%)示出“核小体”峰摩尔分数低于0.4,而相同的值均等地分布在dp样品的更宽范围内(<0.7)。

mpm微生物丰度以及人片段长度分布的性质示出与ap样品与dp样品之间的值重叠。两个独立测量结果的组合可以帮助在感染阶段未知的未知样品中将无症状调用与感染调用进行区分。图15e示出了如根据测序数据测量的长人读段分数(所有读段映射到在衔接子修整之后长于65bp的人参考)以及在所有ap和dp样品的相同样品中测量的最大mpm值。坐标[(0,3000),(0,0.4)]所涵盖的区排他地由ap样品填充。100个ap样品中的三个落在此空间之外(15e中的箭头)。这三个样品中检测到的微生物为幽门螺杆菌、人哺乳动物腺病毒和淋病奈瑟菌。所有三种微生物都是已知的人病原体,但是不知道其在这些个体体内是否是致病的。

微生物mpm与ap和dn样品类型中的人片段长度分布的性质之间的比较(图15f)揭示了无dn样品落入典型无症状范围内,即使根据正交测试其为阴性的也是如此。

可以利用非微生物信号,如非微生物宿主核酸的片段长度分布的性质来鉴定受试者的无症状或非感染状态。

数据还指示,可以根据如本文呈现的数据通过组合丰度(例如最大mpm)和片段长度分布参数来鉴别无症状个体,即使微生物的mpm值与诊断阳性样品中可以观察到的范围重叠也是如此。这还表明,在标准症状不存在的情况下,早期检测感染是可能的。可以针对例如特定微生物物种的mpm或王国以及微生物片段长度进一步优化此二维平面上的可以帮助在个体的不同感染状态之间进行区分的区,以改善测试的性能。

血浆处理和dna提取:在样品收集的24小时内从全血样品中提取血浆,如前所述(fanhc等人,《美国科学院院报》2008;105(42):16266-16271),并且存储在当需要分析时,将血浆样品解冻,并且立即从0.5-1ml血浆中提取循环dna。

测序文库制备和测序:使用针对illumina设置的具有标准illumina索引的衔接子(购自idt)以及端部后修复纯化(例如,magbind珠、nebnext端部修复模块)的nebnextdna文库制备主混合物或使用基于微流体的自动化文库制备平台(mondrianst,ovationsp超低文库系统)由经纯化的患者血浆dna制备测序文库。使用agilent2100生物分析仪(高敏感性dna试剂盒)对文库进行表征,并且通过qpcr进行定量。

所选细菌靶标的测序结果的qpcr验证.使用用于所选细菌靶标(例如,幽门螺杆菌)的定量的标准qpcr试剂盒来验证游离dna样品的子集的测序结果。在从约1ml的血浆提取的并且在100mltris缓冲液(50mm[ph8.1-8.2])中洗脱的cfdna上运行qpcr测定。在不同设施中执行血浆提取和pcr实验。运行无模板对照以验证每个实验中包含的pcr试剂。

在去除低质量读段之后,将读段映射到人参考基因组。将假定为微生物组衍生的剩余读段映射到目标微生物基因组的参考数据库。使用专有算法计算每种微生物的相对丰度。所述算法报告了与对照相比以统计学显著量存在的生物。具有过表示的序列的生物被报告为阳性。

结果.

表1:血浆中的幽门螺杆菌的检测.幽门螺杆菌感染为败血症的很可能、可能或不太可能的原因

不受机制的限制,游离核酸可以衍生自死亡和垂死的病原体。因此,本方法独特地适合于检测被免疫系统主动清除的生物。实际上,测定能够在活跃炎症而不是无症状定殖的上下文中在幽门螺杆菌之间进行区分。

实例7:用于检测高风险患者之中的幽门螺杆菌gi道感染的方法

此研究的目标是评估本方法的临床效用(i)以检测与常规诊断测试相比消化性溃疡疾病(幽门螺杆菌pud)有症状的患者体内的活性幽门螺杆菌感染;(ii)以确认与常规诊断测试相比在一线疗法之后活跃幽门螺杆菌胃肠感染的根除;以及(iii)以评估将具有活跃幽门螺杆菌pud的患者与没有(无症状)的那些进行区分的最优mpm阈值。使用此非侵入性方法允许医师做出有效治疗决策,而无需诉诸传统侵入性诊断方法。

研究设计.

如在下文中描述的确定在特定测试条件下在两个良好描述的成年研究群体中,本方法相比于非血清学常规幽门螺杆菌诊断测试的阳性一致性百分比(ppa)和阴性一致性百分比(pa)。在进入研究时,具有有症状幽门螺杆菌pud的患者符合临床标准并且在第一根除治疗的任何施用之前,具有至少一次阳性方案批准的、非血清学常规幽门螺杆菌诊断测试。对所有文档化的有症状幽门螺杆菌pud患者执行血浆测试。此后,这些pud患者接受2-4周标准根除方案(根据护理标准),然后是1个月药物假期。在第一治疗完成之后的30天(+/-3天)内,研究参与结束的所有pud患者经历重复血浆测试评价和在治疗之前执行的原始非血清学、常规幽门螺杆菌诊断测试中的至少一个。

在进入研究时,基于临床标准和至少一个阴性方案批准的非血清学常规幽门螺杆菌诊断测试,出于任何原因进行结肠镜检查的阴性对照患者在筛选期间无活跃幽门螺杆菌胃肠疾病的迹象。此后,阴性对照结肠镜检查患者进行血浆测试以完成所有方案要求。

来自这些诊断测试比较的数据提供了关于本方法用于检测活性幽门螺杆菌疾病并且确认相比于非血清学常规幽门螺杆菌诊断测试在第一治疗之后根除的效用。

方法和材料

使用定量测试方法以通过分析血浆中的非人dna来检测微生物。此方法的分析物是微生物游离核酸,所述分析物与人cfdna相比非常短(平均长度少于100个核苷酸)。

将全血离心两次以呈现游离(cf)血浆。为了解决潜在环境污染物,可以在使用前将非易失性缓冲液加热到超过85℃的温度并冷却。在第一次离心之后,使用pct-us2017-024176中阐述的方法向每个样品中添加内部对照分子。提取血浆,并且使用经纯化的游离dna(cfdna)来使用针对illumina设置的具有标准illumina索引的衔接子(购自idt)以及端部后修复纯化(例如,magbind珠、nebnext端部修复模块)的nebnextdna文库制备主混合物或使用基于微流体的自动化文库制备平台(mondrianst,ovationsp超低文库系统)制备测序文库。连接衔接子,并且使用ampure珠在不加热的情况下执行纯化,然后通过qpcr进行扩增。使用agilenthstapestation对文库进行表征,并且测量核酸的总浓度以通过对信号(例如,在50bp与1000bp之间)进行积分来控制加载体积,以用于小选择步骤。

将经测序的cfdna片段映射到微生物序列的参考数据库,以确定样品中存在的呈显著水平(高于测定背景)的非人、非内部对照材料的同一性。首先将测序数据转换为代表dna序列的读段,并且然后基于索引序列将其多路分解为从加载到测序仪中的每个文库衍生的读段(读段集)的集合。过滤与人序列比对的读段,并且留出与内部对照分子的序列比对的其余读段以用于另外的分析。接下来,将与人参考或内部对照参考不匹配的读段与已知微生物基因组进行比对。与此数据库具有一个或多个比对的读段(病原体读段)是随后分析的基础。

如果测试示出相比于阴性背景对照,幽门螺杆菌为显著的,则测试将被视为阳性的。然而请注意,在解决定量mpm截止值之后,负同一性百分比(npa)不太可能反映测试的npa。

除了使用如通过实验室确定的以mpm计的阳性和阴性的阈值评估研究队列、pud和结肠镜检查中的每一个内的ppa和npa,还应考虑mpm中的其它阈值。首先,将使用每个研究队列的均值、标准偏差、中位数和范围来汇总mpm。其次,将使用接收者操作特性(roc)曲线来鉴定mpm中的最优切割点,以用于最大化样品中的ppa和npa。

最后,为了评估本方法在30天时鉴定根除的能力,将用研究队列中的每一个内的比例和95%置信区间来估计成功根除。

实例8:片段长度分布谱和定殖位点

将从来自感染位于血流和肺部中的患者的临床样品获得的微生物测序读段的片段长度分布的特性进行了比较,作为深部组织感染的实例。片段长度分布特性取决于定位位点而变化。不受机制的限制,不同感染位点的不同宿主反应可能有助于改变片段长度分布特性。再次,不受机制的限制,不同感染位点可以表现出不同非宿主核酸片段化机制。

临床血浆样品:收集了来自确认有血流感染的患者的10种去标识的临床样品和来自确认有肺部感染的患者的10种去标识的临床样品。对每个样品执行在样品收集的24小时内从全血进行单离心步骤血浆提取过程,如前所述(参见fanhc等人,《美国科学院院报》2008;105(42):16266-16271,所述文献通过引用以其整体并入本文,包含任何附图),并且在使用之前储存在-80℃下。然后将样品解冻,并且向150μl的每种血浆加标1.5μl的加标物主混合物(参见下文)。如果获得的体积不同,则成比例地添加较小或较高体积的加标物主混合物,以维持所有初始样品和对照样品中的过程控制分子的恒定浓度。

阴性对照样品:由水性缓冲液(10mmtrisph8、0.1mmedta、0.05v/v%tween-20)与5μl加标物主混合物(参见以下)制成四种500pf阴性对照样品(ec),并且将其用作环境污染的对照(例如,处理期间通过试剂、仪器、消耗品、操作者和/或空气引入的微生物和病原体核酸污染)。之后使用这些合成核酸以对样品中的信号进行归一化,以解决样品处理中的变化。

如上文所述用id加标分子、spank分子和spark分子制备加标物主混合物。

使用了如美国临时申请62/770,181的实例1中描述的基于连接的直接到文库的方法来由5μl加标的无症状血浆制备测序文库。如实例8描述的执行测序和测序数据分析。

结果:表2列示出作为此实例的一部分的所有20个临床样品连同捐献临床样品的每个受试者的感染位点和感染微生物的物种。所有所测试样品中的感染微生物的片段长度分布在图17中示出。针以下对片段长度分布谱特性(例如短指数衰减片段、峰、长片段)的存在,分析了映射到感染微生物的参考的读段的归一化片段长度分布:(1)短类指数分布分数(表2中为“短”),(2)峰分数(表2中为“峰”),以及(3)比实验的读段长度长的读段的分数(75bp;表2中为“长”)。同样,典型长度的分数范围在微生物片段长度分布中。片段长度分布谱类型的比较揭示了,血流感染不成比例地展现出表征为以下的片段长度分布谱:(1)短伪指数分布的片段的高分数,(2)20bp与75bp读段长度之间的峰不存在,以及(3)大于10%in的长读段(>64bp)的分数。相反,肺部感染不成比例地展现出表征为以下的片段长度分布谱:(1)短伪指数分布的片段存在,(2)在20bp与75bp读段长度之间存在峰,以及(3)小于10%的长读段的分数。这表明微生物片段长度分布的特征可以用于确定感染存在于血液中或深部组织中。

表2:临床样品和感染部位、感染微生物的物种以及映射到感染微生物物种的参考的测序读段的片段长度分布的性质的列表.对于每种性质,指出了其定量评估(存在/不存在),并且在括号中给出了所述分段中存在的总读段的分数。在此,短片段区段包含22bp直到29bp并且包含29bp的读段;峰片段长度范围包含30bp直到59bp并且包含59bp的读段;并且长片段范围包含长于59bp的读段。

实例9:片段长度分布谱和定殖位点2

将从来自感染位于血流(来自静脉血液抽取的血浆)和来自毛细血液的在将其收集在毛细抽取收集系统中之前与指尖上的皮肤接触的血浆的患者的临床样品获得的微生物测序读段的片段长度分布的特性作为皮肤感染的实例进行了比较。

临床血浆样品:根据制造商的说明,将来自20个健康成人供体的血液收集到ppt管中,其中k2edta作为抗凝血剂(新泽西州富兰克林湖(franklinlakes,nj)的bectondickinson公司)。静脉血液抽取后,立即使用microvettecb300血液采样装置,使用k2edta作为抗凝剂(内华达州sparks公司的莎斯特公司(sarstedtinc,sparks,nv))对同一组20名健康供体执行毛细血液抽取。在毛细管抽吸过程中,执行以下步骤:(1)将供体的手指保持在向上位置,并用适当大小的刺血针刺入手指的手掌侧表面,(2)避免穿刺时用力压在手指上以防止抽取的血液溶血,以及(3)将在指尖之上扩散的血滴收集到清洁microvettecb300血液采样装置中。根据制造商的说明,对每个样品在样品采集后12小时内从全血中进行单离心血浆提取过程,并将血浆保存在-80℃直至使用。然后将样品解冻,并且向每种血浆加标等同于1%血浆体积的加标物主混合物的体积。

阴性对照样品:由水性缓冲液(10mmtrisph8、0.1mmedta、0.05v/v%tween-20)与5μl加标物主混合物(参见以下)制成四种500μl阴性对照样品(ec),并且将其用作环境污染的对照(例如,处理期间通过试剂、仪器、消耗品、操作者和/或空气引入的微生物和病原体核酸污染)。之后使用这些合成核酸以对样品中的信号进行归一化,以解决样品处理中的变化。

阴性microvette样品:将四种300μl的水性缓冲液(10mmtrisph8、0.1mmedta、0.05v/v%tween-20)添加到四种清洁且未使用的microvettecb300血液采样装置中,并且在室温下温育6小时,之后定量地收集含量并且加标3μl的加标物主混合物(参见以下)。

直接来自血浆的核酸文库生成:将25.0μl每种加标的样品与10.0μl10x末端转移酶反应缓冲液(马塞诸塞州伊普斯威奇市的新英格兰生物实验室公司)、2.5μl蛋白酶k(西格玛公司)、1.0μl10%tween-20(马萨诸塞州沃尔瑟姆市的赛默飞世尔科技公司)、1.0μl10%tritonx100(马萨诸塞州沃尔瑟姆市的赛默飞世尔科技公司)和60.5.0μl无核酸酶的水混合。将混合物加热到60℃持续20分钟,并且加热到95℃持续10分钟,并且将其放置在冰上直到冷却。添加1.0μl10mmdatp、1.0μl末端转移酶(20u/μl,马塞诸塞州伊普斯威奇市的新英格兰生物实验室公司)和3.0μl无核酸酶的水以制备a尾部反应,然后在37℃下温育40分钟。向反应添加150.0μl裂解/结合缓冲液(马萨诸塞州沃尔瑟姆市的赛默飞世尔科技公司)。然后将整个体积添加到25.0μldynabeads寡核苷酸(dt)25(马萨诸塞州沃尔瑟姆市的赛默飞世尔科技公司)中,然后用裂解/结合缓冲液(马萨诸塞州沃尔瑟姆市的赛默飞世尔科技公司)洗涤一次。在25℃和600rpm下温育混合物。所述过程的其余部分遵循实例1中概述的方案的步骤。

测序:使用illumina公司的nextseqtm500测序仪对样品进行测序以获得序列读段。按照制造商的说明执行测序。如以上实例1中描述的执行测序分析。

表3:在从在供体1和供体2的毛细血液抽取期间应用的过程获得生物样品中检测到的微生物物种的列表.

实例10:移植后感染

实例11:定位位点评估

实例12:由微生物片段长度分布进行的感染阶段确定

此研究的受试者的组包含正交诊断有血流感染的3名患者、正交诊断有心内膜炎的8名患者以及正交诊断为发热性粒细胞减少性患者的5名患者。图19a、19b和19c分别示出了血流感染、心内膜炎和发热性粒细胞减少症的代表性实例中的片段长度分布的变化。图19中的示例片段长度分布指示短指数分布的片段的高概率(范围<40bp),以及在治疗已经开始之后50bp左右的峰化分布的增加的概率。因此,研究了所有经处理的样品中的短指数分布或接近指数分布的片段的分数。图20a描绘了此短读段分数的变化的动力学。这表明可以基于短且指数分布的读段分数的存在来诊断侵入性感染,在血流感染或菌血症的情况下尤其如此。在单个受试者体内,存在>64bp的高读段分数,这可能表明得到短指数分布片段的机制的饱和(数据未示出)。同时测量微生物丰度(图20b)使得能够通过组合使用丰度和片段长度谱测量结果来确定感染阶段。

测序数据还指示未通过执行的其它微生物测试正交确认的微生物的存在。在这些微生物的情况下,也可以研究片段长度分布。例如,通过所公开的方法分别在来自受试者rd-06和rd-13的入院样品中检测到流感嗜血杆菌和产黑普雷沃氏菌(图21a)。尽管正交检测到微生物,但是感染的推测的原因在两种情况下示出高短读段分数,另外的微生物示出可变趋势;流感嗜血杆菌片段长度分布与侵入性或菌血症感染一致,而产黑普雷沃氏菌仅示出存在峰化分布,这与无症状患者的感染的无形阶段或共生行为(参见例如,于2018年11月21日提交的题为“直接到文库的方法、系统和组合物”的美国临时申请第62/770,181号中的“幽门螺杆菌片段长度分布(helicobacterpylorifragmentlengthdistribution)”或管理的感染足迹一致。另外,在治疗过程期间新微生物可能会出现,并且片段长度分析也可能协助诊断这些的感染状态。例如,图21b示出了与鹑鸡肠球菌比对的读段的片段长度分布,所述鹑鸡肠球菌示出具有一串峰分数的短指数分布的读段的可检测分数。治疗此感染的决定可以基于短读段分数的幅度。对临床记录的检查确认了受试者确实进行了此感染的治疗。

最后,分析了随着在疗法期间所研究的受试者从在入院和诊断时感染的有症状阶段移动到感染循环并且到治疗感染阶段,人片段长度分布的变化。图22描绘了在此研究的受感染患者的人片段分布的主要三种行为模式:(1)长(主要核小体)人片段的分数在治疗期间降低(图22的左图,此研究中总受试者的37.5%);(2)长人读段的分数在治疗期间浮动(图22的中图,此研究中总受试者的37.5%);以及(3)长(主要核小体)人读段的分数在治疗期间增加(图22的右图,此研究25%中总受试者的37.5%)。如以上示出的,人片段长度分布形状和性质可以预测受试者的感染阶段。然后可以将衍生自人分布的参数与样品中检测到的感染微生物或其它微生物的片段长度组合使用,以预测受试者的恢复轨迹,例如受试者是否正在恢复,在对初始感染进行治疗期间,另一种微生物是否会感染受试者,或认识到无形感染或共生存在。

THE END
1.这几类常见的心血管病会遗传,基因检测和家系筛查怎么做对于检出临床意义未明的基因突变患者,应对其家庭成员进行基因检测,可帮助重新分类突变等级。对于已经报告的变异,应每2~3年重新进行其致病性评估。 HCM基因检测流程 (2)2019年《单基因遗传性心血管疾病基因诊断指南》 有30多个基因与HCM相关,10位点是明确致病基因,分别编码粗细肌丝和Z盘结构蛋白。携带≥2个肌小节致病...https://www.innomd.org/article/6285e61723ce96793bf50889
1.基因狗检测,解读犬类基因,探索宠物降管理新纪元基因狗检测,是一种基于犬类基因组的检测技术,通过对宠物狗的基因进行深度分析,旨在解读宠物的遗传密码,了解其遗传特征、潜在疾病风险等信息,这一技术的出现,为宠物主人提供了全新的了解宠物健康状况的途径,也为宠物健康管理带来了革命性的变革。 基因狗检测的技术原理主要依赖于基因组测序技术,通过对宠物狗的基因组进行...https://saishenxs.cn/post/5621.html
2.每日热点0504参考消息网5月3日报道 据英国《泰晤士报》网站5月2日报道,由于信息技术基础设施的失败加剧了等待革命性诊断技术的病例诊断工作积压,英国国民保健署(NHS)让一些患者等待遗传疾病检测结果的时间超过一年。 报道称,全基因组测序是一项新的医疗技术,在诊断罕见遗传疾病和癌症方面迈进了一大步。英国前卫生大臣马修·汉考克在...https://sccdc.cn/Article/View?id=27637
3.精心培育的柠檬霜壁虎,患上了皮肤癌……随后,团队对这些 “路牌” 进行了全基因组关联分析(Genome-wide association studies, GWAS)——这是鉴定人类遗传疾病的常用方法,能全基因组范围内找出存在的序列变异,通过统计学分析筛选出与疾病相关的单核苷酸突变位点。 在分析完柠檬霜的基因组之后,郭龙华团队大概找出了几十个可能跟柠檬霜突变体中白色斑点和肿瘤生...https://maimai.cn/article/detail?fid=1641963206&efid=RedLW-49HVwsCU_qp4l5fg
4.人类遗传病说课稿(通用6篇)如:第一小组调查的内容为:常见的多基因遗传病的发病率。第二小组调查的内容为:红绿色盲发病率的调查及遗传类型的分析。 我根据学生调查中的常见错误,列出第二个探究问题:先天性疾病和遗传病的区别? 让学生思考讨论,从而引出人类遗传病的概念,我引导学生经过激烈的小组讨论和总结发言,顺利得出人类遗传病是由遗传物质...https://www.360wenmi.com/f/fileo65q8gx5.html
5.PCR技术论文12篇(全文)通过对大量不同毒力新城疫基因核苷酸序列的分析,根据强弱毒株FO裂解位点的序列差异设计合成了3对引物,建立了快速诊断新城疫并能鉴别其强弱毒株的反转录一聚合酶链式反应,该方法具有快速特异和操作简便的特点,不仅适用于对鸡胚毒的检测,而且适用于对病鸡组织匀浆液的检测,是新城疫鉴别诊断和流行病学调查的颇具潜力的...https://www.99xueshu.com/w/ikeypfhl5j6q.html
6.如何寻找正规猫舍?含猫遗传病简单科普。【因为后院的品种猫很有可能混入了其他血统,导致hcm检测位点改变,我们测不出来!如果把串串缅因/布偶带回家,做了遗传病筛查之后就每年不做心超了,很有可能因此错过早期阶段无法控制酿成悲剧!】 为何强调要接正规猫舍的猫,正规猫舍为何要求五代血缘可溯,这并不是保证所谓的血统纯正,毕竟猫没有皇位要继承(?),而是因...https://www.douban.com/group/topic/207348956/
7.利用K均值聚类算法识别遗传疾病致病SNP位点[7]初芹,焦士会,王雅春,等.牛蜘蛛腿综合征两个致病位点检测方法的建立[J].遗传.2013,(5).DOI:10.3724/SP.J.1005.2013.00623. [8]Xiaojun Ding,Xuan Guo.A Survey of SNP Data Analysis[J].大数据挖掘与分析(英文).2018,(3).173-190. [9]王宇琛,赵诗瑶.具有遗传性疾病和性状的遗传位点分析[J].数学...https://d.wanfangdata.com.cn/periodical/jcst202012005
8.如何解读眼科遗传病基因检测报告检测结果及遗传解析:检查结果是上面检测报告中得到的基因突变位点,遗传解析分析致病基因的突变位点是否致病,参考已有的文献报告分析致病突变是否是导致先证者患病的病因。并在其后附上文献参考依据。患者如果仍旧有不明的地方可以继续到医生遗传门诊咨询。 疾病说明:介绍疾病的临床症状及发展趋势供患者了解。 https://sns.guahao.com/mip/topic/FVmCk124618554556350466
9.(风险管理)基因检测与疾病遗传风险评估(风险管理)基因检测与疾病遗传风险评估.doc 卓越管理| 7页|522KB|0次下载| 0.0 (0人评价) 我要评价: 用手机看文档 下载 开通VIP (风险管理)基因检测与 疾病遗传风险评估 座上存在很多基因类型,而每一个体基因型只能属于该基因的一种类型。 SNP作为基因多态性的最主要的形式,反映了个体与个体间的差异本质。https://doc.mbalib.com/view/5f976be328f36962501afb7a49ef3959.html
10.人类遗传病的DNA诊断学实现这个目标既不需要了解决定疾病表型的特异基因也不需要了解引起疾病的特定突变,而只需利用与决定表型的遗传位点紧密连锁的DNA标志。这些标志就是在近十年里被大量鉴定的DNA多态性,它们与引起单基因遗传病的已知和未知基因紧密连锁。因此,遗传病的DMA诊断可分为两大类:(1)直接检测分子缺陷;(2)利用DNA多态性作为...https://worldscience.cn/c/1990-07-25/636551.shtml
11.遗传病全外显子测序简介特色医疗医学遗传与罕见病中心基因检测是各类遗传病精确诊断、指导治疗、评估预后及疾病预防与控制的关键。全外显子测序(Whole-exome sequencing,WES)是目前临床应用频率最高的基因组测序方法之一。外显子是人类基因组的蛋白编码区域,利用序列捕获技术可以将其DNA捕获并且富集。虽然外显子区域仅占全基因组1%左右,却包含了85%的致病变异。相比全基因...https://m.samsph.com/department_gdwk1_tsyl/2021/Ddw8zXe1.html
12.关于印发《上海市新生儿遗传代谢病筛查技术规范(2024版)》的通知...诊断原则:(1)新生儿筛查阳性者,根据不同疾病选择相关的检测。(2)根据筛查指标异常程度,可只采血片复查,或进入确诊程序,进行相关实验室检测。(3)筛查阳性者经上述检测提示相应遗传代谢病,建议进行鉴别诊断和基因诊断,明确相关基因的致病性变异位点。(4)特异性生化指标显著异常者,即使没有基因检测结果,或基因检测未明确...https://wsjkw.sh.gov.cn/fybj2/20240511/2a906cbfa05e4241a2413d24e5c26cc8.html