精准肿瘤学的关键目标是改善癌症的诊断和治疗。而对肿瘤样本的一系列基因组和其它分子分析能够帮助发现标志物来帮助选择疗法,预测预后,跟踪肿瘤进化,以及发现不同转移性疾病的分子特征。基于下一代基因组测序(NGS)的分子分析方法已经在肿瘤分析方面得到应用,而综合DNA、RNA、蛋白质和表观遗传特征的多参数综合分析可能更准确地描述肿瘤特征并且帮助发现全新成药靶点。
ctDNA作为生物标志物的利与弊
ctDNA检测是目前市场上最常见的液体活检形式,它在具备巨大潜力的同时,在检测开发和临床应用的推广方面也面对着一系列挑战。
ctDNA作为精准肿瘤学生物标志物的潜力
研究表明,ctDNA可能由凋亡细胞释放,因此,它只代表了肿瘤细胞的一种特定亚群。尽管如此,ctDNA具有多个优点:
1.它能够提供对肿瘤基因组的综合描述,因为ctDNA从多个不同肿瘤区域或多个病灶处释放,ctDNA分析可以发现组织活检中无法发现的体细胞突变。
2.深度测序可以发现肿瘤内异质性和只在部分细胞中出现的基因突变。这通常需要大量的CTCs或者多次组织活检才能获得同样水平的信息。
3.ctDNA可以提供肿瘤大小的信息,从而反映出疾病的发展状态和对疗法的反应。研究发现,在非小细胞肺癌(NSCLC)和高级别浆液性卵巢癌(HGSOC)中ctDNA的突变等位基因频率(VAF)与肿瘤体积呈线性关系。
4.ctDNA还具备预测预后的价值。例如,在旨在治愈的手术或化疗之后,ctDNA的出现是癌症复发和不良预后的有力标志。它预测癌症复发的能力在结肠癌、卵巢癌、肺癌和乳腺癌患者中都得到了验证。
5.ctDNA分析能够发现肿瘤抗性的标志物,例如,在接受抗EGFR疗法的结直肠癌患者中出现的KRAS突变,以及在乳腺癌患者中的PIK3CA、MED1、或EGFR上VAFs的升高。
这些优点让ctDNA成为精准肿瘤学应用方面前景看好的分析物。然而ctDNA检测也需要克服血浆中ctDNA水平过低,细胞衰老带来基因变异的影响等挑战。
血浆中低水平ctDNA带来的挑战
在血浆cfDNA中检测到基因突变的能力与肿瘤负担有对应的关系。但是在不同患者身上的ctDNA水平可能相差很大,虽然他们患上同样类型的癌症。即使是在转移性癌症患者中,也有很大一部分患者血浆中ctDNA的比例异常的少。这清楚地表明,除了肿瘤负担以外,还有其它生物因素影响肿瘤DNA的释放。
据估算,1毫升血浆中含有大约1500个基因组当量(GE)的DNA片段,通常一次10毫升抽血可以从血样中获得4毫升血浆,意味着能够获得6000GE的DNA片段。在VAF为0.1%的情况下,在这6000GE的DNA片段中,平均只有6个DNA分子携带着想要检测到的基因突变,而且随机取样可能会影响这一数值。因此,可靠、准确并且可重复地检测到这些基因突变是一个严峻的挑战。
检测低水平ctDNA的方法
如果增加血样体积,可以检测到的分子数目自然会显著上升,但是多抽血的办法通常在晚期癌症患者中无法实现。另外一种克服携带基因突变的分子数目过少的方法是同时检测多种基因突变,然后确定一个基因突变数目的最低阈值来决定血浆样本是否为肿瘤阳性。例如,有的液体活检可以同时检验患者是否携带18种单核苷酸位点变异(SNV),如果检测到的SNV数目超过2个,则将ctDNA样本定义为肿瘤阳性。
近年来ctDNA检测技术的开发主要聚焦于增强测序技术的分析敏感度。测序技术的敏感度会受到测序准确性和测序深度的影响。通过使用分子条形码标记被测序的DNA片段,可以提高测序的准确性,从而提高发现基因突变的几率。
另一种提高敏感度的尝试是富集特定长度的ctDNA片段。有研究表明ctDNA片段(132-145个碱基对)通常比健康细胞释放的cfDNA片段(~166碱基对)小。因此,富集特定大小的DNA片段进行测序可能提高发现基因突变的敏感度。
细胞衰老对ctDNA检测的限制
虽然这些技术的进步能够改善发现低VAF基因突变的能力,但是衰老细胞积累的体细胞突变也会对ctDNA的实用性添加限制。其中一个重要的干扰因素是良性体细胞基因突变随着细胞衰老而增加。在******干细胞中出现的良性基因突变会随着细胞增殖传给下一代,有的时候在肿瘤驱动基因中出现的基因突变会导至携带这些突变的干细胞增殖速度更快,这可能被误认为肿瘤增生。因此,在肿瘤驱动基因中发现基因突变并不等同于发现癌症。
ctDNA检测的分析效度和临床有效性仍需确认
在临床护理中采纳肿瘤生物标志物检测的原则有三条:1.分析效度(analyticalvalidity),指的是检测的准确性、可靠性和可重复性;2.临床有效性(clinicalvalidity),指的是检测能够把患者分为不同群体,而且这些群体会有不同临床后果的能力;3.临床实用性(clinicalutility),指的是接受检测的患者的临床后果与未接受检测的患者相比,是否有所改善。
目前,市场上的ctDNA检测的结果一致性和临床有效性还未得到完全确认。有研究使用两种不同的ctDNA检测方法对同一批样本进行检测,试验结果表明,在34个接受检测的样本中,只有9个样本在两种ctDNA检测中给出了完全一致的结果。这种数据让人对这些检测的分析效度和临床有效性产生疑虑。目前,业界需要进行多中心研究,使用足够大的患者群来确认ctDNA检测的分析效度和临床有效性。
而且,检测的标准操作程序和指导需要得到统一。欧洲标准化委员会(CEN)已经发布了处理和纪录用于ctDNA分析的血样的标准程序。其它国际组织也在致力于将液体活检的流程标准化。如果想将基于NGS的液体活检在临床中广泛推广,它们必需接受完备的检验并且通过基于确认标准的质量检测。
新兴的液体活检分析方法
以精准肿瘤学的需求来看,现有的液体活检技术还存在很多不足。但通过扩大信息获取与检测的范围,我们有望实现液体活检技术的真正潜力。在这一段中,我们也将介绍目前新兴的一些液体活检方法。
1.组织与癌症特异的DNA甲基化模式分析
2.核小体位置分析
3.miRNA分析
4.分析细胞外囊泡的转录组和基因组
细胞外囊泡是核酸与蛋白质的载体,在细胞与细胞,乃至器官与器官间的交流中起到了重要作用。从运输能力上看,细胞外囊泡最多能运载近100个蛋白质和约10kb长的核酸。在核酸方面,miRNA大约占了40.4%,piwi-互作RNA占了约40%,剩下的则是假基因(pseudogenes),lncRNA,tRNA,以及mRNA。这些RNA分子中的信息有望用于确认癌症起源,做出早期诊断。除了核酸分子外,细胞外囊泡上的一些粘附分子(如整合素)也能用于推断器官特异的癌症转移。
值得一提的是,外泌体(exosome)可以由活性癌细胞直接分泌。与ctDNA进行配合,可以从多个角度展示肿瘤的生物学特征,做出更准确的诊断。当然,健康组织也会分泌大量外泌体,其中的遗传物质也会带有变异。因此在临床应用上,我们还需要更好地对外泌体的行动进行追踪。
5.经过肿瘤“教育”的血小板
6.蛋白质分析
细胞的正常运作离不开蛋白质,而许多疾病的根源正是蛋白质的突变。然而除了PSA(前列腺特异抗原)外,目前临床上我们能使用的蛋白标志物少之又少,且大多无法区分其来自哪些组织或癌症。蛋白质组学的蓬勃发展给了人们契机,让我们建立了高质量的蛋白关联性图谱。目前,我们已经可以利用这些技术,明显提高液体活检在早期癌症中的检测率。
7.代谢物分析
肿瘤的生长发育往往会影响到人体生理上的变化,尤其是全身的代谢状况。对于肿瘤来说,它们能肆意改变自己的代谢通路,而血液中的代谢产物可能会成为有用的癌症标志物。目前比较为人熟知的一个案例是BCAA,它能预示肿瘤发育早期对代谢调控的干扰——胰腺癌的发病早期,BCAA水平会有所上升。而在非小细胞肺癌里,BCAA的水平则会下降。这些结果表明代谢物的组成可能成为液体活检的重要部分。
8.活性循环肿瘤细胞分析
近年来,单细胞分析技术有了飞跃式的发展,这也让科学家们得以更为详细地分析循环肿瘤细胞内的基因组、转录组、蛋白质、以及表观遗传组信息。其中,来自活性循环肿瘤细胞的信息对于评估癌症转移有着重要的作用。除此之外,这些细胞也能被用来建立患者特异的肿瘤模型。但首先,我们还需要解决不同癌症种类中循环肿瘤细胞的丰度问题。比如非小细胞肺癌就很少会带来循环肿瘤细胞。
液体活检技术面临的挑战
任何一项技术在刚刚迈入应用之际,总是充满了挑战,液体活检也不例外。尽管有多种新兴分析方法不断涌现,但这一技术的发展前方依旧充满挑战。
1.真正理解血浆成分
关于液体活检最大的争议之一,在于我们是否真正了解了血浆成分。举例来讲,过去人们认为ctDNA主要来自凋亡的癌细胞,但最近对ctDNA的一些分析却找到了一些和癌细胞增殖有关的变化,刷新了认知。因此为了更好地理解细胞如何将DNA释放到循环系统中,我们还需要更深入地了解健康人与癌症患者中,血浆的组分与各个组织之间是怎样的一个关系。截止到目前,我们做的还非常不够。
2.液体活检与免疫肿瘤学
液体活检与免疫肿瘤学的交织,是最近的研究热点之一。当循环肿瘤细胞离开原发肿瘤之后,就会暴露在免疫监控之下。因此,它们也需要一定的免疫逃逸机制才能生存。目前我们已经知道,这些循环肿瘤细胞有能力改变自己的MHCI呈递、改变NK细胞配体表达、或是下调FAS/FASL的表达。理解这些变化,有助于免疫肿瘤学的发展。
通过对循环肿瘤细胞进行液体活检,还能带来实际的应用价值。最近,人们通过抗PD-L1抗体,发现在这些细胞上也有PD-L1的表达。这些信息可以用于患者细分。
此外,我们还能通过分析ctDNA里的肿瘤突变负担(TMB),了解检查点抑制剂的潜在效果。这是因为TMB越高,产生新抗原的几率就越高。一些研究也表明,TMB能用来找到哪些患者在免疫疗法的治疗后,在临床上能有更好的预后。
3.对多种参数的测量与整合
如果要给液体活检展望一下未来,成功检测最小残留病灶可以说是一个目标。最终,我们希望能在早期对癌症进行诊断。要实现这些目标,有时我们只需要检测一个指标就够了。最近,2017年药明康德生命化学研究奖得主卢煜明教授领衔的一支团队发现,只要在外周血液里检测Epstein–Barr病毒的DNA,就能筛选出早期的鼻咽癌患者。许多专家认为这项研究堪称是里程碑。
但更多的情况下,一个指标是远远不够的。在涉及多个指标的案例中,我们还需要考虑参数整合的问题。在最早的一些尝试中,人们主要综合的是ctDNA与蛋白标志物。举例来说,CA19-9、TIMP1、以及LRG1等蛋白标志物,辅以对KRAS基因突变的检测,能够找到肿瘤可切除的前列腺癌患者,且检测率要高于只使用ctDNA的方法。
尽管如此,研究人员们依旧指出,通过整合不同标志物的分析结果,液体活检的潜力看好。在前列腺癌与胰腺癌的诊疗上,我们已取得了一些可喜的进展。
4.机器学习遇上液体活检
人们也意识到,综合考量多种指标需要较高的计算能力,而机器学习算法则有望自动发现和检测癌症特异的指标,助力液体活检。这可能涉及简单的逻辑回归,也可能涉及复杂的多层人工神经网络。
事实上,机器学习技术已经在液体活检中取得了一些成绩。比如利用深度学习的方法,我们能以更高的灵敏度和特异性去探测循环肿瘤细胞;用基于神经网络的miRNA分析,我们可以区分健康女性和罹患卵巢癌的女性,特异性达100%。
但目前利用机器学习算法的最大短板,在于独立观察数据的不足。该综述指出,目前患者的样本量一般在几十到几千之间,而按碱基的分辨率计算,单名患者就可能产生数百亿的数据。在理想的情况下,设置机器学习算法时,前者应比后者的数量来得更多。比如经典的图像处理AI,处理的样本高达数百万,而潜在的分析特征只有几千,两者的数量级之间有着明显的差距。在数据不足的前提下,机器学习算法可能会出现过度拟合。它能很好地解释训练数据,但无法用于新的数据。
结语和展望
液体活检在肿瘤学方面的应用日益增多。然而,我们需要对液体分析物的产生机理和水平动态进行更深入的了解,同时需要确认液体活检的临床有效性和临床实用性,这样才能进一步推广液体活检的临床应用。
目前,大多数检测都只聚焦于一种分析物,然而将血液中存在的多种分析物的数据综合起来构成的多参数检测可能大幅度改善检测的精确度和使用范围。这些检测技术的开发需要使用创新统计工具,它们能够使用多维机器学习方法来整合从一个样本中获取的大量数据。
因此,未来的液体活检研发将横跨多个学科,包括基础生物学和生理学、分子生物学、检测技术、统计学和机器学习。非常关键的一点是,只有当液体活检的临床有效性和临床实用性得到证明之后,这项技术才能发挥它全部的潜力,为基因组驱动的肿瘤学和癌症患者的临床管理带来重大影响。