近日,《NatureGenetics》杂志发表的一项研究,结合人工智能技术,第一次证明了非遗传性的非编码DNA突变可能是导致自闭症的病因。
以往,人们对于自闭症和其他疾病的基因组测序研究,主要集中在基因组可编码蛋白质的部分。然而,这一部分仅占人类基因组的2%,剩下98%的基因组为非编码区域,既无法转录为信使RNA(mRNA),也不能指导蛋白质合成,曾被认为是“垃圾DNA”。近年来,随着对基因组的研究不断深入,人们发现“垃圾DNA”并非“垃圾”。
关于“非编码DNA突变可能导致遗传性自闭症风险”的最早研究,来自美国加州大学圣地亚哥分校。研究人员发现,新生基因突变(denovomutation)只能解释约1/3的自闭症谱系障碍病例,其他的风险可能解释为:非编码DNA的罕见遗传变异。他们把研究内容发表在2018年4月的《Science》杂志上。
随后,研究人员对近2000个家庭进行了全基因组测序研究。结果发现,自闭症儿童比他们的兄弟姐妹在启动子区(非编码区)具有更多的新生突变,而非父母遗传。这暗示了非编码区域的新生突变可能是自闭症的病因。
他们通过训练人工智能学习模型,来预测给定序列如何影响基因表达。他们分析了1790名自病症患者和他们并未患病的父母及其兄弟姐妹的全基因组。之所以选择这类人群,是因为他们患自闭症属于新生突变,与遗传无关。
接下来,研究人员将继续改进和更新人工智能的预测方法。他们希望在分析自闭症的病因之后,进一步改善遗传数据在自闭症诊断和治疗中的应用,重新思考这98%的“垃圾”基因能做些什么。
THE END