图1:Malinois模型精准预测CRE在表观报告基因中的转录激活
在Malinois模型构建完成后,研究者开发了一个名为CODA的设计平台。CODA通过一系列优化算法(如进化算法、模拟退火和梯度优化),从模型预测的最佳序列中筛选出具有特定细胞类型特异性的CRE。这一步的输出了数千个合成CRE序列,那么这些序列是否具有功能呢?通过MPRA测量CREs在不同细胞类型中的活性,研究者观察到合成序列在细胞特异性上优于天然序列。此外,FastSeqProp方法生成的合成CRE在目标细胞中的表达活性最强,并在非目标细胞中的抑制效果最佳。
图2:CODA高效设计细胞类型特异性CREs
为了进一步评估合成CREs在复杂生物系统中的表现,研究者在斑马鱼和小鼠模型中部分验证合成CREs。结果显示,合成CRE在斑马鱼的肝脏和神经系统中表现出目标细胞类型的特异性表达,而在小鼠的皮层中也能保持神经元特异性。
图3:合成元件的体内验证:结合神经元(NeuN)、小胶质细胞(IBA1)和星形胶质细胞(GFAP)的免疫共染色观察CRE活性(LacZ)在新皮层第6层的表达情况
综上所述,通过深度学习驱动的CODA平台能够高效地生成合成CREs,展现出优于天然CRE的细胞类型特异性。该技术在基因治疗等需要精准组织递送的领域中具有重要应用前景。随着该领域技术的进步,未来有望进一步优化CRE设计,适应更复杂的基因调控需求。
制版人:十一
参考文献
1.Meuleman,W.etal.IndexandbiologicalspectrumofhumanDNaseIhypersensitivesites.Nature584,244–251(2020).
2.Tewhey,R.etal.Directidentificationofhundredsofexpression-modulatingvariantsusingamultiplexedreporterassay.Cell165,1519–1529(2016).