主管:中华人民共和国教育部主办:四川大学主编:刘伦旭刊期:月刊ISSN:1007-4848CN:51-1492/R
将训练组524例LUAD样本的昼夜节律DEGs表达量和生存信息合并,剔除15例无总生存期(overallsurvival,OS)及生存状态的患者,余509例LUAD样本依次纳入Cox回归和3种机器学习算法[最小绝对收缩和选择算子(LASSO)回归、支持向量机递归特征消除(SVM-RFE)、随机森林]。选择4种算法计算DEGs的交集基因,最终构建风险评分(RiskScore)预测模型。RiskScore预测模型计算公式:RiskScore=Exp1×C1+Exp2×C2+…+Expn×Cn(Exp为预后特征基因的表达量,C为LASSO回归分析得到的回归系数,n为交集基因的数目)。
根据上面的公式计算每例样本的RiskScore,以RiskScore中位数为截断值将LUAD样本分为低风险组和高风险组,P≤0.05为差异有统计学意义。
a:GO分析,对前10个富集类别(生物过程、细胞成分和分子功能)进行可视化;b:KEGG分析,显示前9个富集通路;c:PPI网络构建,基于PPI网络的前46个节点差异表达基因,使用Degree算法选择基因,颜色越深表示基因关联的节点越多;PPI:蛋白质相互作用网络
a:预测肺腺癌患者1、3、5年OS率的列线图;b~c:分别为列线图在训练组和验证组中预测1、3、5年OS率的校准曲线;d:列线图预测1、3、5年OS率的ROC曲线;OS:总生存期;ROC:受试者工作特征
a:GSE149655单细胞的组成和分布;b:细胞标记基因鉴定细胞类型;c:7个昼夜节律基因的表达谱
综上所述,本研究通过Cox回归和3种不同的机器学习算法构建了准确有效的7个特征昼夜节律基因预后模型。基于该7个基因的RiskScore模型可预测LUAD患者的OS。将RiskScore和临床参数相结合的列线图可用于预测LUAD患者1、3、5年OS率,其有助于LUAD患者的预后和随访监测,为LUAD患者的个体化诊疗提供参考。但本研究仍存在一定的局限性。首先,我们的研究数据主要来自TCGA和GEO数据集,有必要在大型独立临床队列中评估其预测效能。其次,我们缺乏深入的研究,特别是没有设计基因组定向分层实验。最后,这7个基因在LUAD发病中的生物学机制有待进一步通过功能研究来具体阐明。
利益冲突:无。
作者贡献:崔严奇、赵虎和张亚伟负责病例筛选,数据整理与论文设计,初稿撰写等;曾志勇、倪琳、连铎煌、杨鲸蓉、叶仕新、许蜂蜂和张锦灿负责论文审阅与修改。