精工致善丨多元统计分析之PCAPLSDAOPLSDA

精工致善丨多元统计分析之PCA、PLS-DA、OPLS-DA

什么是PCA,PLS-DA、OPLS-DA?

◆主成分分析(PrincipalComponentAnalysis,PCA),将多个变量通过线性变换以选出较少个数重要变量的无监督分析方法,是一种多变量统计分析方法,又称主分量分析。可以初步了解各组样本之间的总体代谢物差异和组内样本之间的变异度大小,并可通过分析QC样本进行质量控制。

◆偏最小二乘法判别分析(PartialLeastSquaresDiscriminationAnalysis,PLS-DA)是一种有监督的判别分析方法,是多变量统计分析方法。判别分析是一种根据观察或测量到的若干变量值,来判断研究对象如何分类的常用统计分析方法。PLS-DA能按照预先定义的分类(Y变量)最大化组间的差异,获得比PCA更好的分离效果。

如何进行PCA,PLS-DA、OPLS-DA分析?

1.进入在线分析软件

2.上传数据

数据类型选择浓度;数据格式选择样品在每一列(未配对),可根据实验数据实际情况选择样品在每一行或是每一列、配对或未配对实验;选择上传的文件,提交即可。

2.1上传文件格式说明

①有样本名和样本分组信息,文件格式需为制表符分割的TXT文件或逗号分割的CSV文件。

②靶标中不能有希腊字母α、β等,用alpha、beta等替换。

示例1:

2.2检查数据格式

检查数据格式,是否有非数值数据、缺失值或其它特殊字符和标点符号,默认将缺失值及零值替换为其对应变量的最小正值的1/5。

3.数据处理

3.1选择分析项目

4.图形解读

①PCA图形解读

碎石图(screeplot)即贡献率图,是希望图形一开始很陡峭,如悬崖一般,而剩下的数值都很小,如崖底的碎石一样。显示各主成分的特征值贡献率。如图中显示PC1贡献率为74.2%,PC2贡献率为11.1%...

PCA得分图有二维和三维两种展示形式,在二维得分图中横坐标PC1表示第一主成分,纵坐标PC2表示第二主成分,百分比表示该主成分对数据集的解释率,圆圈表示95%的置信区间;图中的每个点表示一个样品,同一个组的样品使用同一种颜色表示,Group为不同的分组;PCA得分图可以让我们非常直观地看出各个样本之间的相似性。例如在一张PCA得分图中,数个样本的点聚在一起,那么就说明这几个样本之间的相似性非常高,反之,如果几个样本的点非常分散,则说明这几个样本之间的相似性比较低。还可以看出组间是否有差异、QC样本是否稳定。

第一、二、三主成分3D绘图在三维得分图中,增加了第三个主成分,此时X轴表示PC1,Y轴表示PC3,Z轴表示PC2。

②PLS-DA图形解读

VIP(VariableImportanceinProjectionscores)变量重要性投影,通过变量投影重要度衡量各代谢物组分含量对样本分类判别的影响强度和解释能力,辅助标志代谢物的筛选。通常以VIP值>1作为筛选标准。

模型验证permutationTest图的横坐标表示模型的准确率,纵坐标表示100次permutationTest中100个模型的准确率的频数,箭头表示本PLS-DA模型准确率所在的位置。

③OPLS-DA图形解读

横坐标表示OSC过程中的主要成分的得分值(Tp),所以从横坐标的方向可以看到组间的差异;纵坐标表示OSC过程中的正交成分的得分值(TO),所以从纵坐标上看出组内的差异(组内样本间的差异)。

模型验证permutationTest图的横坐标表示模型的准确率,纵坐标表示100次permutationTest中100个模型的准确率的频数,箭头表示本OPLS-DA模型准确率所在的位置。其中R2X和R2Y分别表示所建模型对X和Y矩阵的解释率,Q2表示模型的预测能力,理论上R2、Q2数值越接近1说明模型越好,越低说明模型的拟合准确性越差。通常情况下,R2、Q2高于0.5较好,高于0.4即可接受。

从图中可以看出Q2为0.994,R2Y为1,R2X为0.685,Q2和R2Y的P值均小于0.01,说明permutationTest中随机分组模型没有结果优于本OPLS-DA模型,一般情况下P<0.05时模型最佳。

5.绘图平台

MetaboAnalyst是一个代谢组学数据分析的综合平台。在当前的MetaboAnalyst(V5.0)支持原始MS光谱处理、综合数据归一化、统计分析、功能分析、荟萃分析以及与其他组学数据的综合分析。

THE END
1.SiemensMedicalSolutions旗下X射线设备类产品获FDA批准,注册证...产品详情:Siemens Symbia Pro.specta VA30A Family系列包括单光子发射计算机断层扫描(SPECT)扫描仪和集成式混合 X 射线计算机断层扫描(CT)与 SPECT 扫描仪。SPECT 子系统可对放射性药物在人体内的分布情况进行成像和测量,以确定代谢活动位置附近的各种代谢(分子)和生理功能。CT 组件通过计算机重建以不同角度拍摄的同一...https://www.vbdata.cn/intelDetail/627994
2.单组学的多变量分析2.稀疏偏最小二乘判别分析(sPLS在前三个维度上的样本图(见下图)显示,第一个维度很好地分离了BL肿瘤,而第二个维度将EWB与NB和RMS区分开来。 plotIndiv(splsda.srbct, comp = c(1,2),group = srbct$class, ind.names = FALSE,ellipse = TRUE, legend = TRUE,title = 'sPLS-DA on SRBCT, comp 1 & 2') ...https://developer.aliyun.com/article/952974
3.单组学的多变量分析2.稀疏偏最小二乘判别分析(sPLSDA)在前三个维度上的样本图(见下图)显示,第一个维度很好地分离了BL肿瘤,而第二个维度将EWB与NB和RMS区分开来。 plotIndiv(splsda.srbct,comp=c(1,2),group=srbct$class,ind.names=FALSE,ellipse=TRUE,legend=TRUE,title='sPLS-DA on SRBCT, comp 1 & 2') ...https://www.jianshu.com/p/5e9e6dee9e29
4.矩形连接器DA2P1S矩形连接器DA-15PHS 矩形连接器DA-15PJS 矩形连接器DA-15PL 矩形连接器DA-15PL-13 矩形连接器DA-15PL-7.19 矩形连接器DA-15PLS 矩形连接器DA-15PS...矩形连接器DB-44SPLS 矩形连接器DB-5P-5d 矩形连接器DB-5p-5dS 矩形连接器DB-5PL-5dLS 矩形连接器DB-5S-5d 矩形连接器DB-5S-5dS 矩形连接器DB-5S...https://m.dzsc.com/product/infomation/869479/20125259121850.html
5.《金融时间序列》课件.ppt(SPLS) freq: Unknown (0) dates: (2) OPEN: (2) HIGH: (2) LOW: (2) 08-Apr-1996 [ 19.5000] [ 19.7500] [19.2500] 09-Apr-1996 [ 19.7500] [ 20.1250] 5.1.2 文本文件的转换 例:创建—个包含小时数据的金融时间序列对象 dates = [01-Jan-2001;01-Jan-2001; 02-Jan-2001; 02-Jan-2001...https://max.book118.com/html/2018/0904/5240004312001312.shtm
6.厦门杂志期刊论文发表=样基因整合了春化和植物年龄,以控制小麦的...在VRN1(vrn1)中具有功能丧失突变的植物不能抑制VRN2表达,并且具有非常延迟的头部[41](图2J)。vrn1 vrn2突变背景中VRN2的消除加速了开花过渡[41](图...miR156-SPLs和miR172-AP2Ls是植物中的两个保守的miRNA模块,它们在芽中与植物年龄一起表现出互补的表达模式[78,82,83]。结果显示,miR156和miR172在春小麦...https://www.lunwen133.com/html/2022/a_lwfbfw_0501/480.html
1.LT3600SPlus激光粒度仪产品介绍 LT3600S Plus激光粒度分析仪是真理光学基于超过二十年的粒度表征及应用开发的经验和多年的科研成果开发的具有极高性价比的新一代超高速智能激光粒度分析系统,其多项性能和指标均达到目前激光粒度分析技术的最高水平,成为化工、制药、电池、水文地质、矿业、水泥、涂料、稀土、**航天、墨粉、3D打印和粉末快速成...https://www.5wykqmrna.cn/cai-dian/403760.html
2.Arthritis&Rheumatology︱张晓明课题组揭示高致死性无肌病性...A. ADM-ILD患者与健康对照外周免疫细胞谱sPLS-DA比较图;B. ADM-ILD患者与健康对照外周CD45RA+HLA-DR+ CD8+T细胞和浆细胞百分率比较图;C-D. ADM-ILD患者外周免疫细胞谱内部分群sPLS-DA图(C)和主要差异亚群(D;E. ADM-ILD Cluster1和Cluster2患者预后曲线图。 https://pasteur.suda.edu.cn/a5/2c/c15962a501036/page.htm
3.科研Nat.Commun.:慢性阻塞性肺疾病患者肠道菌群及其代谢组...图7 肠道菌群与COPD在独立队列中的关联 a多元稀疏偏最小二乘判别粪便微生物组基因组水平上基于读取映射的相对丰度分析;b与(a)中sPLS-DA的成分1分离有关的基因组。 #表示与临床表型相关的基因组;^表示疾病相关网络中的基因组 讨论 作者通过对COPD患者的肠道微生物群和代谢组分析,发现稳定期COPD患者的粪便微生物组...http://www.360doc.com/content/21/0419/19/74853867_973115565.shtml
4.SparsePLSdiscriminantanalysis:biologicallyrelevant...We will first discuss the number of dimensions to choose in sPLS-DA, and compare its classification performance with multivariate projection-based approaches: variants of sLDA [41], variants of SPLSDA and with SGPLS from [30]; and with five multiclass wrapper approaches (RFE, NSC, RF, OFW-...https://bmcbioinformatics.biomedcentral.com/articles/10.1186/1471-2105-12-253
5.PLSDAvssparsePLSAbstract Conventional and sparse partial least squares-discriminant analysis (PLS-DA and sPLS-DA) have been successfully tested in order to authenticate avocado samples in terms of three different geographical origins and six kinds of cultivar. For this, lipid chromatographic fingerprints of different ...https://www.ncbi.nlm.nih.gov/pubmed/33379108
6.StatisticalApproachestoStudyExposomeSparse partial least-squares regression (sPLS) performs both variable selection and dimension reduction simultaneously.(7)sPLS is an extension of the partial least-squares regression─a supervised dimension reduction technique that builds latent variables as linear combinations of the original set of variab...https://pubs.acs.org/doi/10.1021/acs.est.3c04805
7.植物SPL转录因子的生物功能研究进展图1 MicroRNA对SPLs基因的转录调控示意图 SBP: SQUAMOSA启动子结合蛋白; NLS: 核定位信号; RISC: RNA诱导沉默复合体 Figure 1 Schematic diagram of transcriptional regulation of SPLs by microRNA SBP: SQUAMOSA promoter binding protein; NLS: Nuclear localization signal; RISC: RNA-induced silencing complex ...https://www.chinbullbotany.com/CN/article/downloadArticleFile.do?attachType=PDF&id=97784
8.FrontiersUnveilingthePathogenicBacteriaCausing...Sparse partial least squares discriminant analysis (sPLS-DA) (Hadj-Henni et al., 2021) aims to identify the key colonies that best distinguish between the two groups of samples, using the mixOmics package (Rohart et al., 2017) in the R language program for statistical analysis and graphing....https://www.frontiersin.org/journals/cellular-and-infection-microbiology/articles/10.3389/fcimb.2022.873161/full