关键在于观测的结果是否具有变异性,若对每一个正常人观测其有多少个手指,只需观测一个人即可,因为每个正常人的手指都有10个,它是一个不具有变异性的定量指标。若对每一个正常入观测其血小板的含量是多少,仅观测一个人就作出关于正常人血小板含量为多少的结论显然是可笑的,因为每个正常人血小板含量是不尽相同的。只有观测了大量正常人血小板的含量后,其取值规律性才有可能表现出来,初步的印象是取值接近该组被观测的全部受试者算术平均值的人较多,取值偏离此均值较远的人较少,取值特别小和特别大的人就吏少了。即便这样一种非常简单的规律,也只有在进行了大量重复实验之后才能够表现出来。
例1两台仪器测定结果之间的差异性研究
有人为了说明某两台仪器测定的结果之间的差别没有显著意义,选择一个健康人作为受试对象。先用A、B两台仪器分别对该人重复测4次。一个月后再用A、B两台仪器分别对该人重复测4次。测定的定量指标有3个,其中有一个指标是「二尖瓣前叶EC幅度」,每一个指标共获得16个数据。然后对这些数据进行方差分析和t检验,得出两台仪器测定的结果之间的差别无显著意义的结果,其专业结论是可用「自制的廉价仪器A」取代「进口的昂贵仪器B」。
对差错的辩析与释疑
此人将「重复取样」、「重复测量」与「独立重复实验」混为一谈。
在本例中第一次测定之后,对受试者没有什么影响,间隔1个月后冉对此人进行测定,仅仅反映了指标的生理变化,没有任何实际意义。在本例中尽管每个定量指标有16个原始测定值,但真正的样本大小n还应该等于「1」,即独立的受试对象的个数。
例2甲紫注入小型猪正常腮腺后组织病理变化情况研究
有人选择6月龄、体重20~25kg的中国实验用小型猪15只,雄性9只、雌性6只。每只动物任选一侧腮腺为实验侧,另一侧作为正常对照,以消除个体差异及增龄对实验结果的影响。按注入甲紫后1周、2周、1个月、3个月及6个月将15只动物随机分为5组,每组3只(每个组的3只动物分别随机注人0.6ml、1.0ml及4.0ml的1%甲紫溶液),然后观察组织病理变化情况。试问此项实验研究中违背了实验设计的什么原则?
那么各小组究竟应该用几只动物合适呢?严格地说,需要根据预实验或文献资料提供的信息,结合研究者对实验精确度的要求,并根据拟采用的实验设计类型,按估计样本大小的相应公式计算为宜。
例3PCR快速检测冠状病毒的研究
新华网北京2003年4月17日电(记者XXX):卫生部医药生物工程技术研究中心与广州市疾病控制中心科技人员合作,已成功建立荧光定量PCR快速检测冠状病毒的新技术。这一技术是卫生部、科技部「非典型肺炎防治紧急科技行动」成果的一部分,有望为非典型肺炎的早期快速诊断提供可靠的实验诊断指标。
卫生部医药生物工程技术研究所XXX教授17日在向新华社记者介绍这项成果时说,运用这项新技术,从采取病人样品到报告结果可在2小时内完成,能够实现对病毒基因的准确定检测,可反映疾病的发生、发展过程。PCR是一种体外基因复制技术,可在几小时或几十分钟内把基因扩增到数百万倍以上,使基因便于检测。XXX教授说,通过对广州市疾病控制中心提供的4例患者培养物和嗽口液均检测出冠状病毒核酸,而3例确诊不是非典病人的样品均未检出。另外,30例健康人的嗽口液全部未检出冠状病毒核酸,经过对4例冠状病毒阳性样品基因扩增片段测序结果分析,与加拿大和美国公开发表的冠状病毒基因序列比较同源性为100%。
众所周知,PCR检测的结果并非100%准确,也就是说,在其检测结果中可能会出现假阳性和假阴性的结果。既然如此,就不应将PCR检测的结果视为「确定性现象」,而是一个「随机事件」,欲反映随机变量的变化规律性就必须做大量的重复试验,才有可能显示出其变化规律性。
仅检测4例非典病人的样品和3例疑似并最后确诊为不是非典病人的样品,就对此检测方法的准确性给予充分的肯定,是很不科学的态度,其结论的可信度较低。笔者曾处理过一份类似的实验资料,用PCR检测115份非典病人的样品,检测出冠状病毒为阳性的样品数为100份,即该方法的阳性检出率约为87%(100/115)。
例4维甲类化合物Ro13-7410对HL-60细胞凋亡及分化诱导作用
对差错的辨析与释疑
例5重量法测定血苯-白蛋白加合物的初步研究
用气-质联仪(GC-MS)测定血液中的苯-白蛋白加合物,由于采用昂贵的仪器和同位素内标物,在一般实验室难以进行。本研究采用重量法测定,并与GC-MS法进行比较,同一标样用GC-MS法测3次,重量法测7次,分别为1.9±0.1(mg/ml)和2.0±0.1(mg/ml),经t检验,平均值之间差异无显著意义(P>0.05)。
差错的辩析与释疑
应根据专业知识合理确定标样的浓度范围,选定多个标样用目前被公认的测定方法和重量法同时进行测量,并选用合适的统计分析方法(如直线回归分析,其零假设与备择假设分别为总体斜率β=1与β≠1,而不应采用对均值进行假设检验的t验),这样才能推论两种方法测量结果是否具有一致性。
例6不合格采样及送检导致生化指标波动原因的探讨
原作者所说的「用病房病人2次结果比较」这句话很含糊,这里的「2」代表什么含义不清楚,容易使人理解为n=2。第1个因素含有2个水平,即同侧采血与异侧采血,仅用2次不同采血检测结果的变化率说明差异,实验次数太少不能说明两种采血方式是否有差异。第2个因素也含有2个水平,即溶血样本和正常标本,同样也用2个样本检测结果的变化率说明差异,实验次数太少不能说明两样本检测结果有差异还是没差异。第3个因素含有3个水平,即抽血后立即送检、1h后送检、2h后送检,仅用1个样本检测结果的变化率说明差异是没有说服力的。第4个因素含有2个水平,即血清管和枸橼酸钠管,是用5例病人使用不同采样管检测结果的变化率来说明差异的,数据个数虽不算太少,但未对数据进行统计学处理,是不便作出任何肯定或否定结论的。
化验室检测结果不同与送检样本是否合格是有关系的。原作者根据工作经验用4个可能导致化验结果不准确因素来说明问题是对的,但是每个因素仅用1到2个样本来说明问题,无法降低实验误差,得出的结论不可靠。
第1个因素含有2个水平,即同侧采血与异侧采血,每种采血方式至少5~10个,利用配对设计定量资料的t检验(差量近似服从正态分布时)或符号秩检验(差量不服从正态分布时)进行统计分析,得出P值,如果P<0.05,说明同侧采血与异侧采血的检测结果之间的差别有统计学意义,应选择正常的采血方式即异侧采血。第2个因素和第4个因素的处理方法同第1个因素一样;第3个因素是含有1个实验因素3个水平的实验研究,即抽血后立即送检、1h后送检、2h后送检,样本含量同上。
作者:胡良平等.医学论文中统计分析错误辩析与释疑:实验设计原则的正确把握.中华医学杂志