北京市第二类体外诊断试剂临床试验指导原则(2016年版)
(征求意见稿)
本原则适用于指导北京市第二类体外诊断试剂检测方法等效性临床研究,对临床试验机构和参比系统的选择、样本要求、临床实验方案、临床试验数据分析等提出了一般性要求。申请人应在完成产品分析性能评估、拟定产品标准后,方可申请该产品的临床评价。临床评价开始前,申请人应根据产品特点及使用目的,确定临床评价的项目和方法,制定合理可靠的临床评价方案。
一、临床试验机构的选择
临床评价开始前,申请人应根据申报产品特点选择临床试验机构。临床试验机构应当具有与申报产品相适应的条件及能力。试验机构的选择应符合以下要求:
(一)应选择至少两家获得国家食品药品监督管理总局资质认可的医疗机构。医疗机构的临床实验室(简称实验室)应符合《医疗机构临床实验室管理办法》(卫医发〔2006〕73号)的要求,并优先考虑经中国合格评定国家认可委员会(CNAS)依据《医学实验室质量和能力认可准则》(CNAS-CL02等同ISO15189)或《检测和校准实验室能力认可准则》(CNAS-CL01等同ISO17025)认可的实验室。
(四)实验室应有能力提供临床评价所需的各类样本。
(五)临床试验必须获得临床试验机构伦理委员会的同意。
二、参比检测系统的选择
以下将申报产品的检测系统称为考核系统,所选择的对照检测系统称为参比系统。
(一)实验室应保证所用检测系统的完整性和有效性。考核系统和对照系统的主要分析性能指标(如准确性、精密度、线性范围等)应满足临床要求。
(二)参比系统的试剂、仪器、校准品均应已取得医疗器械注册证;考核系统的仪器、校准品应已取得医疗器械注册证或与考核试剂同步注册,且进度基本一致。
(三)参比系统应选择与考核产品方法学原理相同(如同为酶联免疫反应、同为化学发光免疫反应等)或相似的,其方法学分析性能应优于或近似于考核产品。
(四)对于定量产品,参比试剂的性能技术指标(如线性范围、精密度等)应与考核试剂近似或更优,两者的参考区间不宜差别过大;对于定性产品,两者检出限/临界值应基本一致;对于半定量产品,两者的分段区间应基本一致。
(五)定性产品可选性能更优的半定量或定量产品作为参比试剂(统计数据时应先将定量/半定量测试结果按照其自身说明书中确定的参考区间/临界值分别划归阴性、阳性结果后,再进行两个试剂测试结果间的等效性分析)。同理,半定量产品可选择定量产品作为参比试剂。
三、试验样本的选择
(一)应明确临床样本要求,考核系统与参比系统所用样本及其要求应一致。应注明样本采集、预处理、保存、输送的要求及条件(如明确采血管种类、抗凝剂要求等)。
应明确样本纳入及排除的准则,对厂家声称的可能对检测结果有明显干扰作用的样本,如溶血、脂血或黄疸等样本尽量避免使用(分析干扰因素时除外)。
定量测试的产品,样本中待测物浓度原则上应覆盖考核系统检测范围且均匀分布,并应包含医学决定水平。落在参考区间以外的比例应不低于试验总量的30%。
定性测试的产品,应该包含一定数量的阳性、阴性和接近临界值样本,阳性样本比例应不低于30%。如果检测系统同时可给出诸如OD值、S/CO值等量化结果,应一并给出,以验证其数据分布的合理性。
半定量测试的产品,样本在各分段区间的试验例数应尽量均匀,且各分段区间内试验例数不宜低于30例。
如果阳性样本数达不到上述要求,应有充分合理的理由,并应由临床试验机构出具解释说明情况。
临床试验机构各自的试验例数不宜低于100例。
(三)关于样本类型的选择。
考核试剂和参比试剂的样本类型应与其各自产品说明书要求一致。考核试剂声称的不同样本类型(如血液、尿液),应分别进行临床试验。
如果声称同时适用于血清/血浆/全血样本,那么血清(或血浆或全血)的试验例数按照《体外诊断试剂临床试验技术指导原则》的要求,并同时在至少两家临床机构共验证不少于100例受试者的自身血清、血浆和/或全血样本测试结果间的一致性(采用考核试剂评价),其中不同浓度样本分布情况与总例数中分布情况应一致。
四、临床试验方案
本文主要考虑采用已批准上市产品作为参比系统,评价考核系统和参比系统的等效性。
临床试验实施前,研究人员应从流行病学、统计学、临床医学、检验医学等多方面考虑,设计科学、合理的临床试验方案。各临床试验机构的方案应一致,且保证在整个临床试验过程中被遵循实施,不可随意改动。整个试验过程应在临床试验机构的实验室内并由其实验室的技术人员操作完成,申报单位的技术人员除进行必要的技术指导外,不得干涉实验进程。临床试验过程、试验结果处理及试验报告应真实、客观、公正,不受外来因素的干预。
试验方案中应确定样本纳入/排除标准,任何已经入选的样本再被排除出临床试验都应记录在案并说明原因。在试验操作过程中和判定试验结果时,应采用盲法以保证试验结果的客观性。各试验单位选用的对照试剂及第三方复核试剂应保持一致,以便进行合理的统计学分析。
(一)试验前的准备
(二)试验过程的管理
推荐进行平行检测,试验过程中要观察离群值(任一样本,如其两种方法测试的绝对差值/相对差值超出所有样本两种方法测试绝对差值/相对差值的均值的4倍,则被判断为离群值)。离群值的个数不得超过2.5%(比如,在100个样本的临床试验中,不得出现3个离群值)。若未超限,则删除离群值后进行分析;如超出此限又找不到合理原因,应重新收集样本进行分析。
(三)定量产品回归及偏倚估计的数据分析
对于定量产品,应至少进行以下数据分析——
1.绝对偏倚图
考核系统与参比系统每个样本测定值之差与相应两系统测试均值作散点图。观察并分析各点的绝对偏倚分布情况。
2.相对偏倚图
考核系统与参比系统每个样本测定值之比值与相应两系统测试均值作散点图。观察并分析各点的相对偏倚分布情况。
3.回归分析
考核系统每个样本测定值与相对应的参比系统测定值作散点图(以考核系统作Y轴,参比系统作X轴)。
计算a值及b值,列出线性回归方程式。并计算回归系数及截距的95%可信区间。
Y=a+bX----------------------------------------------------------(1)
4.医学决定水平处的预期偏倚及其可信区间
对于任何给定的X值,Y的估计值:
-------------------------------------------------------(2)
在给定的医学决定水平Xc处的预期偏倚(Bc)的估计值,按以下公式计算:
-----------------------------------------------(3)
Bc的95%可信区间(在Xc处的真正偏倚)按以下公式计算:
--------(4)
其中估计值的标准误的计算公式如下:
-------------------------------------------(5)
5.结果判断与解释
(四)定性及半定量产品的等效性数据分析
1.定性检测产品
应分析阳性符合率、阴性符合率、总体符合率,以及相应的95%可信区间。以交叉表的形式(如表1)总结两种试剂的定性检测结果,对定性结果进行四格表kappa(或卡方)检验以验证两种试剂定性结果的一致性。
表1.配对计数资料统计表
Kappa=(PA-Pe)/(1-Pe)--------------------------------------(6)
其中,PA为“实际一致率”,Pe为“理论一致率”。以表1为例,计算方法如下:
PA=(a+d)/(a+b+c+d)----------------------------------------(7)
Pe=[(a+b)(a+c)+(c+d)(b+d)]/(a+b+c+d)2--------------(8)
阳性/阴性符合率及其95%可信区间应满足临床要求,如达不到要求则需重新设计临床方案。
对两种系统检测结果明显不一致的样本,应采用临床诊断金标准方法或其他方法进行确认试验,并结合患者的临床病情对差异原因进行分析。如果考核系统与参比系统的检测结果显示不一致样本均是位于临界值附近且例数很少,则对不一致原因作简要分析,不需进行第三方复核。如果有必要选择第三方试剂复核,建议先对一定数量的考核试剂和参比试剂检测结果一致的样本(包括阳性和阴性结果)进行检测,以对第三方试剂选择的合理性进行评估。
2.半定量检测产品
应分别评价两个系统各分段区间的一致性,并采用kappa检验以及各分段区间试验数据的符合率进行验证。Kappa值计算举例如下:
表2两方法测定值一致性分析(1、2……g表示不同区间)
3.其他
根据《体外诊断试剂临床试验技术指导原则》的要求,临床试验报告应该对试验的整体设计及各个关键点给予清晰、完整的阐述,应该对整个临床试验实施过程、结果分析、结论等进行条理分明的描述,并应包括必要的基础数据和统计分析方法。建议在临床总结报告中对以下内容进行详述:
(一)临床试验总体设计及方案描述
1.临床试验的整体管理情况、临床试验单位选择、临床主要试验人员简介等基本情况介绍。
2.样本纳入/排除标准、不同人群的预期选择例数及标准。
3.样本类型,样本的收集、处理及保存等。
4.统计学方法、统计软件、评价统计结果的标准。
(二)具体的临床试验情况
1.考核系统和参比系统所用试剂(含校准/质控品)的名称、批号、有效期及所用仪器型号、编号等信息;
2.对各试验单位的病例数、人群分布情况进行综合,建议以列表或图示方式给出具体例数及百分比。
3.质量控制、仪器维护、仪器校准和运行情况。
4.试验过程,样本检测、数据收集、样本保存等。
5.对于受试者的临床背景情况(如年龄、性别、确诊疾病等)及样本保存情况应在数据页中明示。
(三)统计学分析
1.数据预处理、对离群值的处理、试验过程中是否涉及对方案的修改。
(四)讨论和结论
进行总结性描述并简要分析试验结果,对本次临床研究有无特别说明,最后得出临床试验结论。
(一)联检(或多方法学)产品应将各项目检测结果分别统计分析。如存在多项指标联合判定检验结果的情形,临床试验应涵盖其产品说明书中列出的各种情形并对联检结果与临床诊断结果的一致性进行分析汇总。
(二)除汇总数据统计分析(临床试验总报告)外,各临床机构应有独立完整的方案、报告(含数据统计),需要进行补充试验的,应对各自数据重新进行分析统计并出具补充报告。
八、名词解释
1.线性(linearity)
2.精密度(precision)
在规定条件下,对同一或相似被测对象重复测量得到测量示值或测得量值间的一致程度。测量精密度通常由不精密度的量度以数字表达,如规定测量条件下的变异系数(CV)。
3.参考区间(referenceinterval)
来自生物参考人群的数值的特定分布区间。
示例:健康成年男性和女性人群的血清钠离子浓度值的95%生物参考区间是135mmol/L到145mmol/L。
4.临界值(cut-offvalue)
作为判断特定疾病、状态或被测量存在或不存在的界限的量值。测量结果高于临界值被认为阳性而低于临界值被认为阴性。测量结果接近临界值可被认为是非确定性。
注:临界值的选择决定检验的诊断特异性和诊断灵敏度。
5.诊断灵敏度(diagnosticsensitivity)
6.诊断特异性(diagnosticspecificity)
7.偏倚(bias)
8.可信区间(confidenceinterval,CI)
按一定的概率或可信度(1-α)用一个区间来估计总体参数所在的范围,该范围通常称为参数的可信区间或者置信区间,预先给定的概率(1-α)称为可信度或者置信度,常取95%或99%。
九、参考文献
[1]《医疗器械监督管理条例》(中华人民共和国国务院令第650号)
[2]《体外诊断试剂注册管理办法》(国家食品药品监督管理总局令第5号)
[3]《体外诊断试剂临床试验技术指导原则》(国家食品药品监督管理总局通告2014年第16号)
[4]《MethodComparisonandBiasEstimationUsingPatientSamples;pprovedGuideline—SecondEdition》(CLSIEP9-A2)
[5]《Invitrodiagnosticmedicaldevices-Informationsuppliedbythemanufacturer(labelling)-Terms,definitionsandgeneralrequirements》(ISO18113-1:2009)