苏炳华 教授 上海第二医科大学 生物统计学教研室 新药临床试验的生物统计学 指导原则 苏炳华 教授 上海第二医科大学 生物统计学教研室
郑筱萸主编 《化学药品和治疗用生物制品研究指导原则》 (试行) 北京.中国医药科技出版社 2002.5 第一版. P85-P97.
按照国家药品监督管理局的要求,本指导原则应引进先进的思想和现代方法,与国际接轨,又需结合我国实际,具有连续性、前瞻性和可操作性。 依据的文件: (1)《中华人民共和国药品管理法》 (2)《新药审批办法》 (3)《药品临床试验管理规范》 (4) ICH-E9. Statistical Principles for Clinical Trials. 1998.2 (5) FDA. Guideline for Format and content of Clinical and Statistical Sections of an Application. 1988.7 (6) FDA-Docket No.97D-0188. International Conference on Harmonisation;Draft Guidelines on General Considerations for Clinical Trials;Availbility.1997.5
一、前言 生物统计学在临床试验中有着重要的作用。 新药临床试验必须遵守《中华人民共和国药品管理法》、《新药审批办法》、《药品临床试验管理规范》以及其它相关规定。
一、前言 1.适用范围 本指导原则适用于新药Ⅱ期和Ⅲ期临床试验,Ⅰ期与Ⅳ期临床试验可以参照执行。
一、前言 2.生物统计学专业人员的职责 新药临床试验中所有的统计学工作,需由有资格的生物统计学专业人员负责。他们与临床试验的研究者合作,确保本原则得以贯彻执行。
一、前言 具体职责 试验方案 (protocol)的制定和修订 病例报告表(case report form, CRF)的设计 数据管理(data management)等 负责制定统计分析计划(statistical analysis plan)
一、前言 完成临床试验资料的统计分析 提供试验结果的统计学分析报告和解释 协助主要研究者(principal investigator)完成临床试验的总结报告(clinical study report)。
一、前言 3.统计学方法与统计软件 新药临床试验所用的统计学方法必须是国内外认可的统计方法。 统计软件须是国内外通用的统计分析软件。
二、整个临床试验需考虑的问题 数值变量 分类变量 1.观察指标 观察指标是指能反映新药疗效(effectiveness)或安全性(safety)的观察项目。 数值变量 分类变量
二、整个临床试验需考虑的问题 (1)主要变量和次要变量 主要变量(primary variable)又称目标变量(target variable)或主要终点(primary endpoint)。 次要变量(secondary variable)。
二、整个临床试验需考虑的问题 (2)复合变量 如果从与试验主要目的有关的多个指标中难以确定单一的主要变量时,可按预先确定的计算方法,将多个指标组合起来构成一个复合变量(composite variable)。临床上常采用的量表(rating scale)就是一种复合变量。
二、整个临床试验需考虑的问题 (3)全局评价变量 将客观指标和研究者对病人的病情及其改变总的印象综合起来所设定的指标称为全局评价变量(global assessment variable),它通常是有序分类指标(scale of ordered categorical ratings)。
二、整个临床试验需考虑的问题 2.偏倚的控制 随机化(randomization)和盲法(blinding)是控制偏倚的重要措施。 偏倚(bias)又称偏性,是指在设计临床试验方案、执行临床试验、分析评价临床试验结果时,有关影响因素的系统倾向,致使疗效或安全性评价偏离真值。 随机化(randomization)和盲法(blinding)是控制偏倚的重要措施。
二、整个临床试验需考虑的问题 (1)随机化 随机化(randomization) 。包括分组随机和试验顺序随机,与盲法合用,有助于避免在受试者的选择和分组时因处理分配可预测性而导致的可能偏倚。临床试验中可采用分层 (stratified)、分段(block)随机化方法。
二、整个临床试验需考虑的问题 (2)盲法 盲法(blind method)是为了控制在临床试验的过程中以及对结果进行解释时产生有意或无意的偏倚。临床试验根据设盲的程度分为双盲(double-blind)、单盲(single-blind)和非盲(open-label)。
二、整个临床试验需考虑的问题 双盲临床试验时必须注意以下几个问题。 安慰剂(placebo)。应与所模拟的药品在剂型、外形等方面完全一致,并不含有任何有效成份。 双模拟(double dummy)技术。即为试验药与对照药各准备一种安慰剂,以达到试验组与对照组在用药的外观与给药方法上的一致。
二、整个临床试验需考虑的问题 胶囊技术。将试验药与对照药装入外形相同的胶囊中以达到双盲目的的技术。因改变剂型可能会改变药代动力学或药效学的特性,因此,需有相应的技术资料支持。
二、整个临床试验需考虑的问题 药品编盲与盲底保存。由不参与临床试验的人员根据已产生的随机数对试验用药进行分配编码的过程称为药品编盲。随机数、产生随机数的参数及试验用药编码统称为双盲临床试验的盲底 。盲底应一式二份密封,交主要研究单位的国家药品临床研究基地和申办者保存。
二、整个临床试验需考虑的问题 e) 应急信件与紧急揭盲 应急信件(emergency envelope),内容为该编号的受试者所分入的组别及用药情况。 在发生紧急情况,由研究人员按试验方案规定的程序拆阅。一旦被拆阅,该编号病例将中止试验,研究者应将中止原因记录在病例报告表中。
二、整个临床试验需考虑的问题 f) 揭盲规定 试验方案中,当试验组(treatment group)与对照组(control group)的例数相等时,一般采用两次揭盲(unblinding)法。两次揭盲都由保存盲底的有关人员执行。
三、试验设计中所考虑的问题 1.试验设计的类型 平行组设计 (parallel group design) 交叉设计(crossover design) 析因设计 (factorial design)
平行组设计(Parallel group design) 为试验药设置一个或多个对照药,试验药也可按若干种剂量设组。受试者随机地分入各个组别,他们在试验前处于相同的条件,在试验中除了试验药物不同外,其余条件相同。 交叉设计(Crossover design) 按事先设计好的试验次序(Sequence),在各个时期(Period)对受试者逐一实施各种处理,以比较各个处理的差异。 最简单的为2×2交叉设计。
三、试验设计中所考虑的问题 2.多中心试验(multicenter trial)。由一个或几个单位的主要研究者总负责,多个单位的研究者合作,按同一个试验方案同时进行的临床试验。
三、试验设计中所考虑的问题 多中心临床试验应注意的问题 当主要变量可能受主观影响时,必要时需进行一致性检验(consistency test)。 当各中心实验室的检验结果有较大差异或参考值范围不同时,应采取相应的措施,如统一由中心实验室检验、进行检验方法和步骤的统一培训和一致性测定等。
三、试验设计中所考虑的问题 在多中心临床试验中,对主要变量的分析需考虑中心效应,可用CMH方法或混合效应模型(mixed effect model)等。由于多中心临床试验中样本含量的估计是在假设各中心间处理效应相同的前提下进行,因此,在各中心间处理存在差异时,主效应的检验效能会降低。
三、试验设计中所考虑的问题 在双盲多中心临床试验中,盲底是一次产生的。当中心数不多时,应按中心分层随机;当中心数很多且每个中心的病例数不多时,可不按中心随机。
三、试验设计中所考虑的问题 3. 比较的类型 优效性(superiority)检验 等效性(equivalence)检验 非劣效性(non-inferiority)检验
分为优效性(Superiority)检验 等效性(Equivalence)检验 非劣效性(Non-inferiority)检验 (1)优效性检验的目的是显示试验药优于对照药,包括优于安慰剂,优于阳性对照药,剂量间的优于比较。 H0: 或 Hα: 双侧检验
(2)等效性检验的目的是确认两种或多种治疗的效果差别大小在临床上并无重要意义,即试验药与阳性对照药在治疗上相当。 (3)非劣效性检验的目的是显示试验药治疗效果在临床上不劣于阳性对照药 在等效和非劣效检验中阳性对照药,需是正广泛使用的,对相应适应症的疗效和用量已被证实,使用它可以有把握地期望在阳性对照试验中表现出相似的效果,阳性对照药原有的用法和用量不得任意改动。
等效性和非劣效性检验时,需预先确定一个等效界值(上限和下限)或非劣效界值(下限),这个界值应不超过临床上能接受的最大差别范围,并且应当小于阳性对照的优效性试验所观察到的差异。等效或非劣效界值的确定由主要研究者从临床上认可,而不依赖于生物统计学家。
--试验药均值 --阳性对照均值 为与阳性对照差值的下限和上限 H0 : 或 H0: Hα: 一般取α=0.05,β<0.20
三、试验设计中所考虑的问题 4.成组序贯设计(group sequential design)。 成组序贯设计的盲底要求一次产生,分批揭盲。由于多次重复进行假设检验会使I型误差增加,故需对每次检验的名义水准进行调整,以控制总的I误差不超过预先设定的水准(比如α=0.05)。试验设计中需写明α消耗函数(alpha spending function)的计算方法。
三、试验设计中所考虑的问题 成组序贯设计常用于下列两种情况: 试验药与对照药的疗效相差较大,但病例稀少且临床观察时间较长。 怀疑试验药有较高的不良反应发生率,采用成组序贯设计可以较早终止试验。
三、试验设计中所考虑的问题 5. 样本含量(sample size) 。样本含量的确定与以下因素有关: 设计的类型 主要变量的性质(数值变量或分类变量) 临床上认为有意义的差值 检验统计量、检验假设、Ⅰ型和Ⅱ型错误等。
选择1:根据SDA新药审评办法的规定Ⅱ期临床试验,试验组与对照组各至少为100例,故定为目标病例数为200例(根据试验与对照各半),考虑到脱落因素,入组病例数为240例。
选择2:根据统计学原理确定 根据已有资料得知试验组有效率为71.6%,对照组为49.1%,取α=0.05,β<0.20,试验组与对照组按2:1设计,H0:P1=P2 试验组n1 对照组n2 α β 1-β 120 60 0.05 0.19866 0.80134 130 65 0.05 0.16536 0.83464 140 70 0.05 0.13799 0.86201 150 75 0.05 0.11392 0.88608 160 80 0.05 0.09370 0.90630 最后选择n1=160,n2=80,可使得α=0.05,β=0.0937<0.1。 再考虑脱落因素,按20%计,取n1=200,n2=100。
优效性检验 试验组有效率为P1=0.60,安慰剂组有效率为P2=0.35,取双侧检验。 样本大小估计如下:
等效性检验 参照药有效率为0.7,试验药有效率为0.7,D0=0.07(大约为p的10%) 双侧检验 α=0.05 β=0.20 N1=N2=734 β=0.10 N1=N2=927
非劣效性检验 参照药有效率为0.6,试验药有效率为0.55 单侧检验 α=0.05
三、试验设计中所考虑的问题 6. 病例报告表 (case report form)。 病例的原始记录应准确而清晰地逐项记入,效应指标按试验设计的定义填入,对效应的判断应规定统一的认识、理解和标准,有关人员应经过事先培训。 监查员的任务之一是对病例报告表进行核查,一旦发现问题及时纠正错误。
四.试验进行中需考虑的问题 试验是否按试验方案执行 是否达到预期收集的病例数 数据是否准确可靠 受试者完成试验情况等 1. 试验的稽查/视查(Audit or inspection)。包括: 试验是否按试验方案执行 是否达到预期收集的病例数 数据是否准确可靠 受试者完成试验情况等
四.试验进行中需考虑的问题 2. 期中分析(interim analysis)。是指正式完成临床试验前,按事先制订的分析计划,比较处理组间的有效性和安全性所作的分析,以检验原试验方案中的假设是否合适,样本含量的估计是否正确等。 期中分析的日程、安排、所采用的α消耗函数等应当事先制订计划并在试验方案中阐明。
四.试验进行中需考虑的问题 3. 试验方案的修改。试验方案一般情况下不宜更改。但在以下两种情况可以考虑修改: 在试验进行过程中,如发现按原纳入标准难以选到合格的病例时,需分析原因并采取相应措施,在不破盲的条件下修改原入选/排除标准。
四.试验进行中需考虑的问题 当原设计的样本含量是在不确切信息的假设条件下估计的,而期中分析结果表明指标的估计与期望值不符时,应修改假设条件,重新计算样本含量。 修订方案须重新得到伦理委员会的批准。
五、数据管理 数据管理应认真执行以下步骤,以保证试验数据的正确。 1.研究者应根据受试者的原始观察记录,保证将数据正确、完整、清晰、及时地载入病例报告表。
五、数据管理 2.监查员须监查试验的进行是否遵循试验方案(如检查有无不符合入选/排除标准的病例等),确认所有病例报告表填写正确完整,与原始资料一致,如有错误和遗漏,及时要求研究者改正。修改时需保持原有记录清晰可见,改正处需经研究者签名并注明日期。
五、数据管理 3.经过监查员检查后的病例报告表,需及时送交临床试验的数据管理员。对于完成的病例报告表在研究者、监查员、数据管理员之间的传送应有专门的记录,收到时应有相应的签名,记录需妥善保存。
五、数据管理 4.数据管理员还需再次检查病例报告表,当发现任何问题时,及时通知监查员,要求研究者作出回答。他们之间的各种疑问及解答的交换应当应用疑问表(query list, query form),疑问表应保存备查。
五、数据管理 5.数据管理员应根据病例报告表和统计分析计划书要求,在第一份病例报告表送到以前建立数据库(database),并保证其完整、正确和安全。 6.对每一份病例报告表应由两个操作人员独立地输入数据库中,再用软件对两份输入结果进行比较,并输出比较结果。如果有不一致,需查出原因,加以更正。
五、数据管理 7.数据管理员按病例报告表中各指标数值的范围和相互关系拟定的数据检查,如范围检查(range check)和逻辑检查(logic check)等。可编写计算机程序进行检查,在输入前控制错误数据输入,找出错误的原因加以改正。所有错误内容及修改结果应有详细记录并妥善保存。
五、数据管理 8.如试验计划中有规定,可再次对数据库中的变量(主要是对主要变量)进行全部或抽样的人工检查(visual check)并与病例报告表进行核对。
五、数据管理 9.盲态审核(blind review)。是指在最后一份病例报告表输入数据库后,第一次揭盲之前对数据保持盲态的预分析审核,以便对统计分析计划作最后的决定。
五、数据管理 盲态审核考虑 是否需剔除某些受试者或某些数据 变量是否需作变量变换(transformation) 是否需定义离群值(outlier) 是否需在统计模型(statistical model)中加入某些影响因素作为协变量
五、数据管理 使用参数统计方法(parametric statistics)还是非参数统计方法(non- parametric statistics)。以上任何决定都需用文件形式记录下来。 盲态审核下所作的决定不应该在揭盲后被修改。
五、数据管理 10.在盲态审核或认为所建立的数据库正确后,将由主要研究者、申办者、生物统计学专业人员和保存盲底的有关人员对数据库进行锁定。锁定后的数据文件不允许再作变动。
六、统计分析 1. 统计分析计划书(statistical analysis plan)。应列出统计分析数据集的选择、主要变量、次要变量、统计分析方法、疗效及安全性评价方法等,按预期的统计分析结果列出统计分析表(statistical tables)备用。
六、统计分析 统计分析计划书的初稿应形成于试验方案和病例报告表之后。在临床试验进行过程中,可以修改、补充和完善。在盲态审核时再次修改完善。但是在第一次揭盲之前必须以文件形式予以确认,此后不能再作变动。
六、统计分析 2.统计分析数据集(Analysis sets)。需遵循以下两个原则: 使偏倚达到最小 控制I类错误的增加
六、统计分析 根据意向性分析(intention-to-treat,简称ITT)的基本原则,主要分析应包括所有随机化的受试者。 全分析集(Full Analysis Set) 指尽可能接近符合ITT原则的理想的受试者人群。它应包括几乎所有的随机化后的受试者。只有在导入期中被排除而未入组或者入组后没有任何的随访数据才能从FAS人群中排除。
六、统计分析 将受试者排除在符合方案集之外的理由应在盲态审核时阐明,并在揭盲之前用文件写明。 受试者的“符合方案集” (per protocol,简记PP),亦称为“有效病例”或“可评价病例”样本。它是全分析集的一个子集,这些受试者对方案更具依从性。 将受试者排除在符合方案集之外的理由应在盲态审核时阐明,并在揭盲之前用文件写明。
六、统计分析 当以上两种数据集的分析结论一致时,可以加强试验结果的可信性。 对安全性评价的数据集(safety set)选择应在方案中明确定义,通常安全性数据集应包括所有随机化后至少接受一次治疗的受试者。
目标人群 安全性评估人群(Safetey population) 包括至少服过一次药物,且接受过一次治疗后安全性评估的受试者 全分析人群(Full-Analysis-Set) (FAS) 包括至少服过一次药物,且至少接受过一 次治疗后有效性评估的人群
符合方案人群(Per protocol) (PP) 包括符合下面三个条件者 1. 有效的基线值 2. 符合方案,不违背方案中的规定的入选排除 标准,完成全部评估 3. 依从性良好(80%~120%之间) 不包括严重违反方案的受试者 1.违反入选排除标准 2.合并使用禁用药物 3.无主要变量的基础数据
六、统计分析 3.缺失值及离群值(missing value)。病例报告表中原则上不应有缺失值,尤其是重要指标(如主要的疗效和安全性指标)与基本数据,如性别、出生日期、入组日期和各种观察日期等不得缺失。试验中观察的阴性结果、测得的结果为零和未能测出者,均应有相应的符号表示,不能空缺,以便与缺失值相区分。
LOCF估计(Last observation carry forward) 指对于重要指标的缺失值使用最接近的观察数据估计之。
六、统计分析 离群值问题的处理,应当从医学和统计学专业两方面去判断,尤其应当从医学专业知识判断。离群值的处理应在盲态检查时进行,如果试验方案未预先指定处理方法,则应在实际资料分析时,进行包括离群值与去掉离群值后的两种结果比较,研究它们对结果是否不一致以及不一致的直接原因。
六、统计分析 4.变量转换 试验设计时,应根据以往类似的资料,对所研究的主要的、关键性的变量作出是否要进行变量转换(transformation)的规定。变量转换的目的是确保资料满足统计分析方法的假设条件。
六、统计分析 5.统计分析方法 描述性统计分析(descriptive statistical analysis) 假设检验(hypothesis test)和参数估计(parameter estimation) 统计分析应考虑协变量的影响 考虑脱落病例的影响。
六、统计分析 6.安全性评价 (safety evaluation)。常用统计指标为不良事件发生率和不良反应发生率。对于试验时间较长、有较大的退出治疗比例或死亡比例时,需用生存分析(survival analysis)计算累计不良事件发生率。
七. 统计分析报告 统计分析报告的内容包括以下几部分: 对整个临床试验中资料的收集和整理过程的描述 入选病例是否符合入选/排除标准 各试验中心是否完成试验方案规定的观察病例数 病例报告表的填写是否完整 试验过程中有无增加新的观察指标
七. 统计分析报告 对脱落病例的处理方法和处理理由 如果是盲法试验应对盲态审核作出交待 在资料整理过程中有无对指标进行变量转换 如何定义离群值等内容。
七. 统计分析报告 统计分析方法的选择及其理由 各组病例入选时的基本特征描述及统计检验 各组病例的主要变量、次要变量和全局评价变量的统计描述、参数估计及统计检验
七. 统计分析报告 各组病例安全性评价,主要以统计描述为主,包括 不良事件发生率及不良事件的具体描述 实验室检验结果在试验前后的变化情况 发生异常改变及其与试验用药品的关系。
七. 统计分析报告 以上结果应尽可能采用统计表、统计图表示,统计检验结果应包括有统计意义的检验水准(significant level)、统计量(statistic)值和精确的P值。应注明所使用的统计软件及版本,所有统计计算程序应以文件形式保存以便核查。