原标题:医疗器械临床试验中缺失数据处理方法研究
在临床试验实施过程中,常由于受试者的失访、依从性差、不良事件的出现、急救药物的使用等情况造成缺失数据。缺失数据减弱了随机试验的优势、降低试验的把握度、引入了潜在的偏倚[1-3],影响试验结果的解释和可信度[4]。忽略缺失数据的影响是不可取的,不恰当的缺失数据处理方法将引入更多的偏倚[5],怎么样处理缺失数据是临床试验研究中必须考虑的问题。
ICH E9以及我国《药物临床试验的生物统计学指导原则》均提出需考虑缺失值对试验结果的影响。美国食品药品监督管理局(Food and Drug Administration ,FDA)委托美国国家研究委员会(National Research Council,NRC)成立临床试验缺失数据处理工作组针对临床试验缺失数据问题进行研究并提出相应的建议,以减少缺失数据的出现,应用合适的统计分析方法处理含有缺失数据的试验[1]。欧洲药品管理局(European Medicines Agency,EMA)专门就怎么样处理由于患者退出临床试验或失访造成的数据缺失制订了相应的指导原则[5]。缺失数据处理方法的研究一直为临床试验评价的热点和难点。本文将介绍缺失数据相关的基本概念并就当前常见的缺失数据处理办法来进行介绍。
1 缺失数据定义
缺失数据是指由于各种原因应该得到而没有正真获得的数据[6]。针对临床试验详细情况,需明确定义缺失数据。NRC 定义缺失数据为对于分析有意义却没有收集的数据[1]。若患者发生死亡,则死亡后的生活品质评价由于对分析没有意义,不应被视为缺失。EMA主要讨论没有收集到受试者主要终点指标的缺失情况[5]。在ICH E9R1提出的估计目标框架下,应根据具体的估计目标判断某个数据是否为缺失值[7]。
©千库网
2 缺失机制与缺失模式
2.1 缺失机制
LITTLE等[8]提出了以下3 种缺失机制类型:
完全随机缺失(Missing Completely at Random,MCAR):数据的缺失与观测和未观测到的数据均无关。假设Y为感兴趣的数据,Yo表示观测数据,Ym表示缺失数据,Y=(Yo,Ym)。R为缺失与否的指示变量。X为协变量,Xo表示观测数据,Xm表示缺失数据。MCAR缺失机制下P(R|Yo,Ym,Xo,Xm)=P(R) 。例如受试者因移居而脱落或者由于设计因素随机抽取部分受试者进行评估。此种机制假设较强,在临床试验中一般不成立。
随机缺失(Missing at Random,MAR):数据的缺失与观测到的数据有关,但与未观测到的数据无关,则P(R|Yo,Ym,Xo,Xm)=P(R|Yo,Xo)。比如受试者因为观测到的疗效不佳而退出试验。MAR缺失机制更为常见,该假设允许使用观测到的数据预测/填补缺失数据。
非随机缺失(Missing Not at Random,MNAR):当数据的缺失不属于MCAR和MAR缺失机制下,换言之,数据的缺失与未观测的数据有关,则缺失为非随机缺失,也称缺失不可忽略。如在基于症状治疗的临床试验中,受试者由于症状的恶化而退出试验,退出前的数据并未收集,或受试者由于不良事件退出试验,不再接受试验干预。该部分受试者脱落后症状的变化常不同于留在试验中具有相似协变量的受试者,此种情况下使用观测到的数据预测/填补缺失数据是不合适的。目前并没有方法可以识别数据的缺失属于以上何种缺失机制,分析人员需要仔细考虑不同缺失机制对结果的影响,考查试验结果的稳健性。
2.2 缺失模式
缺失模式定义数据在何处缺失[1,9],大致上可以分为单一缺失(univariate missing)、单调缺失(monotone missing)、非单调缺失(non-monotone missing/arbitrarymissing)。若观测一次的数据缺失,则为单一缺失。单调缺失和非单调缺失在纵向数据中出现,若Yj缺失则Yjtl也缺失(其中j表示访视点),则数据为单调缺失,否则为非单调缺失。明确数据的缺失模式有助于了解缺失原因以及缺失原因与结果的关系。又由于部分处理方法不适用于所有缺失模式,识别缺失模式也是有必要的。
3 常见的缺失数据处理方法
在临床试验试验设计、操作及数据管理过程中,应积极预防缺失数据的产生。当出现缺失数据时,目前常用的处理方法大致可大致分为基于完整数据、基于填补、基于极大似然和基于MNAR缺失机制四类。
3.1 基于完整数据
基于完整数据是缺失数据处理方法中最简单但是也较为常用的方法。主要有个案删除(listwise deletion)、变量删除和加权调整法。个案删除法是将具有缺失数据的受试者删除的方法,临床试验中常定义的符合方案集则属于此种处理方法。变量删除法不将整个受试者删除,仅在分析某一项数据时忽略缺失数据。个案删除法和变量删除法均基于MCAR缺失机制假设,若该假设不成立或者缺失数据比例较大,此种方法会产生偏倚。若数据缺失机制为MAR假设,加权调整法通过对完整数据进行加权修正,可某些特定的程度降低偏倚,但需要选择正真适合的加权方法。基于完整数据的方法违背了ITT原则、降低检验效能、导致结论发生偏倚,不推荐其作为确证性临床试验中处理缺失数据主要的分析方法[10-13]。
3. 2 基于填补
基于填补法利用已观测数据填补缺失数据。根据缺失数据填补值个数,可大致分为单一填补和多重填补。
3.2.1 单一填补
目前使用最广泛的单一填补法有末次观测结转、基线观测结转和最差观测结转,分别用最后一次观测数据、基线观测数据和所有观测数据中最差观测数据填补缺失值。其余单一填补方法还有均数填补、回归填补、EM算法填充、热层填补、冷层填补。单一填补大多简单易懂,但多数方法假设缺失数据的真实值与填补值相同的概率为1,此种假设低估了数据变异、歪曲数据的分布和数据间的关系。有研究表明常用的末次观测结转法并不总是保守的[11,14],除非有充分的科学依据,否则不应该采用末次观测结转法作为主要分析方法[1,15-16]。
3.2.2 多重填补
多重填补法由Rubin在1977年首次提出[17],该方法对每个缺失值填补多次得到多个完整的数据集,对每个完整数据集做多元化的分析并进行结果的合并。因此,多重填补包括3个步骤,填补数据、数据分析及合并结果。其中,填补数据需要选择正真适合的填补模型,目前主要有以下几种填补模型:
线性回归 线性回归填补模型适用于连续性变量单调缺失数据的填补,建立感兴趣数据与协变量的回归方程后,基于此方程从参数的后验预测分布模拟出新的方程用于缺失值的填补。
假设Yj是一个含有缺失值的连续性变量,建立回归方程Yj=β0+β1X1+β2X2+…+βkXk,其中,X=(X1,X1…Xk)为协变量,β^=(β^0,β^1…,β^k)为回归参数的估计值,对应的协方差矩阵为σ^2jVj,Vj=(X'X)-1。而后,从(β^0,β^1…,β^k),σ^2j和Vj中模拟出新的参数β*=β^+σjV'hjZ和σ2*j=σ^2j(nj-k-1)/g,其中g为x2nj-k-1的随机变量,nj为Yj中无缺失的观测数,Vhj为柯列斯基分解中的上三角矩阵(Vj=V'hjVhj) ,Z是k+1维的随机正态变量。最后,通过回归方程Y*j=β*0+β*1X1+β*2X2+…+β*kXk+zjσ*j产生缺失数据的填补值,其中,z j为标准正态的随机变量。
预测均数匹配(predictive mean matching)预测均数匹配填补模型适用于连续性变量单调缺失数据的填补,通过线性回归填补模型为缺失值计算得填补值后,选取最接近填补值的K个已观测数据后从中随机挑选一个进行填补。该填补模型确保了填补数据的值不超过已观测数据的最大最小值。K的选择需要谨慎,K过小将提高多次填补值的相关性,导致重复抽样中点估计的变异增大,而K过大将使填补模型效能降低,导致估计的偏倚。
倾向性得分(propensity score)倾向性得分填补模型适用于连续性变量单调缺失数据的填补,通过计算给定观测协变量的每个数据缺失概率的倾向性得分,将所有数据根据倾向性得分分组后对在每一组内应用近似贝叶斯bootstrap填补本组缺失值。该填补模型也可确保填补数据的值不超过已观测数据的最大最小值,但该方法仅利用了数据是否缺失的协变量信息,而未考虑变量间的相关性[2]。
Logistic回归和判别函数Logistic回归填补模型适用于分类变量单调缺失数据的填补。Logistic回归填补分为两步,第一步为P步,与线性回归相似,在建立Logistic回归方程后从参数的后验预测分布模拟出新的回归方程,计算出每个缺失数据所属分类的概率。第二步为I步,通过比较均匀分布随机数与P步得到的概率大小,填补缺失数据。判别函数与Logistic回归类似,只是适用于多分类变量。
马尔可夫链蒙特卡罗(Markov Chain Monte Carlo,MCMC)MCMC填补模型适用于连续性变量非单调缺失数据的填补。MCMC为贝叶斯理论中一种探索后验概率的方法,假设数据服从多元正态分布,通过填补步和后验步的循环进行为缺失值抽取填补值。如第t 次迭代得到参数估计θ(t),填补步从P(Ymis|Yobs,θ(t))中抽取填补值Y(t+1)mis,后验步从P(θ|Yobs,Y(t+1)mis)中抽取参数估计θ(t+1)。最后迭代生成马尔可夫链(Y(1)mis,θ(1),(Y(2)mis,θ(2),…,使之最终收敛于分布P(Ymis,θ|Yobs)。
全条件定义法(fully conditional specification,FCS)FCS填补模型不考虑被填补数据与已观测数据的联合分布,而是利用单个数据的条件分布建立一系列回归模型逐一填补并迭代。由于FCS将多维问题分解为多个一维问题,回归模型可以再一次进行选择上述所有适用于单调缺失的模型,故可以应用于非单调缺失的所有类型数据,使用更加灵活[18-19]。假设Y=(Y1,Y2,…,Yj) 是一个含有缺失值的纵向数据,X为协变量,FCS迭代地从P(Yk|X,Yj* k,θk)条件分布中抽取填补值,在每次迭代抽取θk参数值时不使用缺失数据信息。
多重填补基于MAR缺失机制假设,通过多次填补增加填补数据的变异程度。在进行多重填补时,需合理构建填补模型和选择填补次数,对填补后数据集的分析建议与填补模型保持一致以避免填补模型和分析的矛盾。填补模型中应纳入与缺失相关的、与待填补数据取值相关的以及填补后数据集分析中使用到的变量。建议在临床试验报告中不仅报告多重填补结果,还需报告使用的具体填补模型。
©千库网
3.3 基于极大似然
基于极大似然的方法是建立总体分布的参数模型,不需要对缺失数据进行填补,而是基于观测数据估计模型参数。基于极大似然估计的方法构建似然函数如下,其中θ,ψ 是相互独立的模型参数。
L(θ,ψ|Y0,X,R)=∫p(y0,ym|x ; θ)p(r|y0,ym,x ; ψ) dym
= p(r|y0,x; ψ)∫p(y0,ym|x ; θ)dym
= p(r|y0,x ; ψ)p(y0|x ; θ)
常用的基于极大似然估计方法为重复测量的混合效应模型(mixed-effects model for repeated measures,MMRM)、广义混合模型。该方法基于MAR假设,通常情况下,需要有足够大的样本才可能正真的保证得到无偏的似然估计值。由于似然函数是基于完整数据的某个假定的参数模型,在实际应用中,如果模型假定错误,基于似然法的估计可能稳定也可能不稳定[20]。有模拟研究表明MMRM在处理MAR假设下的缺失数据中,可有效地控制一类错误,有较高的检验效能和较小的估计误差,建议将其作为主要的分析方法[21-23]。
3.4 基于MNAR缺失机制
上述三类处理方法大多基于MCAR或MAR,在临床试验中,由于无法验证MCAR或者MAR假设是否成立,需要仔细考虑缺失机制为MNAR的敏感性分析,以考察结论的稳健性。处理MNAR缺失机制的模型有模式混合模型(pattern mixed model,PMM)、选择模型(selection model,SEM)和共享参数模型(shared parametermodel,SPM)。
近年来,由于PMM对缺失数据分布假设易于解释并具有临床意义,采用PMM对缺失数据进行敏感性分析受到青睐。PMM中,Y和R在观测协变量X条件下的联合分布为p(Yo,Ym,R|X) = p(Yo,Ym|R,X)p( R | X) = p(Ym|Yo,R,X)p(Yo|R,X) p(R|X)。MNAR 假设中,不同p(R|X)模式下p(Ym|Yo,R,X)与p(Yo|R,X)的关系不总是相同的。换言之,缺失数据的分布与观测数据的分布是不同的。根据不同的p(R|X)模式以及缺失数据与观测数据的不同假设,目前常用的有基于δ调整的PMM以及基于对照的PMM[24-27]。基于δ调整的PMM假设缺失数据比完整数据平均相差δ,相当于对缺失数据填补结果进行某些特定的程度的惩罚。此方法的一个特殊应用为临界点分析法(tipping point) ,即寻找到一个δ使结论发生逆转[28-29]。基于对照组的PMM假设为,数据缺失后的分布与对照组类似。该假设在对照组为安慰剂或标准治疗,试验组受试者脱落后采用标准治疗的试验设计中更为合理[27]。如,EMA发布治疗阿尔茨海默病的药物临床研究指导原则指出,处理缺失数据时基于对照组受试者信息的模型更加合适[30]。无论是基于δ调整的PMM还是基于对照组的PMM都对缺失数据的分布进行较强的假设,使用时需结合真实的情况考虑假设的合理性,也可同时考察多个假设,进行不同假设的敏感性分析。
4 总结
缺失数据在临床试验研究中是常见、难以避免的,缺失数据将降低试验的检验效能,也可能带来偏倚。因此,加强预防缺失值的产生、选择正真适合的处理方法显得特别的重要。首先,应根据试验设计,识别缺失数据。其次,在选择缺失数据处理方法时,应留意处理方法的假设条件(特别是对缺失机制的假设)及其局限性。删除法简单易操作但基于MCAR假设且违背了ITT原则; 单一填补的方法对缺失数据的假设大多不属于MCAR且降低数据的变异程度,常用的末次观测结转法不被推荐作为主要分析方法。目前很常见的基于MAR假设的处理方法主要有多重填补和基于极大似然的方法。多重填补考虑了缺失数据的变异性,但在选择填补模型时需注意各个模型的使用条件及其局限性,如MCMC模型假设数据服从多元正态分布,也存在一定的迭代收敛问题[9,18,31]。当样本量足够大时,采用基于极大似然的方法与多重填补有类似的结论,但模型假定的正确性对参数估计有较大影响[20]。若缺失机制为MNAR,若仍然使用以上方法将带来更多的偏倚,故需要仔细考虑MNAR缺失机制下缺失数据的处理方法[1,5,25,32]。目前常用的是基于δ调整的PMM以及基于对照的PMM。两种方法对缺失数据的分布有具体的假设,适用于探索结论稳健性的敏感性分析。
缺失值处理的研究一直是临床试验研究领域突出和热门的话题。近年来PERMUTT等结合估计目标的框架,将所有缺失数据作为最坏的结果,提出使用截断均数(trimmed mean)结合置换检验处理临床试验缺失数据等。有研究表明截断均数在假设合理的条件下是一个有用的缺失值处理分析方法[33-35]。在ICH E9R1估计目标框架下,临床试验对于缺失数据的定义将更加准确和具体,相应的处理方法也有待进一步更加细致深入的研究。
参考文献
[1]NATIonAL RESEARCH COUNCIL. The prevention and treatment of missing data in clinical trials[M]. 2nd edition. Washington: The National Academies Press,2010: 3-56.
[2]王骏,韩景静,黄钦. 临床试验缺失数据的统计学考量[J]. 中
国临床药理学杂志,2016,32(5) : 469-472.
[3]蒋志伟,李婵娟,王陵,等. 临床试验中缺失数据的预防与处
理[J]. 药学学报,2015,50(11) : 1402-1407.
[4]INTERNATIonAL ConFERENCE ON HARMonIZATION OF
TECHNICAL REQUIREMENTS FOR REGISTRATION OF PHARMACEUTICALS FOR HUMAN USE (ICH E9). Statistical principles for clinical trials.[EB/OL]. Geneva(Switzerland): ICH,1998-02-05[2019-08-20]. http://essible assumptions,and inference via multiple imputation[J].
J Biopharm Stat,2013,23( 6) : 1352-1371.
[27]RATITCH B,O'KELLY M,TOSIELLO R. Missing data in clinical trials: from clinical assumptions to statistical analysis using pattern mixture models[J]. Pharm Stat,2013,12(6) : 337-347.
[28]YAN X,LEE S,LI N. Missing data handling methods in medical device clinical trials[J]. J Biopharm Stat,2009,19(6) : 1085-1098.
[29]李卫,张盛婕,王杨. 临界点分析法在处理临床研究缺失数据
中的应用[J]. 中华流行病学杂志,2017,38(5) : 674-678.
[30]EUROPEAN MEDICINES AGENCY (EMA) . Guideline on the
clinical investigation of medicines for the treatment of Alzheimer's
disease.[EB/OL]. London (Britain) : EMA,2018-02-22
[2019-08-20]. https://paring multiple imputation methods for non-monotone missing ordinal data in longitudinal settings[J]. J Biopharm Stat,2015,25(3) : 570-601.
[32]SCHAFER J L,GRAHAM J W. Missing data: Our view of the state of the art[J]. Psychol Methods,2002,7(2) : 147-177.
[33]PERMUTT T,LI F. Trimmed means for symptom trials with
dropouts[J]. Pharm Stat,2017,16(1) : 20-28.
[34]MEHROTRA D V,LIU F,PERMUTT T. Missing data in clinical trials: control-based mean imputation and sensitivity analysis[J].Pharm Stat,2017,16(5) : 378-392.
[35]WANG M,LIU J,MOLENBERGHS G,et al. An evaluation of the trimmed mean approach in clinical trials with dropout[J]. Pharm Stat,2018,17(3) : 278-289.
作者:衡明莉(国家药品监督管理局药品审评中心),陈丽嫦(南方医科大学公共卫生学院生物统计学系),王骏(国家药品监督管理局药品审评中心)
选自:中国临床药理学杂志 2019年11月 第35卷 第22期 2948-2952
责任编辑: