有关缺失数据的考虑要点 发表评论(0) 编辑词条
1.前言 编辑本段回目录
分析临床试验时缺失数据可能会产生偏倚。如果缺失值的数量很多,则试验结果的解释总是会出现问题。ICH E9(临床试验的统计学原理)只涉及这一问题的一部分,目前主管部门尚未制定有关这一问题的指南。
缺失数据有许多可能的来源,影响整个受试者或特定项目。缺失数据可能有许多原因(例如患者拒绝继续参加研究、治疗失败或成功、不良事件、患者搬家),其中并不都与研究治疗相关。可以出现不同程度的数据不完整,即可能只有基线测定值,或可能漏了一个或几次随访评价。即使完成了研究方案,仍可能有些数据未收集到。
缺失数据违反严格的ITT原则,即:测定所有患者的结果而不论其是否遵守方案;按照分配的治疗进行分析而不论患者实际接受的治疗如何。全分析集一般需要填补未记录的数据的值。实际上,即使是符合方案集可能也需要使用某些填补的值。这一程序可能对临床试验的最终结果有重要的影响,具体取决于缺失数据的多少和种类。
缺失值导致对是否有治疗作用以及治疗作用的大小得出有偏倚的结论,其程度受许多因素影响。其中包括缺失、治疗分配和结果之间的关系;用于对治疗作用进行量化的测定指标的类型(例如绝对与相对测量指标)。
影响数据解释发生偏倚的种类取决于研究的目的是为了显示差异还是为了证明等效性/非劣效性。
需要指出的是用于填补缺失值的策略本身也是偏倚的来源。
2.缺失值对数据分析和数据解释的影响 编辑本段回目录
如果简单地从分析中排除有缺失结果的所有患者来处理缺失值,则以下问题会影响试验结果的解释。
2.1 把握度和变异
样本量和结果变异影响临床试验的把握度。样本量越大则把握度越大,并且变异越小。
由于数据不完整而减少可用于分析的有效病例可能会导致统计学把握度降低,缺失值的数量越大则把握度降低越明显。
此外,数据不完整者有极端值的可能性更大(治疗失败导致脱落、治疗效果非常好导致失访)。因此这些数据不完整者的缺失会导致变异被低估,因此人为地使治疗结果的可信区间变窄。
2.2 偏倚
偏倚是由缺失数据所导致的最重要的担心,可影响:
- 治疗作用的估计。
- 治疗组间的可比性。
- 研究样本对于目标人群的代表性。
虽然统计学把握度的降低主要与缺失值的数量相关,但估计治疗作用时偏倚的风险取决于缺失、治疗和结果之间的关系:
- 如果缺失值仅仅与治疗相关(治疗组与另一组相比观察缺失的可能性更大)而与未观察的指标的实际值不相关(较差的结果与较好结果相比缺失的可能性更大),则理论上预期缺失值不会导致偏倚。
- 相反,如果未测定的观察指标与结果的实际值相关(例如未观察到的指标较差结果所占比例更大),这会导致偏倚,即使缺失值与治疗不相关(即缺失值在各治疗组中相等)。
- 如果缺失值与治疗和未观察的结果变量二者都相关,则缺失观察会导致偏倚(例如由于效果不同,缺失值见于一个治疗组的可能性更大)。
在多数情况下,很难或不可能阐明缺失值和未观察的结果变量之间是否完全无相关性。因此最好是采用保守的方法,把缺失值当作偏倚的一个潜在来源。
2.1 把握度和变异
样本量和结果变异影响临床试验的把握度。样本量越大则把握度越大,并且变异越小。
由于数据不完整而减少可用于分析的有效病例可能会导致统计学把握度降低,缺失值的数量越大则把握度降低越明显。
此外,数据不完整者有极端值的可能性更大(治疗失败导致脱落、治疗效果非常好导致失访)。因此这些数据不完整者的缺失会导致变异被低估,因此人为地使治疗结果的可信区间变窄。
2.2 偏倚
偏倚是由缺失数据所导致的最重要的担心,可影响:
- 治疗作用的估计。
- 治疗组间的可比性。
- 研究样本对于目标人群的代表性。
虽然统计学把握度的降低主要与缺失值的数量相关,但估计治疗作用时偏倚的风险取决于缺失、治疗和结果之间的关系:
- 如果缺失值仅仅与治疗相关(治疗组与另一组相比观察缺失的可能性更大)而与未观察的指标的实际值不相关(较差的结果与较好结果相比缺失的可能性更大),则理论上预期缺失值不会导致偏倚。
- 相反,如果未测定的观察指标与结果的实际值相关(例如未观察到的指标较差结果所占比例更大),这会导致偏倚,即使缺失值与治疗不相关(即缺失值在各治疗组中相等)。
- 如果缺失值与治疗和未观察的结果变量二者都相关,则缺失观察会导致偏倚(例如由于效果不同,缺失值见于一个治疗组的可能性更大)。
在多数情况下,很难或不可能阐明缺失值和未观察的结果变量之间是否完全无相关性。因此最好是采用保守的方法,把缺失值当作偏倚的一个潜在来源。
3.缺失数据的处理 编辑本段回目录
在临床试验的设计和实施时,应尽可能减少可能出现的缺失数据的数量。尽管做出了这些努力,一般仍可出现一定的缺失值。这些缺失观察处理的方法会明显影响研究的结论。
3.1 完整病例的分析
处理不完整的数据的一种可能的方法是忽略它们并仅对完整的数据进行分析(完整病例的分析)。第2节讨论了与这种方法相关的一些问题。考虑到这些困难,一般认为完整病例的分析不是数据分析的主要方法,尽管在某些情况下可能是恰当的。
- 在探索性研究中,特别是在药物开发的初期阶段。
- 在确证试验中,作为次要的支持性分析,证明结论的稳健性。
完整病例的分析违反意向治疗原则。更为重要的是它容易产生偏倚,因此不建议作为确证试验的主要分析。
3.2 填补缺失数据
3.2.1 填补的范围
缺失值可影响不同类型的变量,填补程序不仅应当考虑主要变量,也应当考虑次要疗效变量、次要安全性变量、基线变量和协变量。在某些情况下,后面这些变量很重要,因为从分析中排除未记录的数据可能导致偏倚和降低把握度,特别是存在混淆变量时。
3.2.2 填补缺失数据的方法
临床试验的统计学方法一般需要填补未记录到的那些数据的值。用于填补数据的技术有很多,但没有一个被认为是适合所有情况的金标准。
为处理在一个点后疗效收集中断的情况,一个被广泛使用的方法是沿用末次观测值(Last observation carried forward, LOCF)的方法。这一分析采用最后一次得到的疗效反应作为其自身的终点,不一定要遵循具体的研究时点。
如果测定值随时间的变化相对恒定,那么这一方法可能可以接受。但如果预期测定值随时间变化不恒定时,例如预期Alzheimer病患者病情会逐渐恶化,则该方法不大会被接受。在某些情况下,LOCF提供可接受的保守方法,具体取决于每个治疗组中缺失的比例和时限。例如对于抑郁,有时病情会自发性改善,如果实验组患者倾向于提前退出和更常见的由于安全性原因而退出时,这种方法可能会被认为是保守的方法。
影响LOCF方法可接受性的因素包括治疗组间在退出率和时限、各种自发性变化随时间变化的方向以及退出原因方面的差异。
如果要保守些,可以考虑用最好或最差病例填补方法,即给因负面原因(治疗失败)而脱落指定最差的结果值,而给正面脱落(治愈)指定最好的值。这些技术可用于评价疗效的下限,以证明稳健性。
填补缺失数据的另一种简单的方法是以其他来源的推导值替代未观察到的测定值。可能的来源包括同一受试者和基线特征相似的其他受试者的信息、根据经验建立的模型预测的值、历史数据等。
大多数方法通过估计中心值而忽略其不确定性,因而有使标准误减小的偏倚风险。某些根据最大似然法并有多次填补方法的技术可以避免这种风险。由于最大似然法有多次填补的方法,因此被建议用于填补缺失值。根据最大似然法的策略通过一种反复的程序(例如预期最大化算法)拟合模型。多次填补方法得出多个原始数据集的副本,通过随机生成的值取代缺失值,并作为完整的数据集对它们进行分析。
有些统计学方法对存在缺失数据不敏感。固定效应模型被建议用于各种情况,例如不同时间反复测定结果以及测定时间被看作随机变量时;这些模型可以估计总结每例患者效果的斜率。当结果测量是至事件的时间时,可以使用生存率模型,该模型考虑的是审定的观察值。但这些方法假定治疗与缺失结果之间没有相关性,而一般不能做出这种假设。
4.一般建议 编辑本段回目录
遗憾的是,目前没有被普遍接受用于处理缺失数据的方法。尽管如此,在处理缺失数据时有一些原则应当予以考虑。
4.1 避免缺失数据
由于存在缺失值会带来许多大的困难,随着缺失值的数量增多,这些困难进一步加大。因此可以通过以下方法尽最大可能避免出现未观察到的结果,这极为重要:优先考虑减少这一问题的设计,强化数据收集而不论患者是否遵守方案,并鼓励在患者脱落后获取数据。
预测试验中可能出现的缺失值的数量可能会有用。有关可以接受的缺失值的最大数量没有具体的规定。它受许多因素的影响:a)结果变量的性质:当结果变量为死亡(例如心血管试验)时缺失值的发生率应当低于结果难以评价和需要患者主动参与和/或复杂的诊断方法的试验。b)临床试验持续时间:随访时间越长则出现缺失值的概率越大。c)患者遵守研究方案通常较差的疾病(例如精神疾病)中缺失值较常见。d)治疗情况(例如手术与药物治疗)。
4.2 研究设计、事先规定的意义
处理缺失值没有普遍适用的方法,不同的方法可能会得出不同的结果。因此在研究方案的统计部分事先指定选定的方法非常重要。这一部分还应当详细描述选用的方法,说明所用方法是最佳方法的依据。而且,强烈建议估计预见的和数量可以接受的缺失数据:首先因为这对样本量的计算有影响,其次因为随着缺失值的数量增加,填补方法的可靠性更加不确定。总结报告必须记录与预期的缺失值数量的各种偏差,并讨论事先指定的分析是否仍有说服力。
确保选用的方法是一种保守的方法,并且并非有利于研究的工作假设(有意的或无意的),这非常重要。例如非劣效性试验中缺失数据的处理应当避免治疗间的差异被低估。同样,优效性试验中缺失数据的处理方法应当避免高估治疗间的差异。
由于某些困难是不可预测的,因此在统计学分析计划中或在试验结束后设盲分析数据时,可能需要对处理缺失值的策略进行修改。应当记录与事先指定的计划相关的偏差及修订部分,并提供依据。此外,必须清楚地说明这些偏差和修订决定和执行的时间点与数据揭盲时间的关系。这些变化的记录方法见ICH E9。
4.3 缺失数据的分析
注意是否有提示不同治疗组之间缺失值的出现比例和时间有差异,这可能有用。还应当进行分析,以明确缺失数据是否在各种相关因素中不平衡以及有缺失数据和无缺失数据的患者基线特征是否不同。
4.4 灵敏度分析
灵敏度分析――显示缺失数据不同处理方法对研究结果影响的一套分析――将有助于为选择所用的具体方法提供依据。这些灵敏度分析可作为主要分析的补充。
进行灵敏度分析的一些简单方法为:
- 比较两种分析的结果,其中一种分析将两组中所有缺失值指定为最好的结果,另一种分析将两组中所有缺失值指定为最差的结果。
- 比较两种分析的结果,其中一种分析将对照组中所有缺失值指定为最好的结果,将实验组中所有缺失值指定为最差的结果;另一种分析正好相反。
- 比较全集分析与完整病例分析的结果。
设计的每一种灵敏度分析应当评价对所做出的填补数据的具体假设的结果有何影响。灵敏度分析应当在方案和/或统计学分析计划中事先计划和描述,如果有什么更改,都应当在研究报告中记录并说明理由。
如果灵敏度分析的结果一致,并且对治疗作用的估计相似,这可以在一定程度上确保缺失信息对总的研究结论影响不大或没有影响。在这种情况下,结果的稳健性显而易见,一般认为缺失值不会造成严重的问题。相反,如果灵敏度分析得出不一致的结果,应当讨论其对试验结论的影响。某些情况下,当缺失数据可能被认为会产生顾虑时,试验的可靠性会受到影响。
4.5 总结报告
在统计学方法部分应当详细描述事先指定的用于处理缺失数据的方法及对这一计划所作的修订。
临床报告中应当讨论疗效和安全性评价中缺失值的数量、时间、类型和可能的意义。应当列出并标明填补的值。
附件列表
→如果您认为本词条还有待完善,请 编辑词条
词条内容仅供参考,如果您需要解决具体问题
(尤其在法律、医学等领域),建议您咨询相关领域专业人士。
0
收藏到:
同义词: 暂无同义词
关于本词条的评论 (共0条)发表评论>>