百济神州全球统计与数据科学部门生物统计副总监高玉娟
一单臂和开放标签临床试验简介
临床试验的目的是回答药物安全性和有效性的临床问题,理想情况下是因果关系。随机化和设盲是临床试验所采用的减少偏差以得到因果推断最重要的方法。盲态(fully blinded)随机对照试验(RCT)有时不可行或者出于伦理角度无法施行,此时单臂和开放标签RCT提供了另外的选择。
单臂临床试验目前存在的一些局限性,包括安全评估样本量相对小,或无法充分评估罕见的严重不良事件;混杂因素无法控制,导致数据解读困难 ;观察到的低缓解率可能无法预测药物或者疗法的临床获益 ;对于联合治疗,难以评估其中单一疗法的作用;单臂临床试验通常依赖历史对照数据评估疗效,但可能由于不同试验差异的影响无法充分辨别而产生错误结论。总体而言,这种试验存在潜在偏倚,增加了关于药物安全性和疗效数据解读的不确定性。
开放标签试验也同样具有局限性,主要源于均衡性缺失(loss of equipoise),即试验参与人员认为一种干预疗法优于另外一种,可能导致其行为上的变化,引入两组之间除疗法之外的其他差异因素,进而影响疗效评估;含主观评估成分的临床终点更容易受到偏差影响;获知个体或者累积数据可能影响到试验执行,进而影响数据解读。
二保证试验完整性的实操考量
试验完整性主要指试验的科学性和可靠性,官方指南提到的充分且控制良好的研究(adequate and well-controlled study)概念, 即能够提供关于药物效应的充分证据。下面分别从试验的设计、执行和分析阶段讲述实操过程中如何确保试验完整性。
1.试验设计
试验设计的目的是回答特定临床问题,尽量考虑到试验后期偏差的影响。
- 临床终点需能够预测临床获益,因此像OS等客观终点更推荐,如果临床终点涉及主观评估,如ORR/PFS,需要采取能够减小潜在偏差的措施,如盲态独立中心化评审(BICR)。
- 对于无法完全设盲的RCT,要对尽可能多的试验参与人员设盲,特别是患者和研究者。
- 统计假设需要考虑变异性,可结合多种情景综合评估。
- 需提前对可能出现的情况进行预测和分析。比如考虑到入组困难,可以将更多受试者随机到更有效的治疗组,同时允许变更治疗,以吸引受试者;为防止受试者脱落,对于独立中心评估的终点,可由BICR来辅助停药的决定,可以考虑允许变更治疗使得受试者维持在研究中接受随访。即使受试者退出研究,也尽量跟进受试者生存信息。
2.试验执行
试验执行过程中要注意采取一切措施控制偏倚。对开放标签RCT非常重要的一点是分配隐藏,使得随机化之前无法获知或者预测受试者用药信息;不同治疗组的受试者采取相同的管理方式。要尽一切可能减少缺失数据,尽量保证缺失数据的随机性并在组间保持均衡。另外要控制受试者脱落,包括培训受试者以减少撤回知情和方案违背、培训研究者以减少阅片过程的主观偏差、实时BICR以减少研究者主观评估引入的信息删失等。
与此同时,试验实施过程中要保护数据完整性。要对尽可能多的试验参与人员设盲,避免计划外的分析;加强个体水平和汇总数据的权限管控,以降低对于试验实施的负面影响,包括入组,受试者保留,方案执行等;密切监察数据,包括研究者和IRC评估的差异性,停止试验治疗,新的抗肿瘤治疗等,以及时发现和采取措施降低风险,此过程应注意无试验组别信息,并符合方案和其他章程文件的要求。
3.试验数据分析
试验的数据分析主要就是要得到关于药物效应的稳定估计。单臂试验的数据分析比较明确,主要介绍开放标签RCT的思考。分析人群应包括所有入组/随机的受试者,不应去掉未接受治疗的受试者。治疗选择可能会受到所在治疗组信息的干扰而引入偏差,统计方法包括潜在偏差的识别和处理两个方面。潜在偏差难以量化但可以从一些角度进行评估,如比较组间脱落率、比较研究者和IRC评估差异在两组之间的分布、肿瘤评估的间隔等。潜在偏差的处理,如考虑到混杂因素,采用RPSFT,IPCW等方法来矫正OS的变更治疗引入的偏差;考虑到缺失数据的数量和模式,采用临界点分析来评估PFS有信息删失的影响等。
三案例分享:Sotorasib
下面分享CodeBreak200案例介绍开放标签临床试验开展的考量。产品三期设计方案具体见图1,主要终点是PFS by IRC,次要终点是OS,ORR。中期分析在70%的事件数时进行。
图1
试验允许变更治疗,但是在入组基本结束时做的方案修订,可以看整个产品的研发历程,如图2所示,该三期研究是在二期研究CodeBreaK 100开展的同时开始讨论并开展,当时是PFS和OS双终点,后来二期单臂数据先后获得FDA突破性疗法认证和加速审批,CodeBreaK 200进行方案变更允许变更治疗并更新样本量基于唯一主要终点PFS。试验组药物已有数据证实疗效,这就很大程度上产生了均衡性缺失,导致两组之间不均衡,如对照组的脱落率明显更高。最后结果是主要终点PFS成功,预先设定的PFS敏感性分析显示治疗效果一致, OS在两组间相似。但PFS结果的可靠性和稳健性引起很大质疑,申办方和FDA分别进行了详实的敏感性分析以探索PFS的疗效及稳定性,显示统计显著性在一些敏感性分析中无法保证。总的来说,这个经典案例在试验的设计、实施和分析上都可以进一步学习,感兴趣的读者可以研读相应ODAC资料。
图2
图3
四总结与讨论
临床试验要解决的临床问题一般是关于药物效果的因果推断,随机化和设盲是临床试验的金标准。如果完全设盲不可行,仍推荐随机对照试验,且尽量设盲。如果随机试验不可行或不伦理,单臂试验提供了另一种选择,但需充足的解释未满足的临床需求,RCT不可行,以及试验设计的考量得到准确的疗效评估等。
无论试验是早期的信号探索还是关键临床研究,都需要尽一切努力避免和减小潜在偏差确保试验完整性。准确的早期信号能够更好地指导后续的开发计划,关键临床研究的审评基于证据的总体。试验设计阶段要考虑终点选取、脱落率、对照的选择、统计假设等,预判并规避减小偏差,确保试验结果的科学性和可靠性。试验实施阶段应遵守试验方案和其他章程文件,采取足够的措施保持组间的均衡,尽量减小偏差,包括受试者、研究者、分析人员等,同时保证数据完整性。试验分析阶段应按照计划提供可靠和充足的分析,提供对于药物的疗效和安全性的准确评价。
无论如何,及时与药监局保持紧密通畅的沟通都是关键和必要的。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.