网易首页 > 网易号 > 正文 申请入驻

临床预测模型,如何估算样本量

0
分享至

内容来自:“小白学统计”微信公众号,感谢作者授权

预测模型开发中的样本量确定可以通过两种主要方法:经验法则和基于特定标准的计算方法

样本量确定的经验法则:

10 EPV(每个变量10个事件)和10 EPP(每个候选预测参数10个事件)是比较常用的经验法则。如果只比较这两个原则,建议选择10 EPP而不是10 EPV,EPP可以避免对“变量”术语的潜在误解。例如,当一个连续变量如“年龄”被纳入模型时,它对应一个估计参数。但是,添加年龄的二次项会增加到两个参数。同样,将年龄分类为五组需要估计四个参数。换句话说,一个变量并不等于一个参数,一个变量很可能是多个参数。所以不能简单根据变量数来确定样本量。

尽管10 EPP原则很简单,但也存在不少争议。有的模拟研究建议,增加10 EPP到20 EPP甚至50 EPP以减少偏差。这种不一致性源于所需事件取决于多种因素,如预测因子的效应量、研究群体中的结果比例和预测因子的分布。

样本量确定的计算方法:

Riley等人提出的计算方法包括五个步骤[1-3] :

步骤1:计算样本量以确保整体结果风险的精确估计,相当于保证截距的精准估计,推荐的误差边界为0.05。

步骤2:计算样本量以确保平均绝对预测误差(MAPE)小于5%。这是从预测和真实的差值角度来说的。

步骤3:计算样本量以确保全局收缩因子大于0.9,减少过拟合。

步骤4:计算样本量以确保显著和调整后的R²Nagelkerke之间的绝对差异不超过0.05。 步骤3和4都是从过拟合角度来说的。

步骤5:选择四个计算得出的样本量中最大的作为最终样本量。

如果大家想直接略过理论部分,直接看如何计算,Riley等给出了一个r包pmsampsize。比如,结局是二分类变量;已知以往文献的roc曲线下面积为0.8,拟纳入15个参数,结局患病率约为0.1。那就可以用下面语句实现样本量估算

pmsampsize(type = "b", cstatistic = 0.8, parameters=15, prevalence = 0.1)

虽然计算方法在理论上比经验法则更合理,因为它考虑了多个因素,但仍存在许多实际挑战。

首先,尽管作者提供了样本量计算所需参数的推荐值,但使用固定参数值并不可取。例如,在步骤1中,作者固定误差为0.05并不合理。比如,对于5%和50%的患病率,都采用0.05的误差,显然不大合理。因此,在实际应用中,仍需结合临床知识和先前文献进行综合判断。

其次,从现有文献中获取预先指定的参数存在挑战。在Paula Dhiman等人的系统综述中,62项研究中的152个评估模型只有一个报告了R²,而仅四个报告了MAPE或RMSE。因此,在实际计算中,参数的确定涉及一定程度的主观性。

使用计算方法确定EPP:

为简化临床应用,我们根据前述五个步骤计算了不同c统计量、事件比例和参数数量的样本量和相应的EPP数量。结果汇总于下表。

我们的分析表明,当参数数量在10个或更少时,EPP的数量受到参数数量和事件比例的显著影响。然而,当参数数量超过10时,EPP的数量主要由事件比例决定。在实际应用中,参数数量通常超过10,因此20 EPP通常是足够的。当事件比例低于0.2时,10 EPP也足够。

上面表格可以较为方便地用于实际。例如,如果以往研究表明c统计量约为0.8,事件比例约为0.2,并计划在模型中包括20个参数,则所需的样本量为9 EPP,相当于180个事件。因此,总样本量为180/0.2 = 900例。

其它实用性考虑:

预测参数的数量指的是最初考虑纳入的参数,而不是最终模型中包含的参数。例如,若最初考虑了20个参数,但在变量选择后只纳入了8个,则EPP原则应基于原来的20个参数应用。

经验法则和计算方法主要针对回归模型,如logistic回归。然而,使用神经网络等机器学习技术时,参数数量通常远超回归模型。因此,机器学习方法通常需要的样本量比回归模型大得多。因此,使用机器学习方法时,建议选择最大的可行样本量

上述方法主要关注模型开发,而外部验证所需的样本量要求可能不同。已有研究者提出了四个标准来准确估计外部验证所需的样本量,包括精确估计观察/预期(O/E)比率、校准斜率、c统计量,以及在特定概率阈值下的标准化净收益。具体可见Riley, R.D. et al. (2021)文章[4]。

参考文献:

1. BMJ. 2020 Mar 18:368:m441.

2. Stat Med. 2019;38(7):1276-1296.

3. Stat Med. 2019;38(7):1262-1275.

4. Stat Med. 2021;40(19):4230-4251.

医咖会员全面升级,课程增多,AI工具升级!

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
如今黄金价格变成了一个天大的笑话,买黄金的人可笑到什么程度?

如今黄金价格变成了一个天大的笑话,买黄金的人可笑到什么程度?

时负相知
2026-05-28 06:06:41
41岁王珞丹现状:住河北深山,不结婚不生子,放弃荣华富贵图啥?

41岁王珞丹现状:住河北深山,不结婚不生子,放弃荣华富贵图啥?

白面书誏
2026-04-20 15:26:26
“易中天”股价创新高,总市值近2.4万亿元,多支CPO基金净值半年内翻倍

“易中天”股价创新高,总市值近2.4万亿元,多支CPO基金净值半年内翻倍

时代财经
2026-05-28 16:54:15
长沙正在流行“新型出轨”:不开房不暧昧,却比肉体背叛更诛心!

长沙正在流行“新型出轨”:不开房不暧昧,却比肉体背叛更诛心!

美食格物
2026-04-29 12:16:04
突发!土耳其无人机击落法国阵风战机?土法印三国吵疯了

突发!土耳其无人机击落法国阵风战机?土法印三国吵疯了

军武次位面
2026-05-28 15:36:35
横扫七十多个中国师的坂垣师团,为何竟被瘸腿老将堵在临沂城外

横扫七十多个中国师的坂垣师团,为何竟被瘸腿老将堵在临沂城外

黄丽搞笑小能手
2026-05-28 03:50:10
美国掀桌子,伊朗就炸基窝子!

美国掀桌子,伊朗就炸基窝子!

星火聊天下
2026-05-28 16:58:10
把女性私处P图狗身上?坚决抵制这家保险公司

把女性私处P图狗身上?坚决抵制这家保险公司

廖保平
2026-05-27 12:51:22
舒淇晚餐吃鸡汤面和披萨,一天只吃一餐,50岁年轻体重只有100斤

舒淇晚餐吃鸡汤面和披萨,一天只吃一餐,50岁年轻体重只有100斤

椰黄娱乐
2026-05-27 10:24:47
1夜4转会-曼联第1签,巴萨8000万引援,热刺击败尤文,签红军大将

1夜4转会-曼联第1签,巴萨8000万引援,热刺击败尤文,签红军大将

阿晞体育
2026-05-28 08:35:22
父亲当街多次脚踹女儿,路过男子制止时将其放倒致轻伤;一审被判构成故意伤害罪,二审发回重审

父亲当街多次脚踹女儿,路过男子制止时将其放倒致轻伤;一审被判构成故意伤害罪,二审发回重审

极目新闻
2026-05-27 18:44:06
基辅笑不出来了!普京用榛树弹头,直接把乌军司令部炸平了!

基辅笑不出来了!普京用榛树弹头,直接把乌军司令部炸平了!

小祁谈历史
2026-05-27 14:11:44
周恩来招待尼克松,当众嚼碎白瓷盘咽下肚,毛泽东特批的全刺鱼尾藏着多大的政治暗码?

周恩来招待尼克松,当众嚼碎白瓷盘咽下肚,毛泽东特批的全刺鱼尾藏着多大的政治暗码?

寄史言志
2026-05-16 16:39:09
大喜之日,伴娘在婚床上被强奸,且看当年这桩丑陋的大案始末

大喜之日,伴娘在婚床上被强奸,且看当年这桩丑陋的大案始末

长安一孤客
2026-05-15 19:26:59
相亲角来了个印度小伙,全程拽得不行,张嘴就吹自己是印度高种姓

相亲角来了个印度小伙,全程拽得不行,张嘴就吹自己是印度高种姓

西楼知趣杂谈
2026-05-25 11:51:00
华为韬定律立大功!未来5年内,实现国产1.4nm芯片,不再被卡脖子

华为韬定律立大功!未来5年内,实现国产1.4nm芯片,不再被卡脖子

北纬的咖啡豆
2026-05-27 14:35:52
“承认嫉妒女儿很丢人吗?”家长嫌弃女儿又胖又壮,遭到网友群嘲

“承认嫉妒女儿很丢人吗?”家长嫌弃女儿又胖又壮,遭到网友群嘲

妍妍教育日记
2026-05-27 20:07:43
1989年安徽拍戏,25岁巩俐零替身出演,这片凭啥成经典

1989年安徽拍戏,25岁巩俐零替身出演,这片凭啥成经典

手工制作阿歼
2026-05-27 00:05:04
“开放是必然的”,大学开门不要再畏首畏尾

“开放是必然的”,大学开门不要再畏首畏尾

南方都市报
2026-05-27 18:30:12
蒋介石在他的日记里坦言:重庆谈判时放走毛泽东,全是因为这2点

蒋介石在他的日记里坦言:重庆谈判时放走毛泽东,全是因为这2点

北海史记
2026-05-25 15:49:23
2026-05-28 17:48:49
医咖会
医咖会
生动有趣的形式传递医学新进展
2846文章数 11008关注度
往期回顾 全部

科技要闻

台积电3纳米下半年涨价15% 明年或再涨10%

头条要闻

小米车主遇剐蹭提理赔遭拒还被打骨折 小米法务介入

头条要闻

小米车主遇剐蹭提理赔遭拒还被打骨折 小米法务介入

体育要闻

如果雷霆拼图是这水平 马刺确实打不过

娱乐要闻

林俊杰七七与大哥嫂子的瓜剪不断理还乱

财经要闻

长鑫科技IPO过会,市值会到几万亿?

汽车要闻

限时补贴价9.28-10.98万 MG 4X正式上市

态度原创

游戏
本地
数码
房产
公开课

PS港服夏日游戏节优惠上线!索尼大促更上一层楼

本地新闻

用剪纸的方式,打开江苏扬州

数码要闻

雷神布局AMD Medusa Point / Medusa Point芯片AI迷你工作站

房产要闻

突发重磅!三亚新机场公司正式成立!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版