中科院 2 区文献独家解读
一个预测术后恢复的模型
领域导读✦
•
临床预测模型是 医学版的“算命” 。患者、医生都是模型构建者。患者自我评估越来越重要。
临床预测模型就是一种统计模型,可以是传统的统计学,也可以是人工智能(包括机器学习)。
无论哪种模型,本质是根据一系列患者特征估算某种临床结果的概率,在临床实践中可用于对疾病严重程度进行分层,并描述疾病风险或疾病预后。
除了临床和生物数据,患者自我评估相关数据已成为重要角色,也主导着一些临床预测模型(如本文)。
在缺乏优质数据的现实环境下,该文献亮点是借用了既往的随机对照临床试验(RCT)数据,并充分利用了数据特征带来的优势,进行了规范的建模。下面给出解读。
内容提要✦
•
摘要
(翻译+原文)
(点击查看大图)
概念清障✦
•
QoR-40:Quality of Recovery,恢复质量评分-40。基于患者自我评估,含两大类 40 个问题,评估身体舒适度、情绪状态、身体独立性、心理逻辑支持和疼痛。具有良好的心理测量特性、效度、重测可靠性和内部一致性。患者自主完成问卷只需约 7 分钟。
ASA 分级:指的是美国麻醉医师协会(ASA)于麻醉前根据病人体质状况和对手术危险性进行分类,将病人分成的六级。该指标在各医院围手术期均常规采集。是外科建模的利器。
HADS: Hospital Anxiety and Depression Scale 医院焦虑和抑郁量表,基于患者主观感受。
关键启示✦
•
1. 研究亮点:数据来源
本文作者“一鱼两吃”,用两个既往随机对照临床试验(RCT)数据开发了模型。是不是为大家提供了新思路呢?
这两个麻醉药物的 RCT(编号NCT01441843;NCT01993459)本身并不是用来建立预测模型的,甚至两个研究对象都不同:一个是咪达唑仑,一个是劳拉西泮,但都是苯二氮卓类,也都采集了 QoR-40 问卷。
图释:两个 RCT 一个被当作训练集,用于建模;一个被当作验证集,验证模型表现(点击可放大)
2. 如何选择和对待患者数据:模型的“变量”处理
作者通过评价既往文献,筛选出如下变量以供选择:年龄、性别、既往手术情况、体重指数(BMI)、ASA 分级、手术持续时间、医院焦虑抑郁量表(HADS)和 QoR-40。
以上这种通过文献查找循证医学证据的方法,就是基于专家意见 (theory-based) 的变量筛选,这是目前最提倡的首要方法,可见临床建模需要与临床意见全程紧密结合,医生远不只是提供数据。
相比之下另一种变量筛选方法是单纯的数据驱动 (data-driven), 是指不考虑真实临床意义,只计算数值上的显著性,更适合样本量大、变量多的情况,常见于机器学习乃至人工智能。
基本模型最终选用变量:年龄、性别、至少做过一次手术、体重指数、ASA 评分和手术持续时间,共 6 个。
复杂模型最终选用变量:年龄、性别、既往手术、BMI、ASA、手术持续时间、HADS 和术前 QoR-40 评分,共 8 个。
特别指出,年龄、性别一般是放之四海皆有用的指标。
在对变量的处理上,作者保持数值变量不变,而非转化为等级变量(比如,将某项检验指标数值转变为“高、中、低”这样的等级变量),这种转化是一种最常见的数据处理错误。推荐参考一个科普视频:数据处理最常见的错误(没有之一)(https://www.bilibili.com/video/BV1tDTceqEmJ/)。
3. 临床预测模型常见难点/争议点:样本量
本研究容易被质疑样本量小。作者给出的解释是,虽然样本少,但因为来自 RCT,所以数据质量好,数据缺失少。
最关键的是,按照每个变量最少 10 个事件(Event per variable, EPV. 即:如果 8 个变量,则阳性结局至少需要达到 80 例)的经验法则,开发和外部验证的有效样本量是足够的。
图释:除了EPV,其他样本决定因素如图(翻译+原文)
(点击可放大)
4. 外科天然优势:术前术后对比数据
得益于较为严格的流程化诊疗, 外科围手术期的指标较为全面,且时效性好 。 有想法的外科同道可以结合自己的兴趣点,探索课题。
5. 提倡:更新模型,而非重建模型
前人设计的临床量表(量表本质上就是预测模型)在后人的临床预测模型上体现价值。
同样地,本研究的作者也提出,后人可以在此模型基础上更新:
“可能有一些(目前未知的)变量会改善当前模型的表现。
因为新的研究(如 Enhanced Recovery After Surgery,ERAS,加速康复外科)指出,术前体力活动、营养状况、微创手术技术或麻醉方案以及术后可能需要入住重症监护室,都是值得关注的预后变量。扩大患者范围将有助于研究这些相关变量,从而更新我们的模型。”
再推荐一篇 2022 年发表的高被引文献,解答如何评估并更新模型,也是本公众号文章笔者的偶像 E. W. Steyerberg 作为通讯作者发表的:Methodological guidance for the evaluation and updating of clinical prediction models: a systematic review (参考文献 2)
6. 借鉴:“优点和不足”部分
本研究从几个常见的角度,即样本量、偏倚、模型普适性(泛化性)等来讨论,可以借鉴。
图释:文章“优势和不足”(原文+翻译)
(点击可放大)
方法论总结✦
•
本研究较严格地遵循了系统化方法:临床模型建立七步骤(见下图)
图释:Clinical Prediction Models (书, 作者 Ewout W. Steyerberg) 总结的建模关键步骤清单
(点击可放大)
然而对于新的模型(如本例),需要在新的时间和应用场景继续验证,这也是大多数临床预测模型研究本身最具独特性之处。对于经受住考验的,可能被写进临床诊疗指南,例如预测深静脉血栓的 Wells 评分,有兴趣的读者可以查看本文参考文献 3。
参考文献
[1] van Beek, Stefan, et al. "Development and external validation of a clinical prediction model for predicting quality of recovery up to 1 week after surgery." Scientific Reports 14.1 (2024): 387.
[2] Binuya, M. A. E., et al. "Methodological guidance for the evaluation and updating of clinical prediction models: a systematic review." BMC Medical Research Methodology 22.1 (2022): 316.
[3] Wells, PhilipS, et al. "Accuracy of clinical assessment of deep-vein thrombosis." The Lancet 345.8961 (1995): 1326-1330.
[4] 视频:数据处理最常见的错误(没有之一)(https://www.bilibili.com/video/BV1tDTceqEmJ/)
END
文案 | 孙梦妍
排版 | 孙梦妍
审核 | 孙梦妍
发布|姜笑南
世界生命科学大会
RECRUIT
关注我们,获取生命科学
学界前沿|促进更多的学术交流与合作
业界前沿|促进更快的产品创新与应用
政策前沿|促进更好的治理实践与发展