*仅供医学专业人士阅读参考
如今,随着AI技术的高速发展,其在医学领域的应用也越来越多。
2022年,浙江大学公共卫生学院徐欣团队带着与阿里巴巴达摩院联合研发的世界首创的基于语音识别的智能化认知筛查工具(Digital cognitive screener,DCS),首次走进了大众的视野。
DCS以传统认知测试为模板,使用机器人对话的方式收集参与者的语音数据,采用语音识别、自然语言处理等AI技术对参与者的表现进行分析,最终通过构建算法模型预估参与者的痴呆风险。
当年,徐欣团队在杭州多个社区内筛选了103名老年人进行DCS筛查,筛查完成率为93%,测试时间为5.1–7.3分钟。利用蒙特利尔认知评估量表 (MoCA) 测量老年人认知状态,并以此来探究DCS筛查效力后,徐欣团队发现,DCS能够有效识别痴呆高风险人群,有望在我国老年人中大规模推广。
于是,近期,徐欣团队带着迭代的DCS,再次走进了大众的视野。她们从杭州市拱墅区大规模抽取11186名参与者(年龄>50岁)进行新版DCS测试后发现,迭代后DCS的筛查完成率从93%提高到了97.5%,测试时间平均为5.9±0.8分钟。
在随后的验证队列中,徐欣团队发现,DCS对痴呆症和轻度认知障碍(MCI)有很好的检测效力,曲线下面积(AUC)分别为0.95和0.83。成本分析显示,与MoCA和简易精神状态检查量表(MMSE)相比,DCS可节约16.2%-36.0%的时间人力成本,可在我国老年人中大规模推广。
研究发表在Alzheimer's & Dementia上[1]。
论文首页截图
作为世界上痴呆患者最多的国家,我国的医疗系统正面临着巨大的负担。预计到2050年,我国与痴呆相关的医疗和社会护理费用总额将达到372.5-430.6亿美元,尽早开展痴呆相关筛查有助于降低医疗成本,为痴呆的干预和治疗提供最佳窗口。
数字痴呆筛查工具是一种非常有前景的筛查手段,但既往的一些数字痴呆筛查工具大多都需要专业人员在场,且很多筛查设备需要进行点触,这对一些文化水平低,视力受限以及出现躯体功能下降的老年人很不友好。
为了克服这些问题,徐欣团队借助了人工智能,开发出了可以语音对话的DCS。DCS通过机器人对话的方式,与测试者进行对话问答,并自动收集测试者的音频,随后通过自动语音识别系统将收集到的音频转为文本,再进行自然语言理解(NLU),最后利用模型将文本与正确答案进行匹配,测出分数。DCS评分范围为0-12分。
不过在实际使用中,徐欣团队发现这一版本的DCS存在一点缺陷,就是它识别普通话是没问题的,但是对于方言就不行了,毕竟方言转录成文本后在识别上存在一些困难。于是,徐欣团队又开发了一个端对端的模型(MMU),这个模型无需转换文本,可直接对语音进行识别。新模型让DCS的整体评分准确率从83.2%显著提高到92.8%。
DCS迭代
那么新版DCS筛查效力如何呢?
与此前试点研究不同,徐欣团队这次打算大规模测试DCS的效力。研究先是从杭州拱墅区随机筛选11186名参与者(年龄>50岁)进行DCS筛查,来观察DCS的完成率和筛查所需时间,然后再从中纳入有MoCA和MMSE结果的328名参与者作为验证队列,来进一步验证DCS的筛查效力。
结果发现,新版DCS的筛查完成率可高达97.5%,而上一版是93%。测试的筛查平均时间也仅需5.9±0.8分钟。
在验证队列中,DCS分数与经全面神经心理学测试得出的认知标准z评分显著相关,且无论年龄、性别、教育水平如何,DCS对痴呆症和MCI有很好的筛查效力(AUC分别为0.95和0.83)。在最佳临界值下,DCS诊断痴呆的灵敏度和特异性分别为90.0%和92.3%,诊断MCI的灵敏度和特异性分别为78.8%和74.2%。
最后,在成本分析中,研究团队发现,与MoCA和MMSE相比,DCS可节约16.2%-36.0%的筛查时间。这也意味着在相同时间内,DCS可筛查更多的参与者。
总之,该研究发现,DCS不仅在检测痴呆和MCI病例方面具有良好的筛查效力,还具备很高的管理效率,是一种可在社区中实施的痴呆和MCI筛查工具,具有很高的实用性。徐欣团队表示,在中国老年人中大规模实施DCS可能是一种实用的认知筛查策略,可以有效减轻我国与痴呆相关的医疗负担。
参考文献:
[1]Zhao X, Wen H, Xu G, Pang T, Zhang Y, He X, Hu R, Yan M, Chen C, Wu X, Xu X. Validity, feasibility, and effectiveness of a voice-recognition based digital cognitive screener for dementia and mild cognitive impairment in community-dwelling older Chinese adults: A large-scale implementation study. Alzheimers Dement. 2024 Feb 1.
本文作者丨张金旭