国内首次!AI医生公开大考,与三甲主治医生诊断一致性竟达96%

医来说 2023-07-07 15:42:36

AI时代到来,人工智能可以给我们多少想象空间?是ChatGPT的聊天、协助办公功能,还是Midjourney的3D绘画效果?

不止这些,AI现在还能当医生问诊病例:

“您好,麻烦您告诉我您的年龄及性别,以及哪里不舒服?”

当AI医生和真人医生以同样的问题开始问诊,最后的诊疗结果、治疗方案会一致吗?

6月30日,国内首次AI医生与真人医生一致性评测完成。

这场PK发生在成都高新海尔森医院,当天现场有120多名患者以及10名来自四川大学华西医院心内科、骨科、内分泌代谢科、肾内科、老年呼吸科、消化科和泌尿外科的医生共同参与测评研究。

测评以问诊形式进行,由参与评测的患者提供年龄、性别以及哪里不适等,然后将所收集到的数据分别提供给 AI 医生和真人医生。最终在 120 例病例中形成有效病例 91 份。对于这 91 份病例,再分别由国内顶尖医院的 7 位专家教授进行评价。

评价标准包括:问诊准确性、诊断准确性、治疗建议准确性、辅助检查方案准确性、数据分析准确性、提供可解释信息、自然语言问诊与交互。

最终,真人医生比 AI 医生多得分 0.3 分略胜一筹(7.5 分 VS 7.2 分),AI医生与三甲主治医生在比分结果上的一致性达到了96%。

(图片源自医联)

AI医生可自动识别错别字

为了本次测评的准确性,不论是AI医生还是真人医生,均只以文字方式问诊。此次问诊的过程首先由患者将症状告诉现场医生助理,由医生助理通过文字形式同时转达给AI医生和真人医生,等待两方的进一步回复后,再将问题,检查方案等内容口述转达给患者。

随后,一名患者向AI医生询问“失眠怎么办?”,AI医生首先询问了出现失眠症状多久、频率、生活压力等。在得到其回复后,AI医生开始细分询问是否运动,有无其他健康问题等。

(图片源自红星新闻)

结果发现,如果AI医生在提出问题后,患者并未回答,它则会反复提问。在问诊过程中,患者将“提醒”错写为“提行”,AI医生依然可以识别患者真实想表达的含义进行解答。同时,患者用口语化的词语表达,例如将“失眠”用“睡不着”来表述,AI医生均能理解。

经过7分钟的问诊,由于这名患者的症状不算严重,AI医生建议暂时不需用药,可以通过规律运动等方式改善睡眠。

(图片源自红星新闻)

AI医生的问诊过程是模仿真人的思维结构,就像一棵树,它的可能性很多,通过患者的反复提问中,排除无用枝桠后,在重点枝桠上进一步确定最终的“树梢”。

工作人员表示:“AI医生可以识别文字中的错别字,但对于‘嬢嬢’等四川方言或其他地区方言文字,AI医生暂时无法识别。”

AI医生知识覆盖面极广

专家在当晚的评审过程中发现,AI医生根据患者脚底板疼痛诊断出患者有可能出现神经压迫,而真人医生却没有想到这一点。AI医生令人惊喜的诊断出了不属于就诊专科的疾病,给出具备其他可能性的诊断,这在常规专科的问诊中是很难做到的。

在当晚的评审环节,现场专家对AI医生的表现给予高度肯定。现场专家普遍认为,AI医生通过多轮询问收集足够信息,以确保医疗准确性为前提推进问诊流程,出现误诊,漏诊的概率比较小。

同时,AI医生的知识覆盖面是超过一些经验并不是很充足的真人医生的。

(图片源自红星新闻)

AI医生会取代真人医生吗?

AI技术的发展是迅猛的且不可阻挡的,让AI更好地辅助真人医生去做出诊断,全面考虑,思及所不能及或许是其未来发展的一个方向。

但是,不要把技术的形象设立在对立面,技术永远是人类的技术,因为技术创新的目的总是服务于帮助人类,我们永远在同一个战线上。

患者作为一个特殊群体,在接受医生帮助的时候,诊断是重要的,诊疗亦是重要的,但作为人类的一员,我们不能仅仅看到了诊断和治疗,在这其中,沟通、互信、鼓励、安慰等等,或许只有人这个真正的医生才能去完成。

医学不仅仅是诊断医学,更是人文医学,道德医学,甚至是心灵医学。

end

声明:本文部分内容来源于丁香人才,红星新闻。以上图文,贵在分享,版权归原作者及原出处所有,内容仅为作者观点,并不代表本公众号立场。如涉及版权等问题,请及时与我们联系。

0 阅读:3
医来说

医来说

致力于大健康产业,为用户赋能