如今,一位新的医生进入了急诊室——但与我们的传统认知不同的是,不仅没有名字,甚至没有实体。事实上,人工智能技术已经进入世界各地的医疗体系。请各位机器人反对者放心,人工智能在医疗卫生领域的融合并不是要取代人类的工作岗位。人工智能拥有强大的扩展与与强化能力,有时甚至能够启发医生对病患作出更为全面的诊疗。
利用“二十一世纪的听诊器”完成诊断Bertalan Mesko被认为是医学未来学家,他把人工智能称为“21世纪的听诊器”。他的评估结果可能比他预期的更准确。尽管以往的各类技术与测试确实能够为医生提供对患者进行诊断与治疗所需要的各类信息,但医生们肩上仍然担负着过重的临床与行政责任,而对大量可用信息进行分类无疑也是一项艰巨的任务。
这就是二十一世纪听诊器所能带来的全部助益。
尽管如此,AI技术在医疗领域的应用已经超出了行政管理的工作范围。从强大的诊断算法到精心设计的外科手术机器人,这项技术正在医学界引发极为广泛的关注。很明显,AI已经在医学领域占有一席之地,只是尚不确定它的具体价值。
想象一下,如果人工智能被纳入到病人护理团队当中,那么我们首先必须更好地理解AI如何对接人类医生。双方的准确性差异如何?AI能够做出哪些具体或者独特的贡献?AI在哪些领域最具帮助,又是否可能造成危害?只有回答了这些问题,我们才能真正开始预测,而后构建起以AI为支柱的美好未来。
AI vs. 人类医生
尽管相关工作仍处于发展初期,但人工智能在病患诊断方面已经拥有了与医生类似、甚至更胜一筹的能力。
英国牛津约翰-拉德克里夫医院的研究人员们就开发出一套AI诊断系统,能够以至少八成机率带来高于人类医生的心脏病诊断准确率。而在哈佛大学,研究人员们则打造出一款“智能”显微镜,能够检测其中潜在的致命血液感染:该人工智能辅助工具训练自100,000张相关图像,而这些图像又源自25,000张由染料处理完成(旨在进一步凸显细菌影像)的幻灯片,该AI系统能够以95%的准确率对细菌进行分类。日本横滨昭和大学的一项研究显示,一种新型计算机辅助内镜系统能够显示结肠位置的潜在癌细胞生长迹象,灵敏度为94%、特异性为79%、准确性为86%。
在某些情况下,研究人员还发现,AI能够在需要快速判断的诊断条件下胜过人类医生——例如确定病变位置是否属于癌变等。
在2017年12月由美国医学会杂志发表的一项研究当中,深度学习算法在时间有限的情况下能够比人类放射科医生更好地诊断转移性乳腺癌。尽管人类放射科工程师在时间充裕的情况下同样能够作出良好的判断,但在实际情况下(特别是在急诊室等容量巨大且病患快速流转的环境中),快速诊断很可能直接决定着患者的生死存亡。
当然,IBM Watson就拥有这样的诊断能力:在针对来自肿瘤细胞的遗传数据作出有意义的分析见解时,人类专家需要花上约160个小时来审查并根据发现提供治疗建议; 相比之下,Watson只用了10分钟就能给出同样的可操作建议。谷歌最近也公布了一套开源DeepVariant版本,这是该公司用于解析遗传数据的人工智能工具,并在去年的FDA Truth挑战赛当中成为准确度最高的工具。
AI技术在预测健康事件方面的表现同样优于人类。
去年4月,诺丁汉大学的研究人员们发表了一项调查,结果表明通过利用来自378,256名患者的大量数据进行训练,AI实现了高于现有标准7.6%的患者心血管发病事件预测准确率。研究人员们在报告中写道:“在作为测试样本的约83,000条记录当中,这样的准确率提升意味着AI将额外挽救355名病患的生命。而更值得注意的是,神经网络的‘误报’机率也比标准方法低1.6%——一旦作出误判,患者很可能受到不必要的治疗或者护理程序,而其中很多其实相当危险。”
AI技术超越人类表现的主要领域,集中在具备大量数据储备的情况下,而这正是目前精准医学快速发展的核心方向。
人类诊断项目(简称Human Dx)正是为了填充这项空白而建立,其将机器学习与人类医生的实践经验加以结合。该机构正整理来自80多个国家的7500名医生与500家医疗机构的输入信息,以便开发出一套系统,确保患者、医生、机构、设备开发人员以及研究人员皆可加以访问并作出更为明智的临床决策。
人类诊断项目非营利组织主任Shantanu Nundy在接受采访时表示,在涉及到任何行业性技术的开发时,人工智能都应被集成至其功能当中。“必须在设计当中考虑到最终用户的实际需求。人们会使用Netflix,但并不代表他们想要‘用来看电影的AI’,对吧?人们会使用Amazon,但却不代表他们想要‘用来购物的AI’。”
换句话来说,如果此类技术设计得足够出色,并以一种人们认为有用的方式来实现,那么人们甚至意识到不自己正在使用AI。
对于思想开放、富有前瞻性的临床医生们来说,像Human Dx这样的项目可谓极具吸引力。因为其能够帮助从业者们减少在技术钻研方面所投入的时间。DC特区执业工程师Nundy在采访中表示,“我们现在需要把50%以上的时间花在电脑屏幕前。”而AI技术的出现将帮助医生更为高效地解决甚至摆脱文书工作等行政负担。
从这个角度来讲,在医疗领域,人工智能的意义并不一定在于取代医生,而是优化并提高其业务能力。
心理医疗与人情味总部位于波士顿的人工智能与行为分析企业Cogito公司移动健康阅读首席行为科学主管Skyler Place在采访中表示:“我认为人工智能的价值在于增强人类的能力,而非取代人类。”Cogito公司一直利用人工智能语音识别与分析功能帮助来自众多行业的客户改善服务交互效果,尤其是一款用于追踪病人行为的心理健康应用程序——Cogito Companion。
这款应用能够监控病人的手机以识别其中的主动及被动行为信号,例如位置数据,从而了解病人是否多日待在家中;或者提取通信日志以追踪其是否长期未与他人发送短信或通话(Cogito称,该应用只会了解病人是否使用电话或短信功能,而不会追踪其中的具体内容)。患者的护理团队可以监控报告中包含的迹象,进而把握患者可能出现的整体心理健康状态变化。
Cogito公司已经联合波士顿各地多个医疗卫生系统以测试这款应用,且该应用目前已经在退伍军人群体当中找到合适的施展空间。退伍军人往往面临着被社会孤立的风险,且可能出于自尊心而不愿接受来自医疗系统的援助——特别是心理健康指导。Place指出,“我们发现这款应用能够建立起信任,从而通过更为广泛的方式推动医疗行业的参与。”他同时补充称,该应用“能够有效作为行为转变的起点”,包括帮助退伍军人适应这种引导并逐步接受精神治疗服务。
这正是AI技术的作用所在:利用机器学习算法分析“音频检查”——即病人的录音(类似于音频日记)。这些算法能够从中提取情绪线索,如同两个人在说话一样。Place解释称,“我们能够建立符合人们口头表达方式的算法,包括精力、语调、对话活跃度以及流量等。”
以此为基础,人类对算法进行训练,旨在帮助其理解什么样的表达听起来“可信”或者“能力”,从而确定抑郁症患者的声音特征、或者狂躁症患者的声音差异。该应用除了为患者提供实时信息以追踪情绪之外,此类信息还有助于临床医生随时间推移全程追踪患者的进展情况。在Cogito公司,Place已经看到了人工智能在帮助我们理解人类对话以及心理健康状况方面的巨大潜力。
然而,理解只是第一步,其终目标在于找到一种可行的治疗方法——而这正是医生目前在精神健康问题方面发挥的作用。那么,在面对更为实际的问题时,机器人又该扮演怎样的角色?
外科手术机器人在过去几十年当中,人工智能在医学领域最重要的应用之一,集中体现在外科手术机器人的发展当中。
截至目前,在大多数情况下,外科手术机器人(其中最著名的当然是da Vinci)都作为人类外科医生的延伸,负责控制操作台上的各类设备。2010年在蒙特利尔进行的全球首例手术当中,手机机器人与机器人麻醉医生(被称为McSleepy)完成了自己的首秀。相关数据反映出,这些机器人医生确实带来了令人印象深刻的表现。
2015年,距离第一台手术机器人进入手术室十多年之后,麻省理工学院对FDA数据进行了回顾性分析,旨在评估机器人手术的安全性水平。研究期间共出现144例死亡、1391人受伤,这主要是由于技术难题或设备故障所造成。报告指出:“尽管报告数量相对较多,但绝大多数手术都获得了成功,其中没有出现任何问题。”但对于更为复杂的手术部位(例如心外科手术),问题的出现次数明显高于妇科及普通外科手术。
结论基本可以总结为:虽然手术机器人能够在某些专业方向上带来良好表现,但对于更复杂的手术,最好还是留给外科医生进行处理——至少目前如此。但这种情况可能很快发生改变,而且手术机器人将能够以更为独立的方式摆脱对人类外科医生的依赖,到时候我们可能很难判断在发生问题时到底该由谁承担责任。
患者可以起诉机器人吗?毕竟这项技术还相对比较年轻,因此这类诉讼将遭遇法律层面的灰色地带。从传统角度讲,专家们认为医疗事故是由工程师的疏忽所造成,或者违反了明确的医疗标准。然而,疏忽这一概念意味着人工智能本身存在某种意识缺失,可以想象的是如果机器人自身被认定为一种效能标准,则必须拥有对应的规则对其加以约束。
因此,如果问题不能归咎于机器人,那么责任应该由谁来承担?患者家属是否会要求负责监督机器人的人类外科医生负责?或者应该由机器人的制造公司负责?或者是由负责设计工作的工程师负责?这个问题目前还没有明确的答案,但可以肯定的是我们必须尽早为其找到解决方向。
不必夸大,将AI放在最对的位置未来几年,AI技术在医疗领域的作用将持续升级:在埃森哲发布的一份报告当中,2014年的医疗市场AI总值为6亿美元。而到2021年,这一数字很可能达到66亿美元。
这一行业可能将蓬勃发展,但我们不应该急于或随意整合AI技术。为何这么说?因为人类所遵循的逻辑可能与机器并不契合。
举例来说,经过训练的人工智能方案能够确定特定皮肤病是否属于潜在癌变。皮肤科医生经常会使用rulers来判断病变的癌变可能性,但AI在训练过程中使用的则是活检图像,如果图像中出现了rulers,则其有可能会认定这意味着目标病患出现了癌变——听起来荒谬,但这就是机器的学习方法。
算法也有可能继承我们的偏见,这主要是由于用于训练AI的素材缺乏多样性。无论是在医学还是其它领域,机器训练所使用的数据在很大程度上取决于研究者自身的身份以及进行训练的位置。
医疗决策的另一个宗旨在于,程序或治疗所带来的好处是否超过风险。在考虑人工智能是否可以与手术室的外科医生拥有平等地位时,我们首先需要投入大量时间对其中的风险收益与对等分析作出研究。
Human Dx的Nundy表示,“我认为如果能够和正确的相关方一起构建技术,同时投入更多努力以实现这个目标,那么我相信我们将彻底改变未来。实际上,我们正在努力塑造新的未来。”
虽然有时候我们会对AI主导下的机器人方案引入医学领域感到担忧,但人类正在进行探索,并最终推动这种变化。我们将决定应该在哪里使用AI技术,又该在哪里继续沿用传统解决方法——而不是一味试图预测未来20年医生将以怎样的方式进行诊疗。医生完全可以利用人工智能作为工具,着手建立自己预期中的未来——对他们自身以及病患都更加美好的未来。