对一名孤独症儿童进行能力水准评估并制定个性化干预方案,需要多久?
过去,专业督导梁琳婕需要用3个小时,她任职于国内领先的特殊需要儿童康复机构大米和小米,这个用时也代表了国内一线督导的水准。
而现在,这一过程已经被压缩到50分钟以内,未来还会更短,而且准确性不下降。
近日,岭南师范学院广东省特殊儿童发展与教育重点实验室李清华教授团队与深圳市复米健康科技有限公司(大米和小米),共同在《现代特殊教育》杂志2024年11月刊上发表论文《基于大语言模型的孤独症儿童课程本位智能评估的循证研究》,该期刊创办于1992年,是全国第一份正式出版的特殊教育专业期刊,也是发行量最大的特殊教育刊物。
该研究指出,基于大语言模型(LLM)对孤独症儿童功能进行智能评估,其Jaccard指数(一致性指数)可达72%(基于较早期的取样结果)。这个智能评估在数据输入后只要1分钟即可生成,专业督导在AI生成基础上再做复核和调整,整体50分钟内可以完成,准确性和过去3小时人工完成的报告相当。
该智能评估作为行业内的首度原创性尝试,极大提升了孤独症儿童的评估干预效率。
可实现优秀评估师经验的数字化复制和传承
论文中的这个智能评估,是大米和小米研发的AI解决方案RICEAI中的应用之一——AI评估师。根据论文所描述,RICEAI在参考其他领域的同类型研究设计的基础上,结合孤独症儿童康复领域的真实场景需求和数据,进行针对性的建模和训练,以达到评估和输出个别化干预方案的效果。
随后,通过373个新样本的测试,将智能评估结果及生成的个性化干预方案,与专业评估师的判断进行比对,从而评价其准确率。
结果表明,Jaccard整体指数为72%,也就是说,智能评估结果及生成的个性化干预方案与专业评估师的判断和方案,相似度达到72%。
与60月龄的ASD(孤独症)儿童评估结果对比,该评估针对24-48月龄幼龄个案的Jaccard指数要显著优异。此外,Jaccard指数并没有因ASD儿童的性别和是否有诊断结果而存在显著差异。
“我们希望探索人工智能领域的大语言模型在孤独症评估、康复流程上的应用,最终将部分人工的工作交由大语言模型去产出,并且质量和关联度要和专业的评估师有较大的一致性。”论文第一作者、岭南师范学院广东省特殊儿童发展与教育重点实验室教授李清华表示。
论文作者之一、大米和小米研发副总裁王占伟解释,智能评估输出较为准确的干预模板后,评估师可结合实际与孩子的互动观察及家长的反馈,进一步微调和优化,从而很好地节省时间精力,并实现优秀评估师经验的数字化复制和传承。而且随着算法的成熟,最新的后台监测数据显示准确度已经超过80%,未来准确率还将持续提高。
AI的有效应用,对实现康复普惠具里程碑意义
AI评估师根据孤独症儿童信息进行评估并输出个性化干预方案,涵盖评估结果与分析、干预目标、干预计划等维度,再由评估师进行审核和微调,大大减轻人工撰写报告的工作量。
整体用时可从3小时下降到50分钟。
据2024年《中国孤独症教育康复行业发展状况报告》保守估计,全国0至14岁孤独症儿童约200万,且每年新增约16万。孤独症群体“千人千面”,每个儿童的症状和需求都是独特的,而个性化评估是科学干预的前提。
传统的孤独症评估,很大程度上依赖于专业督导的个人能力和经验,这一过程耗时耗力,极大影响了督导的工作效率。
“AI在这个领域被有效应用后,能极大降低对人力的依赖,对实现康复普惠具有里程碑意义。”王占伟介绍,该项目从2023年筹备立项,运用了大米和小米过去10年积累的20000多个案的8000多万组干预记录、200多万干预标签以及200多万督导决策数据,海量实操数据是项目能够研发成功的“地基”。
李清华认为,该项目具有较重大的科学创新和临床应用价值,打开了孤独症康复和人工智能结合的研究可能和方法路径,同时在研发过程中整个团队坚持产学研结合,很好地实现了从研发到应用的无缝对接。
“理想的目标是评估方案能达到90%甚至更高的准确率。此外,随着数据学习和模型的成熟,智能系统很有可能输出评估师意想不到、但确实有用的恰当干预目标。”论文作者之一曾松添博士指出。
王占伟表示,研究团队还在进一步尝试将该技术应用在多动症、言语障碍的评估,也在考虑引入多模态模型(语音语义识别、图像和视频识别),提升干预流程的效率和效能。