经济观察网胡群/文12月24日,恒生电子董事长刘曙峰向经济观察网表示:“金融大模型目前仍处于初级阶段,中国企业级应用的落地情况慢于预期。我非常期待2025年大模型在金融多个场景中会有长足的发展。”
近日,恒生研究院发布的《2024金融行业大模型应用观察》(下称《观察》)显示,大模型在投研服务、运营管理、投顾与客服、代码开发等场景中的意图识别、任务执行能力已得到较为充分的验证,并已在一些头部金融机构中投入实际生产,发挥实质性作用。
《观察》同时认为,由于金融行业对业务复杂性、准确性、可解释性有着远高于一般应用场景的要求,如投资过程的任何偏差都有可能给投资者带来损失,金融机构在处理客户数据时必须确保足够的精确度等原因,金融大模型仍未出现能够彻底颠覆现有业务模式、引领行业变革的“杀手级”人工智能原生应用。
谨慎推进
2024年11月,恒生研究院开展了市场调研,并结合当前实施的项目情况进行分析。结果显示,2024年前三季度,我国公开披露的大模型项目中标总额达到20.75亿元,较2023年全年增长163%。其中,金融行业的大模型中标项目数量为66个,项目金额达1亿元,占比4.9%。2024年1月至11月,金融行业的大模型中标项目数量增至103个,项目金额增至2亿元。
上述调研显示,在2024年前11个月的细分行业中,银行业的大模型项目中标金额为1.14亿元,占比56.8%;证券业为0.39亿元,占比19.2%;保险业为0.13亿元,占比6.6%。这三个行业的大模型中标项目金额合计占比达到82.6%。
然而,不可忽视的是,与政务(4.84亿元)、能源(3.10亿元)和通讯(2.00亿元)等行业相比,金融业的大模型中标项目金额明显落后。
为何会出现这种情况?
刘曙峰表示,金融领域企业级大模型的实际应用步伐不及预期,进展较为迟缓。从应用情况来看,大模型在金融行业实际生产中的主要用途为内部赋能。由于直接面向客户的服务涉及合规性和其他潜在问题,如“一本正经地胡说”所引发的问题,因此在推进客户服务方面持较为谨慎的态度。
刘曙峰表示,在内部赋能方面,包括面向企业端(ToB)的服务,大模型应用的一个显著特点是极低的入门门槛,由于自然语言对话无需额外学习,只要能够进行语言交流即可使用,这符合人类的自然行为习惯,因此使用门槛非常低。随着能力的提升,学习成本亦非常低,甚至可能呈现负成本,因为一旦开始使用,用户便无需再花费时间寻找功能按钮和菜单,从而内部赋能的效果会比较显著。然而,对于大模型直接赋能客户的服务,金融行业态度普遍较为谨慎。
《观察》显示,受合规要求严格、私有化部署及服务成本高昂、对业务准确度要求高等因素制约,金融行业运营大模型应用场景仍处于探索阶段,且投入产出不成正比。此外,这也与大模型能力和产品成熟度不够,以及企业自身数据质量不佳有关。
基础大模型崛起
当前,金融领域的大模型应用研发,主要有金融机构自研团队为主、金融科技公司为主和基础大模型供应商为主三种模式。
《观察》显示,国有大行、头部券商等机构一般采用自研策略。金融机构自研团队优势在于对业务理解深刻,贴近场景,且拥有大量的私有金融业务数据、专业知识等。自研的劣势是:金融机构在技术研发和创新的广度、深度方面,可能不如科技公司,缺乏足够的长期技术积累和同业经验分享;金融机构的资源投入有限,难以长期保持大规模的技术研发和资源投入;自研大模型适合浅层次的应用场景,但在深层次和复杂应用场景中,可能面临技术和数据处理能力的瓶颈。
恒生电子、中关村科金等机构在运营、投研、投顾等特定业务场景已推出大模型应用解决方案,优势在于具备较高的治理能力,能将原有系统资源标准化为自然语言,有助于打磨和识别,并在特定金融领域有深厚的专业知识和经验。但与大型科技公司相比,垂直金融科技厂商在算力、数据资源和人才储备方面相对不足,可能限制其在大规模技术开发(如基础大模型)和应用中的竞争力。此外,金融科技公司还面临来自金融机构自研和科技大厂的双重竞争。
《观察》称,百度、智谱、科大讯飞等基础大模型供应商技术实力强,拥有充足的计算资源、数据和人才,能够快速迭代和创新,推动技术进步和应用落地,但在金融业务场景的理解上可能不如金融机构和金融科技公司,在将技术应用于具体业务场景时,可能面临整合适配的挑战。
从恒生研究院的调研来看,不管是通用的基础大模型,还是针对金融行业训练的行业大模型,大模型本身的能力已经跨越了“好用”这个临界点。大部分金融机构会选择跟人工智能供应商合作,摩根大通、摩根士丹利、贝莱德、城堡证券、穆迪等海外机构与OpenAI、谷歌等进行合作;国内机构比如招商证券、中金财富跟通义千问,国泰君安与阶跃星辰,北京银行、华泰证券跟火山引擎进行合作等。
刘曙峰表示,由于基础大模型以每3.3个月一次的频率进行迭代,其性能持续增强。相比之下,金融行业垂直大模型的迭代速度显著落后于基础大模型。因此,在垂直领域的预训练和微调需求逐渐减少。此外,如果金融机构从基础训练开始,需要投入包括算力资源、数据资源以及人力资源在内的巨大成本。据了解,某国内基础大模型供应商的算力成本每年在10亿元以上。因此,他预计金融行业的大模型,甚至大多数行业的垂直大模型有可能逐步被功能更为全面的基础大模型所替代。金融机构的建设重点可能会从行业大模型转向关系RAG(检索增强生成技术)、智能体的开发以及服务入口的改造。
未来有望诞生颠覆性原生应用
《观察》显示,当前,大模型在券商、银行及私募基金等金融领域的应用已进入实质性部署阶段。从金融机构的实践来看,大模型降本增效的能力已经过了可行性论证阶段,特别是在运营和中后台业务处理方面,将进入实质性发展阶段。在深度决策方面,金融大模型在风险管理、投资决策等领域建构小模型和关键数据集进行辅助建模。
《观察》显示,基于对话的人机交互方式有望成为连接用户与金融服务的新入口。这不仅将极大简化服务获取流程,提高用户体验,还将促进个性化服务的发展,使金融机构能够更精准地满足客户需求。在通用领域,无论是国外的ChatGPT(聊天生成型预训练变换模型)还是国内的豆包,都已经形成了有巨大流量的新入口。在金融领域,先形成新入口效应的会是互联网平台、金融机构APP,还是其他横空出世的人工智能金融创新平台,仍需拭目以待。
刘曙峰表示,在通用领域,基于人工智能的原生应用,如ChatGPT,已成为国际市场的典型代表。与此同时,国内市场的豆包、Kimi(月之暗面公司推出的大模型)等产品也正在迅速崛起,吸引了众多用户,并重新定义了信息检索与知识获取的方式,开辟了新的流量入口。然而,在金融领域,目前还没有原生应用能够对用户交互产生显著的流量影响,也没有出现能够彻底颠覆现有业务模式、引领行业变革的“杀手级”人工智能应用。在未来两到三年内,大型模型在各行业的影响力,包括金融领域是否会出现具有影响力的原生应用,将成为一个值得关注的重要议题。