人工智能的火爆,使大模型等技术逐渐成为金融行业的主攻技术方向。度小满不断加快推动大模型在金融各大场景中的应用,研发推出“轩辕”,让大模型发挥真正价值,为助推金融行业创新发展注入活力。近日,度小满宣布“轩辕”系列新增12款金融大模型。这12款金融大模型具备“以小搏大”实力,可降低大模型的应用门槛。
度小满“轩辕”展示出金融领域专家水平
3月11日,度小满宣布“轩辕”系列金融大模型新增开源6B、13B、70B三种参数12款金融大模型。这12款大模型具有“以小搏大”的实力,在用户信息分析、业务数据洞察等十余种金融实际任务评测中,达到自身2倍甚至5倍参数量的模型水平。
三种参数的基座模型、对话模型、int4量化模型、int8量化模型完全开源,开发者可在GitHub、HuggingFace、Model Scope等开源社区内下载使用。
在“轩辕”模型矩阵中,70B及以上模型适合针对需要深度分析、复杂指令执行以及全方位Agent调用的场景,而6B、13B的模型则更加适用于对响应速度有高要求、面向小规模场景和单任务的应用。”轩辕”6B-4-bit量化Chat模型则以其低推理部署成本,进一步降低大模型的应用门槛。
专注中文金融领域任务FinanceIQ大模型金融自动评测集显示,在注册会计师(CPA)、银行从业资格、基金从业资格、证券从业资格等多项金融领域考试中,“轩辕”展示出金融领域专家的水平。
(“轩辕”系列大模型拥有远超同参数水平的金融能力)
“轩辕”系列大模型在训练方式上进行了多项创新,例如将人类偏好对齐技术引入了金融大模型训练。通常多数垂类大模型仅在微调阶段引入特定领域数据,但这种方法在实际应用中常常显示出局限性,金融行业的复杂性要求模型能够更深入地理解并适应行业特定的需求。为此,度小满构建了涵盖通用性、安全性和金融特性的Prompt数据集,并组织了专业的标注团队对成对的回答进行偏好标注,从而收集到了一批高质量、广覆盖的偏好数据,并通过一系列实践、分析和改进成功完成了奖励模型和后续的强化训练。
“轩辕”模型矩阵再次升级,实现多场景任务适配
度小满在2023年5月开源国内首个千亿级中文金融大模型“XuanYuan-176B”。2023年9月,“XuanYuan-70B”大模型在C-Eval和CMMLU两大权威榜单上位列所有开源模型榜首。本次度小满”“轩辕””模型矩阵再次升级,十亿-百亿-千亿参数全覆盖,实现多场景任务适配。
业内普遍认为,金融大模型的价值体现在其能否在核心业务场景中发挥实际作用,如通过综合分析用户信息以支持风险评估、刻画客户画像等。目前,”轩辕”金融大模型已经应用在度小满各个业务场景,从营销、客服、风控、办公再到研发,已经初见成效。在代码助手方面,用大模型辅助生成的代码,采纳率能够达到42%,帮助公司整体研发效率提升了20%;在客服领域,大模型推动服务效率提升了25%。
一直以来,度小满围绕大模型加快技术创新,将大模型应用到各个业务场景中,借助创新技术实现降本增效的目的。如今,随着“轩辕”系列新增12款金融大模型,“轩辕”系列也将应用到金融各大场景中,破解行业诸多技术难题,为金融行业创新发展深度赋能。