紫牛热点|南航领衔团队低成本训练4小时,DeepSeek数学能力暴涨

扬眼 2025-03-04 17:56:59

AI大语言模型虽然是目前最热门的话题,不过它们的数学能力一直存在短板。南京航空航天大学联合南通大学、牛津大学组成的团队发现,通过低成本地训练,对国产开源AI大模型DeepSeek的7B小版本和Qwen2.5-14B进行推理指导,它们的数学推理能力就开始暴涨,甚至成功构造出困扰全世界数学家的关键反例。

这项发表于2024年2月27日的研究由南京航空航天大学的研究者李可晨担任第一作者,联合南通大学的嵇天博,以及牛津大学的两位研究者共同完成。研究聚焦于提升大语言模型(LLM)解决复杂数学问题的能力,其突破性成果直指著名的“希尔伯特第十七问题”——这个由德国数学大师大卫·希尔伯特在1900年提出的世纪难题,涉及有理函数的多项式表示,其首个反例直到1927年才被发现,至今仍是一个重要的数学难题,在自动驾驶算法、量子计算验证等前沿领域具有重要应用价值。

研究团队创新性地开发了“结构化推理指导”训练法,仅用2张A100显卡训练4小时的DeepSeek的7B小模型,不仅在准确率上超越671B参数的DeepSeek-V3,响应速度还提升50倍以上。

他们对另一个国产开源模型Qwen2.5-14B进行这样的训练,经过优化的模型自主构建出一个全新多项式,成功挑战了希尔伯特问题的现有理论边界——这类关键反例的发现通常需要数学家数十年探索,而AI仅用数小时就实现了创造性突破。研究者预言,AI大语言模型离破解这类数学难题又近了一步。

扬子晚报/紫牛新闻记者 宋世锋

校对 盛媛媛

1 阅读:29
扬眼

扬眼

扬子晚报原创新闻品牌