紫牛热点|南航领衔团队低成本训练4小时，DeepSeek数学能力暴涨

扬眼 2025-03-04 17:56:59

AI大语言模型虽然是目前最热门的话题，不过它们的数学能力一直存在短板。南京航空航天大学联合南通大学、牛津大学组成的团队发现，通过低成本地训练，对国产开源AI大模型DeepSeek的7B小版本和Qwen2.5-14B进行推理指导，它们的数学推理能力就开始暴涨，甚至成功构造出困扰全世界数学家的关键反例。

这项发表于2024年2月27日的研究由南京航空航天大学的研究者李可晨担任第一作者，联合南通大学的嵇天博，以及牛津大学的两位研究者共同完成。研究聚焦于提升大语言模型（LLM）解决复杂数学问题的能力，其突破性成果直指著名的“希尔伯特第十七问题”——这个由德国数学大师大卫·希尔伯特在1900年提出的世纪难题，涉及有理函数的多项式表示，其首个反例直到1927年才被发现，至今仍是一个重要的数学难题，在自动驾驶算法、量子计算验证等前沿领域具有重要应用价值。

研究团队创新性地开发了“结构化推理指导”训练法，仅用2张A100显卡训练4小时的DeepSeek的7B小模型，不仅在准确率上超越671B参数的DeepSeek-V3，响应速度还提升50倍以上。

他们对另一个国产开源模型Qwen2.5-14B进行这样的训练，经过优化的模型自主构建出一个全新多项式，成功挑战了希尔伯特问题的现有理论边界——这类关键反例的发现通常需要数学家数十年探索，而AI仅用数小时就实现了创造性突破。研究者预言，AI大语言模型离破解这类数学难题又近了一步。

扬子晚报/紫牛新闻记者宋世锋

校对盛媛媛

1 阅读：29