东南大学基于昇腾算力接入阿里QwQ-32B大模型

中关村在线 2025-03-10 18:35:35

近日,东南大学正式宣布,该校基于国产昇腾算力平台成功接入阿里巴巴最新开源的大模型QwQ-32B,成为全国首家上线该服务的高校。这一成果标志着东南大学在人工智能领域的技术应用和科研能力迈上了新的台阶。

据介绍,尽管QwQ-32B模型仅有32B参数规模,但经过大规模强化学习训练,其性能表现相当突出。在数学推理(AIME24评测)、代码生成(LiveCodeBench)以及工具调用(BFCL测试)等多个任务中,QwQ-32B的表现与参数规模达671B的DeepSeek-R1不相上下,甚至在部分指标上实现了超越。

从性能对比来看,QwQ-32B在上述测试中的表现显著优于o1-mini和同尺寸的R1蒸馏模型,展现了其高效能与高潜力。东南大学方面表示,该模型具备消费级显卡本地部署的能力,极大地降低了硬件门槛,同时充分利用了昇腾平台提供的高效算力资源,为师生在科研工作中快速实现人工智能推理需求提供了有力支持。

此外,QwQ-32B还集成了工具调用与动态推理功能,能够根据环境反馈实时调整策略,适用于数据分析、实验模拟等复杂的科研场景。这种灵活性使其在解决实际问题时更具优势。

相关资料显示,QwQ-32B是阿里巴巴推出的最新推理模型,虽然参数规模仅为DeepSeekR1的约1/20,但其性能表现却媲美甚至超越了后者,展现了强大的技术实力。东南大学此次成功接入该模型,不仅推动了国产算力平台的应用落地,也为高校科研工作提供了更多可能性。

0 阅读:10
中关村在线

中关村在线

最新最快最全的IT头条新闻资讯