阿里宣称开源AI模型性能超越DeepSeekR1

你不懂智能君 2025-03-08 04:53:04
🤖 由 文心大模型 生成的文章摘要

阿里巴巴发布开源人工智能推理模型QwQ-32B,

阿里巴巴正式公布了一款开源人工智能(AI)推理模型QwQ-32B。据宣称,该模型性能超越DeepSeek R1,充分彰显了这家中国科技巨头在多元模型及数据中心基础设施方面强大的AI实力。

根据阿里Qwen系列AI模型开发团队发布的博文,尽管阿里新模型仅拥有320亿个参数,然而在数学运算、编码操作以及一般性问题解决等领域,其表现与具备6710亿个参数的 DeepSeek R1相比,不仅毫不逊色,甚至更胜一筹。

该团队指出,参数数量较少这一特性,使得模型运行时所需的计算资源大幅减少,进而更有利于其在更广泛范围内得到应用。

阿里新模型的这种精简设计理念,与阿里董事长蔡崇信所表达的观点高度契合。蔡崇信强调,实际应用才是实现人工智能模型开发智能最大化的核心要点。

阿里最新推理模型的发布,距离DeepSeek R1在今年1月震撼全球科技行业与股市还不到两个月。这一推理模型是一种致力于通过思考、反思以及自我批评等方式来解决复杂问题的人工智能系统。

与此同时,国内人工智能应用呈现出迅猛增长的态势。上个月,阿里宣布一项重大计划,未来三年将向云计算和人工智能基础设施投入520亿美元。这是目前中国由单一私营企业出资的规模最大的计算项目。

阿里方面还透露,QwQ-32B的表现优于拥有1000亿个参数的OpenAI o1-mini。目前,QwQ-32B 已在全球最大的开源AI模型社区Hugging Face上线。

Qwen团队认为,新推理模型性能得以提升,得益于强化学习技术,这与DeepSeek在开发R1模型时采用的技术类似。

该团队表示,这些进展“不仅展现了强化学习所蕴含的变革性潜力,同时也为朝着通用人工智能方向的进一步创新开辟了道路”。

阿里首席执行官吴泳铭在近期的一次财报电话会议中明确表示,公司当前的首要任务是开发通用人工智能,他将通用人工智能定义为能够实现人类80%能力水平的人工智能。

0 阅读:8
你不懂智能君

你不懂智能君

感谢大家的关注