DeepSeek之后！又一国产开源大模型接入国家级平台

3月10日，科技圈迎来一则重磅消息：国家超算互联网平台正式接入了阿里巴巴的通义千问大模型，并对外提供千问QwQ-32B API服务！用户还能免费获得100万tokens的体验额度，可以说是给广大开发者和AI爱好者送上了一份“科技大礼包”。千问QwQ-32B，堪称阿里通义团队新推出的“推理小巨人”。在数学、代码和通用能力等多项权威评测中，它的表现丝毫不逊色于“满血版”671B的DeepSeek-R1，且超越了o1-mini和同尺寸的R1蒸馏模型。值得一提的是，千问QwQ-32B一经发布，便迅速登顶全球最大AI开源社区HuggingFace的趋势榜，成为当下炙手可热的开源大模型。

DeepSeek和通义系列模型的成功，不仅打破了美国在AI领域的技术垄断，还为中国AI赢得了国际认可。坚定开源路线，与DeepSeek并列开源双雄阿里通义团队的“开源宇宙”也在不断扩张。截至目前，他们已经开源了千问Qwen大语言模型和万相Wan视觉生成模型两大系列，共计200余款模型，覆盖从0.5B到110B的全尺寸范围。这些模型不仅在Chatbot Arena、司南OpenCompass等权威榜单上屡次斩获“全球开源冠军”和“国产模型冠军”，还衍生出了超过10万个模型，成功超越了Meta公司的Llama系列，登顶全球开源大模型的巅峰。

高盛集团预测，AI的广泛应用将为中国GDP带来20至30个基点的增长。此外，DeepSeek的开源策略被外媒誉为“人工智能的DeepSeek时刻”，标志着中国AI技术正深刻改变全球创新格局。

自2023年8月首开国内大厂开源大模型先河以来，阿里云已开源Qwen、Qwen1.5、Qwen2、Qwen2.5等4代模型系列，覆盖从0.5B到110B等“全尺寸”，视觉、语音等“全模态”，总计将通义千问家族超200款模型的研究成果贡献给了开源社区，也为开发者提供最广泛的模型选择。这体现了中国极客们最深沉的爱——开源精神和信息普惠。在全球主流AI开源社区Hugging Face上，千问系列衍生模型数突破10万，成为全球最大开源模型，持续领先美国Llama等其他开源模型。千问也是支持语种最多的开源模型，不少小语种模型还是当地语言体系中最好的大模型。而OpenAI 的GPT系列等顶级模型并不开源，因此无法下载用于此类研究。押注“AI+云计算”，带动股价累计涨超80%在这一轮AI推理模型技术中，千问Qwen模型是产学研各界的共同选择。

2024年9月，阿里云开源通义千问Qwen2.5模型系列

此前爆火的DeepSeek公司基于R1推理模型蒸馏了6个模型开源给社区，其中有4个模型来自Qwen；著名AI科学家李飞飞团队用较少的资源和数据训练出的s1推理模型同样以Qwen模型为基础模型。国内外开发者认为，以上模型取得的良好成绩跟基础模型的强大性能有很大关系。“阿里云将把促进中国大模型生态的繁荣作为首要目标，向大模型创业公司提供全方位的服务，包括最强大的智能算力和开发工具，并在资金和商业化探索方面提供充分支持。”2023年7月，阿里云CTO周靖人在上海世界人工智能大会发表演讲时表示。《南华早报》此前报道称，阿里通义千问Qwen模型使斯坦福、伯克利复刻低成本DeepSeek成为可能。《南华早报》认为，阿里巴巴模型的能力再次证明，中国正在缩小与美国领先企业的人工智能差距，而基于阿里Qwen开源开放的路线，研究人员越来越多地利用阿里巴巴的技术来降低AI训练成本。2月以来，阿里继续重注云计算和AI，吴泳铭宣布未来三年将投入超过3800亿元，用于建设云和AI硬件基础设施，总额超过去十年的总和。阿里股价因持续加码云计算和AI迎来一路飙涨，自1月13日以每股77.35港元的价格启动以来，到吴泳铭宣布3800亿计划时（2月24日）达到140.90港元的新高点，累计涨超82.1%。阿里云方面表示，希望通过开源，让海量中小企业和AI开发者更早、更快地用上通义千问，推动大模型技术的普惠和应用的落地，促进中国大模型生态建设。目前，通义系列大模型在技术创新和行业应用上均位居大模型行业前列，中国一汽、联想、微博、携程、喜马拉雅、三得利（中国）等30万企业客户已经接入通义大模型。

来源：极目新闻记者周丹编辑：吴静

责编：张浩

审核：胡钊钦