3月10日,科技圈迎来一则重磅消息:国家超算互联网平台正式接入了阿里巴巴的通义千问大模型,并对外提供千问QwQ-32B API服务!用户还能免费获得100万tokens的体验额度,可以说是给广大开发者和AI爱好者送上了一份“科技大礼包”。千问QwQ-32B,堪称阿里通义团队新推出的“推理小巨人”。在数学、代码和通用能力等多项权威评测中,它的表现丝毫不逊色于“满血版”671B的DeepSeek-R1,且超越了o1-mini和同尺寸的R1蒸馏模型。值得一提的是,千问QwQ-32B一经发布,便迅速登顶全球最大AI开源社区HuggingFace的趋势榜,成为当下炙手可热的开源大模型。

DeepSeek和通义系列模型的成功,不仅打破了美国在AI领域的技术垄断,还为中国AI赢得了国际认可。坚定开源路线,与DeepSeek并列开源双雄阿里通义团队的“开源宇宙”也在不断扩张。截至目前,他们已经开源了千问Qwen大语言模型和万相Wan视觉生成模型两大系列,共计200余款模型,覆盖从0.5B到110B的全尺寸范围。这些模型不仅在Chatbot Arena、司南OpenCompass等权威榜单上屡次斩获“全球开源冠军”和“国产模型冠军”,还衍生出了超过10万个模型,成功超越了Meta公司的Llama系列,登顶全球开源大模型的巅峰。

高盛集团预测,AI的广泛应用将为中国GDP带来20至30个基点的增长。此外,DeepSeek的开源策略被外媒誉为“人工智能的DeepSeek时刻”,标志着中国AI技术正深刻改变全球创新格局。
自2023年8月首开国内大厂开源大模型先河以来,阿里云已开源Qwen、Qwen1.5、Qwen2、Qwen2.5等4代模型系列,覆盖从0.5B到110B等“全尺寸”,视觉、语音等“全模态”,总计将通义千问家族超200款模型的研究成果贡献给了开源社区,也为开发者提供最广泛的模型选择。这体现了中国极客们最深沉的爱——开源精神和信息普惠。在全球主流AI开源社区Hugging Face上,千问系列衍生模型数突破10万,成为全球最大开源模型,持续领先美国Llama等其他开源模型。千问也是支持语种最多的开源模型,不少小语种模型还是当地语言体系中最好的大模型。而OpenAI 的GPT系列等顶级模型并不开源,因此无法下载用于此类研究。押注“AI+云计算”,带动股价累计涨超80%在这一轮AI推理模型技术中,千问Qwen模型是产学研各界的共同选择。
2024年9月,阿里云开源通义千问Qwen2.5模型系列
此前爆火的DeepSeek公司基于R1推理模型蒸馏了6个模型开源给社区,其中有4个模型来自Qwen;著名AI科学家李飞飞团队用较少的资源和数据训练出的s1推理模型同样以Qwen模型为基础模型。国内外开发者认为,以上模型取得的良好成绩跟基础模型的强大性能有很大关系。“阿里云将把促进中国大模型生态的繁荣作为首要目标,向大模型创业公司提供全方位的服务,包括最强大的智能算力和开发工具,并在资金和商业化探索方面提供充分支持。”2023年7月,阿里云CTO周靖人在上海世界人工智能大会发表演讲时表示。《南华早报》此前报道称,阿里通义千问Qwen模型使斯坦福、伯克利复刻低成本DeepSeek成为可能。《南华早报》认为,阿里巴巴模型的能力再次证明,中国正在缩小与美国领先企业的人工智能差距,而基于阿里Qwen开源开放的路线,研究人员越来越多地利用阿里巴巴的技术来降低AI训练成本。2月以来,阿里继续重注云计算和AI,吴泳铭宣布未来三年将投入超过3800亿元,用于建设云和AI硬件基础设施,总额超过去十年的总和。阿里股价因持续加码云计算和AI迎来一路飙涨,自1月13日以每股77.35港元的价格启动以来,到吴泳铭宣布3800亿计划时(2月24日)达到140.90港元的新高点,累计涨超82.1%。阿里云方面表示,希望通过开源,让海量中小企业和AI开发者更早、更快地用上通义千问,推动大模型技术的普惠和应用的落地,促进中国大模型生态建设。目前,通义系列大模型在技术创新和行业应用上均位居大模型行业前列,中国一汽、联想、微博、携程、喜马拉雅、三得利(中国)等30万企业客户已经接入通义大模型。
来源:极目新闻记者 周丹编辑:吴静
责编:张浩
审核:胡钊钦