阿里发布并开源Qwen3,基准测试指标相当给力

了不起的云计算 2025-04-29 06:31:14

4月29日凌晨,阿里正式对外发布Qwen3系列模型。DeepSeek-R1、OpenAI的o1和o3-mini、马斯克的Grok-3以及谷歌的Gemini-2.5-Pro等顶级模型相比,展现出极具竞争力的结果。

Qwen3 的基准测试指标相当好,其中,旗舰模型Qwen3-235B-A22B表现卓越,而小型MoE模型Qwen3-30B-A3B激活参数数量仅为Qwen3-32B的10%,但性能更优

此外,Qwen3-4B小模型也能匹敌Qwen2.5-72B-Instruct的性能,展现了强大的轻量化应用能力,这对开源社区太重要了!可以说,阿里巴巴从Meta手中接过了主流开源模型生产者的火炬。

Qwen3系列支持高达256K的上下文长度,涵盖推理与非推理任务,并延续多模态扩展能力,支持文本、图像、音频与视频处理,适用于复杂任务和多种应用场景。部分模型权重将开源,同时提供企业级安全与定制化部署支持。

Qwen3系列模型已经发布。用户可点击“阅读原文”或访问官网页面进行体验。模型地址:modelscope.cn/collections/Qwen3-9743180bdc6b48

另外,QwenChat也已经上线Qwen3:https://chat.qwen.ai/有兴趣的小伙伴可以去官网“调戏”一下。

0 阅读:5
了不起的云计算

了不起的云计算

致力于数字化转型问题的技术探讨和解决!