全面超越Deepseek,阿里大年初一放大招

心平气和看事 2025-02-01 03:35:56

先记住“Moe模型”这个词,它未来可能会对AI圈、金融圈等产生重大影响。

10天前,浙江的小公司DeepSeek(深度求索)发布的V3模型火了,震惊了美国AI圈和金融圈,还登上了新闻联播,这使得扎克伯格一度呼吁美国加紧封锁中国AI技术。

而阿里云反应迅速,其算法专家发现DeepSeek用的是Moe模型,阿里的Qwen用的同样是Moe模型,且在Moe架构领域,Qwen是规模最大的,有20万亿Tokens(相当于1.5亿本小说)。为了应对,阿里工程师加班加点,在大年初一(2025年1月29日凌晨 )发布了新的模型Qwen2.5-Max 。

高级算法专家林俊旸表示,Qwen2.5-Max这个版本最突出的两点是:

超大规模的MoE模型,预训练数据超20万亿Tokens。

全面超越DeepSeek V3,性能更优且更节约算力。

在多个基准测试中,Qwen2.5-Max表现出色:

在Arena-Hard、LiveBench、LiveCodeBench、GPQA-Diamond等基准测试中超越DeepSeek V3、Llama-3.1-405B以及闭源模型GPT-4o ,和Claude-3.5-Sonnet也能一较高下。

在针对模型知识理解和推理能力的MMLU-Pro等基准测试上,Qwen2.5-Max同样超越DeepSeek V3、Llama-3.1-405B 。

Qwen2.5-Max是继DeepSeek之后的又一款国产开源AI大模型,这一模型是对混合专家(MoE)架构的全新探索,展示了极为强劲的综合性能,引发了业界的广泛关注。 此外,作为此次发布的一部分,阿里云还推出了视觉理解模型Qwen2.5-VL,该模型同样采用开源策略,其三个版本(3B、7B及72B)在13项权威评测中均表现优秀,特别是旗舰版Qwen2.5-VL-72B在视觉理解方面获得了冠军,甩开了GPT-4o和Claude 3.5。

9 阅读:1502

评论列表

澄州传奇

澄州传奇

14
2025-02-02 13:23

别来蹭热度,滚远点

心胜

心胜

11
2025-02-02 09:17

看好阿里云!!!

江湖夜雨

江湖夜雨

4
2025-02-02 22:54

早干嘛去了[笑着哭][笑着哭][笑着哭]

用户18xxx73

用户18xxx73

4
2025-02-02 11:18

阿云就是搅屎棍子

家新

家新

4
2025-02-02 16:45

蹭流量,蹭热度,可恶!

●″☆Silen★

●″☆Silen★

3
2025-02-01 16:21

最终还是要看实际体验,测试终归还是是给个理论性能

asjack

asjack

3
2025-02-01 16:26

美国对Qwen2.5-Max一点都不恐慌,但对deepseek正句全国甚至世界之力进行暴打!

春天

春天

3
2025-02-02 21:17

怎么要不公布????

用户28xxx48

用户28xxx48

3
2025-02-02 11:34

阿里AI多厉害美国股市也不感冒,深度求索一出美西方国家都崩盘。

一月不翻车记录保持者

一月不翻车记录保持者

3
2025-02-02 22:07

啥子DeepSeek像不像十一之前一周的古市??铺天盖地,大战略,大牛市……大大大……结果,十一一过,梦醒啦……现在的媒体,半个字都不能信,信了的就是煞笔。

世界和平

世界和平

2
2025-02-02 17:41

阿里和美国一样花了天价的资金,搞的AI,还不要脸说自己多么强!和美国一样的货色。

ht3939

ht3939

2
2025-02-01 16:15

又想开始窝里斗?这个日本人[抠鼻]

michael鹏wjp

michael鹏wjp

1
2025-02-02 17:30

国内的喷子就是喜欢嘴炮。任意好的东西必然能被世人感受到,如果没有,大概率不是事情的真相

1條蕗1爿兲1個辵卞佉

1條蕗1爿兲1個辵卞佉

1
2025-02-02 19:19

阿里看到蛋糕被分赶紧下场不然汤都没得喝!

心平气和看事

心平气和看事

感谢大家的关注