谷歌宣布开源多模态大模型Gemma3媲美DeepSeek

手机中国 2025-03-13 07:45:21

[CNMO科技消息]日前,谷歌首席执行官SundarPichai宣布开源最新多模态大模型Gemma-3,主打低成本与高性能。Gemma-3提供四种不同参数规模的版本,分别为10亿、40亿、120亿和270亿参数。即便在参数量最大的270亿版本中,仅需一张H100显卡即可实现高效推理。相比之下,同类模型若要达到类似效果,至少需要提升10倍算力。因此,Gemma-3也是目前性能最强的小参数模型之一。

在性能测试方面,根据LMSYSChatbotArena的盲测数据,Gemma-3的表现仅次于DeepSeek的R1-671B,优于OpenAI的o3-mini和Llama3-405B等知名模型。

在架构设计上,Gemma-3延续了前两代的通用解码器Transformer架构,并进行了多项创新和优化。为解决长上下文带来的内存占用问题,Gemma-3采用了局部和全局自注意力层交错的架构:每5个局部层之间插入1个全局层,局部层的跨度仅为1024个token。由于只有全局层负责处理长上下文,局部层仅关注1024个token的小跨度,从而有效降低了内存占用。

多模态能力是Gemma-3的一大技术亮点。该模型能够同时处理文本和图像,并集成了定制版的SigLIP视觉编码器。这一编码器基于VisionTransformer架构,通过CLIP损失的变体进行训练。

为了评估Gemma-3的性能,谷歌在MGSM、Global-MMLU-Lite、WMT24++、RULER、MRCR等多个主流平台进行了测试。结果显示,Gemma-3在多模态任务中表现出色,例如在DocVQA、InfoVQA和TextVQA等任务中,其性能显著优于前代模型。在长文本处理方面,270亿参数版本的Gemma-3在RULER128K任务上达到了66.0%的准确率。

0 阅读:258

评论列表

COMET

COMET

16
2025-03-13 07:52

🌄 愿你的生活如同日出,每天都是崭新的开始;愿你遇见的每一刻都闪耀着希望,每一天都被温暖环绕

送绅微筒烙苔

送绅微筒烙苔

8
2025-03-13 08:07

ai喊了这么多年,今年真真切切感受到ai确实很厉害很方便 改变生活

cHArON

cHArON

7
2025-03-13 07:55

Google开源了第三代Gemma 3系列大模型,版本范围增加到了4个,分别是1B、4B、12B和27B,并且从纯粹的大语言模型升级到了多模态大模型,即支持图片和视频的输入。

瑋聰

瑋聰

5
2025-03-13 11:47

deepseek已成为开源ai标杆

淡若水 回复 03-16 14:38
你以为人家会说和它比?都是自嗨

肚_肚 回复 淡若水 03-19 09:16
ip正确

junko

junko

4
2025-03-13 15:42

没什么都把它吹上天了呢?你们到底有没有试用? 我试用了 Gemma3 4B 和 12B,感觉是个垃圾呢!问它 1.11 跟 1.9 哪个大,它无休止地重复输出 推理过程 结果总是说 1.11 更大,好多简单问题 它都是无休止地胡说八道,根本停不下来。 随便问几个诗词,它都会一本正经的胡说八道。

你是我的治愈系

你是我的治愈系

3
2025-03-13 11:15

都只敢和deepseek v3比较,垃圾。

淡若水 回复 03-16 14:36
你以为人家会说和它比?都是自嗨

一朴

一朴

3
2025-03-13 10:32

是不是引入deepseek的开源的算法了

菜菜

菜菜

2
2025-03-13 10:57

谷歌开源了2016算法,后面涌现AI,ds开源了,拉动谷歌。。openai必然死亡

建波孙

建波孙

2
2025-03-13 08:04

我们不应该开源完整功能版本的deepseek开源几个小版本的就行,可惜了

诗和远方

诗和远方

2
2025-03-13 08:10

我测试gemma3:12b并不支持函数调用啊

一整个鯨落?

一整个鯨落?

1
2025-03-13 10:36

小参数模型算力需求小,成本低且效率高。

手机中国

手机中国

专业,有趣的科技新媒体