

文丨都保杰
最近一段时间,整个AI圈的关注度都被DeepSeek和OpenAI之间的轮番出招所吸引,受DeepSeek带来的“鲶鱼效应”影响,AI模型性能不仅要比之前更好,而且服务价格还要足够便宜已成为行业趋势。
作为AI界的科技巨头,谷歌一直是OpenAI的有力对手,以前跟OpenAI之间在各类产品性能方面对线竞争备受市场关注,没想到现在又崛起一个DeepSeek来抢风头,这让谷歌不得不调整策略以应对市场突变。
今天,谷歌打包推出高中低档模型更新:Gemini 2.0 Flash、Gemini 2.0 Flash-Lite、Gemini 2.0 Pro,加入DeepSeek、OpenAI战局。

用Google DeepMind联合创始人兼首席执行官Demis Hassabis的话讲:通过不断提高质量和降低成本,取得了令人兴奋的进展,Gemini 2.0系列将是成本和性能的领先型号。

价格战更加激烈
在DeepSeek和OpenAI较量的同时,谷歌并没有放松竞争节奏。
2024年12月,谷歌就发布了Gemini 2.0 Flash的实验版本,开始升级智能体,今年早些时候,谷歌人工智能工作室(Google AI Studio)对Gemini 2.0 Flash Thinking Experimental进行了更新,通过将Flash的速度与处理更复杂问题的推理能力相结合,提升了其性能。
上周,谷歌向桌面端和移动端Gemini应用的所有用户推出了更新后的2.0 Flash,助力开发者探索与Gemini进行创作、交互及协作的新方式。
为了应对DeepSeek-R1带来的性价比冲击,OpenAI日前推出新一代模型o3-mini,把该模型“推理努力”级别分为低、中、高三等,o3-mini中等推理提供“速度和准确性之间的平衡”,o3-mini-high则提供OpenAI所称的“更高智能”和“最好的编码选项”,性能不同价格不同。
从定位方式来看,谷歌采取了和OpenAI类似的分级策略。

更新后的Gemini 2.0 Flash具备更高的速率限制、更强的性能以及相对中档的市场定价;Gemini 2.0 Flash-Lite是谷歌迄今为止最具成本效益的型号,现已提供公开预览版;Gemini 2.0 Pro则是谷歌迄今为止针对编码和复杂提示的最佳模型的实验性更新。

谷歌通过Gemini 2.0 Flash和2.0 Flash-Lite来回应价格战。这两款产品每种输入类型都只有一个统一的价格,取消了Gemini 1.5 Flash对短上下文请求和长上下文请求的区分。这意味着,尽管Gemini 2.0 Flash和Flash - Lite在性能上有所提升,但在处理混合上下文工作负载时,它们的成本可能比上一代Gemini 1.5 Flash更低。
Gemini 2.0 Pro目前处于实验阶段,暂无明确公开的价格信息,使用的前提是需要注册Google One AI高级计划,每月费用为20美元。

放在当下的市场竞争环境中,谷歌Gemini 2.0部分服务性价比直接对标DeepSeek,而且非常具有竞争力。

此外,Gemini 2.0 Flash提供更全面的多模态功能,包括原生工具使用、100万token上下文窗口和多模式输入,支持文本、图像和音频输出,在许多第三方评测基准上,Gemini 2.0系列都取得了不错成绩。
Chatbot Arena是一个众包AI基准测试开放平台,由加州大学伯克利分校SkyLab和LMArena的研究人员开发,该平台拥有超过1000000个用户投票,对最佳LLM和AI聊天机器人进行排名。

在该榜中,Gemini-2.0-Pro一跃成为第一名,而Gemini 2.0 Flash和2.0 Flash-Lite则是DeepSeek R1、V3的有力竞争对手,而且Flash-lite以更低的性价比成本进入了前十。
在Vectara幻觉评估模型上,Gemini-2.0-Flash表现也十分出色,以0.7%幻觉率在排行榜上位居第一,表现比o3-mini-high还要好。

谷歌研究院首席科学家、Gemini项目负责人Jeff Dean展示了Gemini 2.0 Pro模型在AI Studio中的编码能力。只要提出游戏规则,它就可以编写完整的游戏代码,包括所有正确的数据结构和搜索算法,以便在相对简单的提示下找到Boggle板上的所有有效单词,整个过程仅耗时18.9秒。

也有网友用Gemini 2.0 Pro编写一个太阳系运行动画3D场景,耗时24.4秒完成,复制代码输出就能流畅运行:

不过让网友感兴趣的涉及物理编码方面的PK,目前来看还是o3-mini模型更胜一筹,贵确实有贵的道理,Gemini 2.0 Pro和DeepSeek生成的效果自然度都差点意思。
提示:“编写一个Python程序,显示一个球在旋转的六边形内弹跳。球应该受到重力和摩擦力的影响,并且必须逼真地从旋转的墙壁上弹起。”



探索“顶尖”模型仍是重点
性价比大战带来的是开发者使用门槛的大幅降低,但AI发展的终极目标并不是陷入价格战,而是开发最先进的智能体。
如近期李飞飞参与发表的一篇论文中,斯坦福大学和华盛顿大学的人工智能研究人员能够以不到50美元的云计算积分训练人工智能“推理”模型,该模型名为s1,在数学和编码能力测试中,其表现与OpenAI o1和 DeepSeek R1等尖端推理模型类似。

为什么成本会这么低?s1背后的团队表示,他们从现成的基础模型开始,然后通过提炼对其进行微调,即通过对另一个人工智能模型的答案进行训练,提取其“推理”能力的过程。s1就是从谷歌的推理模型Gemini 2.0 Flash Thinking Experimental中提炼出来的。
具体而言,S1是基于阿里巴巴人工智能实验室Qwen开发的一个小型现成人工智能模型,该模型可免费下载,为了训练s1,研究人员创建了一个数据集,其中包含1000个精心挑选的问题以及这些问题的答案,以及来自谷歌Gemini 2.0 Flash Thinking Experimental的每个答案背后的“思考”过程。
然后研究人员花费20美元租用16个Nvidia H100 GPU训练s1不到30分钟,s1在某些AI基准测试中就取得了优异表现。

这种方法提出了有关人工智能模型商品化的真正问题,如果有人能够以非常低的成本精确复制价值百万乃至千万美元的模型性能,那么护城河又在哪里?
这也是OpenAI近期质疑DeepSeek从其API中收集数据以用于模型提炼的原因。谷歌目前通过其Google AI Studio平台免费提供Gemini 2.0 Flash Thinking Experimental的访问权限,但每日使用次数有限制,此外,谷歌的条款禁止对其模型进行逆向工程,以开发与该公司人工智能产品竞争的服务。
尽管测试时缩放、监督微调 (SFT) 相关的蒸馏法已被证明是一种以低成本重建人工智能模型功能的好方法,但它似乎很难创造出比现有模型更好的跨时代顶尖模型。
今年,谷歌、微软、OpenAI、Meta等仍计划在AI基础设施上投资数千亿美元用于训练下一代AI模型,这种大规模的算力投资目前来看仍然是推动人工智能创新的必要条件之一。

AI圈的跨界竞争
除了跟进DeepSeek掀起的性价比之争,谷歌还要提防友商们对搜索市场的悄然瓜分。
在谷歌发布新产品的今天,OpenAI那边也放了个大招:ChatGPT搜索现在可供chatgpt.com上的所有人使用,而且无需注册。

虽然OpenAI并没有公开披露过详细的用户数据,但根据第三方机构VezaDigital的数据分析,OpenAI在2024年3月份的月活跃用户接近9亿,并且随着各种AI产品和服务的推出用户还在快速增长,VezaDigital认为,OpenAI 很有可能成为历史上月活跃用户最快达到10亿规模的网站。
如果大量用户从谷歌搜索转投ChatGPT搜索,对于谷歌而言未来损失难以估量,AI能不能大把挣到钱还尚未可知,老本行可能都要受到威胁。
2025年,谷歌、OpenAI、DeepSeek这三股力量的交叉博弈,势必会让整个AI市场乃至搜索市场格局发生质的变化。

如果您有什么想说的,欢迎在评论区留言讨论!
投稿或寻求报道,欢迎私信“投稿”,添加编辑微信。
【2025免费新年礼】:了解最新科技趋势分析、行业内部的独家见解、定期的互动讨论和知识分享、与行业专家的直接面对面交流的机会,领取100份AI科技商业研报合集,加群共同探讨与成长——
欢迎添加头部科技晶总微信Toptech007