OpenAI再“狙”谷歌,但谷歌该小心的是苹果

锌产评科技 2024-05-15 01:32:09

作者 | 山竹

出品 | 锌产业(公众号:xinchanye2021)

经历了2023年的百模大战后,2024年,大模型之战进一步聚焦到了头部企业。

在上周阿里在北京的大模型主题发布会上,就有阿里云高管在现场指出,截至目前,有竞争力的基础通用大模型已经收敛到了10个以内。

两只手就数得过来的对手意味着,那些在资源和技术上占据优势的头部玩家,就可以根据对手动态做出针对性策略,今年年初OpenAI对谷歌的精准狙击就是一个很好的例子。

2024年2月15日,谷歌对外重磅发布了多模态大模型Gemini 1.5 Pro,官方测试结果显示,这个最高支持100万tokens的多模态大模型,性能远超GPT-4 Turbo。

然而,就在同一天,OpenAI发布了文生视频大模型Sora。

Sora的发布让全网关注度再次聚焦到了OpenAI这一文生视频产品上,抢走了本应属于谷歌的高光时刻,也让谷歌Gemini 1.5 Pro在大模型发展历史上的意义再次被低估。

作为本应是大模型领域绝对领导者的谷歌,在召开2024年谷歌I/O大会前夕,全球大模型市场再次暗潮涌动。

阿里云发布通义千问2.5、零一万物发布千亿参数大模型……,更重要的是,OpenAI也再次有了新动作。

01 GPT-4o缓解Altman的焦虑

作为硅谷技术团队创业中为数不多的“商人”CEO,Altman能够掌舵OpenAI靠的不是技术有多牛或是解决工程化问题的能力有多强,而是他的商业头脑,因而一直被认为是一位营销大师。

甚至有业内人士猜测,在OpenAI内部,最终拍板决定一个产品何时发布的,不是技术团队或产品团队,而是公关团队。

无论这样的猜测准确与否,我们能够看到的是,在Altman的推动下,OpenAI的ChatGPT、GPT-4、GPTs、Sora等产品的发布,最终都在全球范围内形成了广泛的关注。

尤其是在今年年初(北京时间2月16日),已经在生成式AI领域占据绝对优势的OpenAI,在谷歌多模态大模型Gemini 1.5 Pro发布仅两个小时后,就对外发布了文生视频模型Sora,这波操作直接“截获”了本应属于谷歌的泼天流量。

被官方称作“世界模拟器”的Sora发布有多炸裂?

在Sora发布那两周里,几乎所有人都在谈论Sora,华大集团CEO尹烨就曾在一篇署名文章中曾引经据典地论证了Sora将人工智能技术提升到了一个更高维度。

不过,对于OpenAI而言,Sora最直接的作用是狙击了谷歌的Gemini 1.5 Pro,以及随后发布的Claude 3,这让OpenAI至今依旧站在AI之巅。

为什么OpenAI必须是行业第一?

原因在于,生成式AI本质上是靠大算力、大数据、大模型,通过量变实现的质变,在早期商业模式中,OpenAI玩的还是互联网那套:

通过高增长的用户量不断拿到大额融资进行技术研发,再通过快速迭代的技术改善产品体验来获得更多用户、保持业务增长。

作为已经在收敛的基础大模型领域,已经是行业第一的OpenAI要想继续拿到巨额融资和高估值,就需要保持自己老大的行业地位,既需要保证用户量的高增长,也需要保证持续的行业关注度,以换取增长空间。

这是Sora在今年2月面世的一个主要原因,也是这次,在谷歌I/O大会前一天,OpenAI再次放出GPT-4o这个超级大招的一个重要原因。

什么是GPT-4o?

官网给出的解释是,GPT-4o是一个可以实时对音频、视觉和文本进行实时推理的(多模态)模型,是迈向更自然的人机交互的一步。

实际上,早在去年9月,OpenAI就为ChatGPT加入了语音对话和图像识别功能,前者让ChatGPT真正成为了手机上的一个对话式APP,后者则让用户可以上传图片作为输入数据,并基于图片进行交互。

然而,在此之前,手机版ChatGPT在与人类交互时有两个影响用户体验的问题:

首先是需要较长的等待时间,ChatGPT需要较长的时间才能给出答案,彼时ChatGPT给出的答案可能已经很不错了,但交互体验并不好;

其次是交互模式更多是问答模式,没有做到自然交互。

GPT-4o解决了这些问题,不仅将延时控制在了320毫秒内(几乎感觉不到延时),还实现了随时可打断的自然交互,甚至能听懂、看懂人的情绪。

这是语音交互方面带来的能力,图像识别方面,这次更是直接从图像识别和分析升级到了实时视频解读和分析,这样的能力除了为发布会上展示的手机端识别真实世界场景的玩法外,锌产业认为,更重要的是带来了两个变化:

第一,结合文生视频的Sora,或将带来真正意义上的“世界模拟器”;

第二,结合人形机器人,将为具身智能带来一次基础能力提升。

而这样的GPT-4o和此前ChatGPT Plus会员版所有能力,将对所有用户免费开放使用。

这无疑将为OpenAI带来新一波用户增长,也将缓解Altman的用户增长焦虑。

02 搜索引擎,未尽的战役

在OpenAI正式公布GPT-4升级消息之前,行业中还有一个更重磅的猜测——OpenAI这次会推出SearchGPT来狙击谷歌。

这一消息一经媒体发布,全球哗然。

要知道,搜索引擎依然是当下互联网最主要的基础设施,作为全球最值钱的公司之一(市值排全球第三),谷歌每年千亿美元营收中,超一半来自于搜索引擎广告。

如果OpenAI瞄准搜索引擎,会不会危及谷歌在搜索引擎领域的江湖地位?

毕竟,网上路透社等权威媒体援引知情人士的消息报道有鼻子有眼,网上甚至还传出了OpenAI的AI搜索引擎测试界面。

刚刚过去的那一周,谷歌决策层必然也在焦急地等待着这一消息的官方回应或是产品发布。

后经OpenAI和Altman在Twitter上亲自出面澄清:不是GPT-5,也不是搜索引擎,而是ChatGPT和GPT-4的更新。

有业内人士称,这是Altman的策略——博取流量为自己产品更新造势的手段。

实际上,想要直接从搜索引擎上颠覆谷歌,即便是OpenAI,也几乎是一个不可能完成的任务。

上一个想要借AI狙击谷歌搜索引擎的,是给OpenAI投了百亿美元的微软。

谷歌一直都是全球搜索引擎领域堪称垄断者的存在,即便大多数中国人习惯用百度,但就全球搜索引擎市场份额来看,谷歌占比仍超90%,千年老二的微软Bing只占据了不到3%的市场份额。

2022年年底,ChatGPT的出现让微软嗅到了机会。

作为OpenAI商业化后早期投资者,微软在2023年初紧急向OpenAI追加了100亿美元的投资,成了OpenAI最大的股东。

成为OpenAI最大股东的一个好处是,微软获得了OpenAI人工智能产品的优先访问权。也是基于此,微软引入ChatGPT的搜索引擎AI Bing在2023年2月8日正式对外发布。

对于AI Bing,微软内部极为看重,微软CEO萨蒂亚·纳德拉当时在接受外媒采访时声称,“在AI技术的推动下,微软的Bing搜索引擎和Edge浏览器将有能力挑战谷歌的领导地位。”

对于这一新生事物,谷歌确实也被吓到了,就在微软发布AI Bing前一天,谷歌紧急对外发布了自己的生成式AI聊天机器人Bard,彼时还因上线仓促、体验糟糕,Bard在互联网上经历了一波“差评”。

这是新旧两代技术在搜索引擎上第一次真正的较量。

然而,从结果来看,事情并没有向着纳德拉想象的方向发展:

Statcounter统计数据显示,截至今年2月,谷歌全球搜索引擎市场份额为91.6%,同比仅下降了1.75%,微软Bing市场份额为3.3%,增长了不到1%。

Bing并没能因为AI起飞,谷歌依旧是搜索引擎市场的霸主。

03 谷歌、苹果必有一战

和所有新兴技术刚出现时一样,当下大模型的创业者总被问及一个问题:大模型的杀手级应用是什么?

同样和所有新兴技术刚出现时一样,没有人能给出一个肯定的答案。

在此之前,我们在消费端看到了AI PC、AI手机这些“旧产品”的升级,也看到了AI PinRabbit R1等“新”硬件的出现,锌产业对这些产品也出过一些分析文章,目前来看,这些产品依旧没有跳出现有应用体验范畴;

在商业市场,我们看到了具身智能、数字员工、虚拟专家等概念的热议,但这些概念也都还是线性变化,难以形成商业上的阶跃体验。

在和一些互联网行业从业者聊天过程中,锌产业发现,不少从业者认为,生成式AI影响的是互联网的根技术,甚至可以说生成式AI本身就是下一个时代的根技术,带来的是一次真正的全产业智能化。

以搜索模式为例,AI搜索的工作原理将变为:先搜索,再总结,最后通过智能体进行结果优化。

这样的AI搜索模式除了会将内容更简单地呈现给用户——从「内容排序」到「直给」外,由此带来的搜索习惯潜移默化的改变,也将使得端侧AI变得更重要。

或许也是因为察觉到了端侧AI的重要性,也或许是为了与苹果在大模型上的合作铺路,OpenAI此次GPT-4o的发布主要也是基于手机进行的演示。

实际上,此前彭博社就曾援引知情人士消息称,苹果正在与谷歌、OpenAI洽谈在大模型上进行合作。

在2023年百模大战中,并没有苹果的身影,喜欢做后来者的苹果,直到今年被曝出解散造车团队、转投生成式AI后,苹果才逐渐放出自己在生成式AI上的相关消息:

先是收购了AI创业公司DarwinAI,又发布了多模态大模型MM1(论文),而苹果大模型与Siri的结合应用消息也紧随其后。

苹果官方关于生成式AI的技术发布,预计会是今年WWDC的重点,在此之前,OpenAI与谷歌的大模型之争,也从基础通用大模型赛场燃烧到了端侧AI。

值得注意的是,为了成为苹果系产品上的默认搜索引擎,谷歌每年都要向苹果支付百亿美元(2022年是200亿美元)的合作费用。

而在AI语音助手经过这一波升级后,在接下来从「内容排序」到「内容直给」的搜索习惯转变下,AI语音助手是否会代替传统搜索引擎,成为没有键盘的终端产品真正意义上的搜索引擎?

倘若如此,接下来,谷歌在搜索引擎上的对手或将不再是微软,而是正在悄悄训练Siri的苹果。

0 阅读:0

锌产评科技

简介:感谢大家的关注