刚刚结束的春季发布会,OpenAI 又杀疯了!
本以为没有 GPT-5、Search GPT 这样重量级产品,发布会不会有太多亮眼的表现。
没想到,OpenAI 直接贴脸开大,再次向世人宣告:谁才是最强 AI 模型!
简单总结一下发布会内容:
√ 重磅推出全能模型 GPT-4o,能力遥遥领先√ 除了 Plus 会员,GPT-4o 还免费放开给所有人用(对,是所有人)√ GPT-4o API——2倍快、5倍访问限制,半价(相比4-turbo)√ ChatGPT 即将推出全新 UI界面+桌面客户端

1 全能模型——GPT-4o
GPT-4o,里面的 o 代表了 Omni(model),源自拉丁语中的词“omnis”。
在英文语境中,这个前缀常被用来表示——全体、全能,无所不知、无所不在的,或者我们用一个更具象的词——全能模型。
虽然,它仍是 GPT-4 系列版本的延续,但无疑是迄今为止最强的 GPT-4 模型。

PS:也能从侧面看出,未来 GPT-5 模型的强大。
能力1:GPT-4o 能接受文本、音频和图像的任意组合作为输入,并实时生成文本、音频和图像的任意组合输出。
大家注意上面的关键词——实时生成。
并且,实时生成的不仅仅是文字,还有音频、图像,以及视频!
这就很吓人了。

能力2:GPT-4o 在短至 232 毫秒的时间内响应音频输入,平均为 320 毫秒,与人类的响应时间相似。
这里有4个点:
① 对话时,可以随时打断(就像真人聊天一样);② 它能根据对话场景,生成契合的声音;③ 它能理解人的情绪、语气、语调、语速(比如喘息声);④ 实时翻译,并且支持调整语速。

在过去,我们跟 AI 的对话基本都是你说一句、它回一句,并且说话时不能中断。
很明显是一种,人跟机械之间的聊天。
而 GPT-4o 的语音对话,不仅可以随时插嘴、随时中断,它都能实时响应、没有延迟。
而且,如果你想让 GPT-4o 说话的语速更快,直接告诉它“Talking faster”,它就真变快了!
甚至,它还能理解你的情绪;再甚至,它还能根据你的情绪,模拟出它自己的情绪。
只能说,太强了!
能力3:GPT-4o 在英语文本和代码上的性能与 GPT-4 Turbo 的性能相匹配,在非英语文本上的性能显着提高。

目前,GPT-4o 正在逐步灰度给所有账号,大家自己去体验即可。

2 免费,给所有人用!
发布会上,当听到 OpenAI 会将 GPT-4o 免费给所有人用时,相信不少人也会说出那句经典的夸奖:wocao!
简直就离谱。

更刺激的是:除了 GPT-4o,还有 GPT Store、Vision(包括联网、记忆功能、代码解释器)……也会免费放开。
尽管 OpenAI 同时也提到,Plus 用户会得到更高的使用额度,以及抢先体验 ChatGPT 桌面 App 和语音对话功能。
但是,免费的它不香嘛!

可以预见的是,未来几个月,号贩子的春天又要回来了~
3 GPT-4o API

一句话总结:2倍快、5倍访问限制,半价(VS 4-turbo),128k 上下文。
输入:$5.00 / 1M tokens输出:$15.00 / 1M tokens
之前推出的 GPT-4-turbo:
输入:$10.00 / 1M tokens输出:$30.00 / 1M tokens
4 全新 UI界面+桌面客户端

相比于上面的大招,只能说这是一个提升用户体验的小更新了。以及,接下来OpenAI 还会推出针对 Mac 用户的桌面客户端。
One More Thing
上面,仅仅是官方给出的介绍,更多 GPT-4o 的能力,还都潜在水面之下,需要我们一一发掘。


OK,今天的分享就到这里了。