重磅！OpenAi发布新模型GPT-4o，部分Plus功能免费给所有人用！

刚刚结束的春季发布会，OpenAI 又杀疯了！

本以为没有 GPT-5、Search GPT 这样重量级产品，发布会不会有太多亮眼的表现。

没想到，OpenAI 直接贴脸开大，再次向世人宣告：谁才是最强 AI 模型！

简单总结一下发布会内容：

√ 重磅推出全能模型 GPT-4o，能力遥遥领先√ 除了 Plus 会员，GPT-4o 还免费放开给所有人用（对，是所有人）√ GPT-4o API——2倍快、5倍访问限制，半价（相比4-turbo）√ ChatGPT 即将推出全新 UI界面+桌面客户端

1 全能模型——GPT-4o

GPT-4o，里面的 o 代表了 Omni(model)，源自拉丁语中的词“omnis”。

在英文语境中，这个前缀常被用来表示——全体、全能，无所不知、无所不在的，或者我们用一个更具象的词——全能模型。

虽然，它仍是 GPT-4 系列版本的延续，但无疑是迄今为止最强的 GPT-4 模型。

PS：也能从侧面看出，未来 GPT-5 模型的强大。

能力1：GPT-4o 能接受文本、音频和图像的任意组合作为输入，并实时生成文本、音频和图像的任意组合输出。

大家注意上面的关键词——实时生成。

并且，实时生成的不仅仅是文字，还有音频、图像，以及视频！

这就很吓人了。

能力2：GPT-4o 在短至 232 毫秒的时间内响应音频输入，平均为 320 毫秒，与人类的响应时间相似。

这里有4个点：

① 对话时，可以随时打断（就像真人聊天一样）；② 它能根据对话场景，生成契合的声音；③ 它能理解人的情绪、语气、语调、语速（比如喘息声）；④ 实时翻译，并且支持调整语速。

在过去，我们跟 AI 的对话基本都是你说一句、它回一句，并且说话时不能中断。

很明显是一种，人跟机械之间的聊天。

而 GPT-4o 的语音对话，不仅可以随时插嘴、随时中断，它都能实时响应、没有延迟。

而且，如果你想让 GPT-4o 说话的语速更快，直接告诉它“Talking faster”，它就真变快了！

甚至，它还能理解你的情绪；再甚至，它还能根据你的情绪，模拟出它自己的情绪。

只能说，太强了！

能力3：GPT-4o 在英语文本和代码上的性能与 GPT-4 Turbo 的性能相匹配，在非英语文本上的性能显着提高。

目前，GPT-4o 正在逐步灰度给所有账号，大家自己去体验即可。

2 免费，给所有人用！

发布会上，当听到 OpenAI 会将 GPT-4o 免费给所有人用时，相信不少人也会说出那句经典的夸奖：wocao！

简直就离谱。

更刺激的是：除了 GPT-4o，还有 GPT Store、Vision（包括联网、记忆功能、代码解释器）……也会免费放开。

尽管 OpenAI 同时也提到，Plus 用户会得到更高的使用额度，以及抢先体验 ChatGPT 桌面 App 和语音对话功能。

但是，免费的它不香嘛！

可以预见的是，未来几个月，号贩子的春天又要回来了~

3 GPT-4o API

一句话总结：2倍快、5倍访问限制，半价(VS 4-turbo)，128k 上下文。

输入：$5.00 / 1M tokens输出：$15.00 / 1M tokens

之前推出的 GPT-4-turbo:

输入：$10.00 / 1M tokens输出：$30.00 / 1M tokens

4 全新 UI界面+桌面客户端

相比于上面的大招，只能说这是一个提升用户体验的小更新了。以及，接下来OpenAI 还会推出针对 Mac 用户的桌面客户端。

One More Thing

上面，仅仅是官方给出的介绍，更多 GPT-4o 的能力，还都潜在水面之下，需要我们一一发掘。

OK，今天的分享就到这里了。