ChatGPT-4o重要更新，你可以和一个“有情感”的AI机器人进行音频和视频对话

新的GPT-4o模型厉害了，它能唱着摇篮曲给你讲睡前故事，还能识别你的面部表情，读懂你的情绪。这样一来，它就能更加贴心地根据你的心情来互动，让你的睡前时光变得更加温馨和个性化。

周一，OpenAI发布了GPT-4o（"o"代表"全功能"），这是一个重大升级的人工智能模型，能够表面上实现实时语音对话，它能读懂情绪信号，并对视觉输入做出反应。这个新模型运行速度超过OpenAI之前最好的模型GPT-4 Turbo，并且据OpenAI称，它将对ChatGPT用户免费，并通过API以服务形式提供，未来几周内会逐步推出。这意味着ChatGPT的用户体验将更加流畅，互动方式也更加丰富和人性化。

OpenAI在一场名为“OpenAI春季更新”的YouTube直播中展示了新功能，这场直播由OpenAI的首席技术官Mira Murati以及员工Mark Chen和Barret Zoph共同主持。直播中，他们不仅宣布了新消息，还现场演示了GPT-4o的实际运作，包括它的音频对话和视觉理解能力。这让观众能直接看到和听到GPT-4o如何使用这些新增的高级功能进行交互。

OpenAI宣称，GPT-4o对音频输入的平均响应时间约为320毫秒，这与2009年一项研究中提到的人类对话时的反应时间相近，比以往模型常见的2到3秒延迟要短得多。OpenAI表示，他们通过一种全新的方式训练了GPT-4o模型，这种方式从头到尾集成了文本、视觉和音频的处理，使得所有输入和输出都是由同一个神经网络处理的。这样的设计让GPT-4o能在不同类型的感官信息之间更加无缝地工作，提高了交互的实时性和自然度。

演讲者还特别强调了GPT-4o增强的视觉理解能力。用户只需上传截图、包含文字和图片的文档或图表，就可以与GPT-4o围绕这些视觉内容进行对话，并获得它提供的数据分析。在直播演示中，这款AI助手展现了分析自拍照、识别情绪的能力，甚至还能就图片内容进行轻松幽默的交谈。

此外，GPT-4o在超过50种语言上的速度和质量也有所提升，OpenAI表示这覆盖了全球97%的人口。该模型还展示了其实时翻译的能力，几乎可以瞬间完成不同语言使用者之间的对话翻译，极大地促进了跨语言交流。

OpenAI最初在2023年9月向ChatGPT引入了语音对话功能，该功能利用了Whisper这一人工智能语音识别模型进行输入，并采用了定制的声音合成技术进行输出。在此之前，OpenAI的多模态ChatGPT界面操作涉及三个步骤：转录（从语音到文本）、智能处理（将文本作为标记处理）和文本转语音，每一步都会增加延迟。而GPT-4o据称能同时完成所有这些步骤，正如Murati所描述的那样，它能“跨越语音、文本和视觉进行推理”。

在直播中，屏幕上显示的一张幻灯片背后，他们将此称为“全功能模型”。OpenAI宣布，GPT-4o将面向所有ChatGPT用户开放，付费订阅用户可享受免费用户速率限制的五倍。以API形式提供的GPT-4o据说将比GPT-4 Turbo的速度快两倍，成本降低50%，并且速率限制提高五倍。（目前，GPT-4o仅作为文本模型在ChatGPT中可用，音频和视频功能尚未上线。）

直播中展示的功能，以及OpenAI网站上众多视频中所呈现的，让人回想起2013年科幻电影《她》中的对话式AI助手。在这部电影中，主角对AI个性产生了个人情感依恋。鉴于OpenAI的GPT-4o所展现出的模拟情感表达能力（可以说是人工情感智能），人们与OpenAI的助手建立起类似的情感联系并非不可想象，过去我们已经在某些情况下见证过类似情况。

Murati承认，GPT-4o的实时音频和图像功能在安全方面带来了新的挑战，并表示公司将继续在接下来几周的迭代部署过程中，研究安全问题并征求测试用户的反馈。

OpenAI表示：“GPT-4o已经接受了来自70多名外部专家的广泛外部红队测试，这些专家涉及社会心理学、偏见与公平性、以及误导信息等领域，旨在识别新增模态所带来的或放大的风险。我们利用这些学习成果来构建我们的安全干预措施，以提高与GPT-4o互动的安全性。我们将继续发现并缓解新出现的风险。”

周一的时候，OpenAI还公布了几项ChatGPT的更新。其中一个是为macOS系统设计的ChatGPT桌面应用，已经开始向部分ChatGPT Plus订阅用户小范围推送了，之后几周会更广泛地开放给更多用户。OpenAI还优化了ChatGPT的界面，增加了新的首页和信息布局，让使用起来更顺手。

再说说上面稍微提过的GPT-4o模型，一旦它普及开来，ChatGPT的免费用户也能享受到一些以前只有Plus、团队和企业版用户才能用的功能，比如网页浏览、数据分析、GPT商店以及记忆功能。这样一来，免费用户也能体验到更多强大和便利的功能了。

世良情感网

ChatGPT-4o重要更新，你可以和一个“有情感”的AI机器人进行音频和视频对话

黑客部落