ChatGPT高级语音免费开放，GPT-4omini驱动

继此前在2024年面向ChatGPT Plus、ChatGPT Team、ChatGPT Enterprise等付费用户推出高级语音模式（Advanced Voice Mode）后，日前OpenAI方面宣布，自即日起该功能将免费开放，从而让更多用户体验更自然的语音对话。

据了解，ChatGPT的高级语音模式是基于多模态大模型GPT-4o系列打造，可提供自然的实时对话、允许用户随时打断，并且还能感知或响应用户的情绪语调，包括悲伤、兴奋等。同时用户可通过设置自定义指令来定制ChatGPT的说话方式，例如让其以特定的节奏说话、发音清晰、慢速说话，以及定期使用用户的名字等。

除网页版外，目前macOS 和 Windows 10、Windows 11系统的ChatGPT桌面应用程序也均已支持高级语音模式。

需要注意的是，与付费用户可体验由GPT-4o模型驱动的高级语音模式不同，目前免费用户仅可体验由GPT-4o mini驱动的高级语音模式。对此OpenAI方面表示。“其（GPT-4o mini驱动高级语音模式）自然的对话节奏和语气与GPT-4o版本相似，但服务成本更低”。

此外在音频输入和输出上，免费用户的每日可用额度也相对较少、为ChatGPT Plus用户的五分之一。据悉，当剩余可用时长不足3分钟时ChatGPT会发出警告，并在达到限额后自动结束对话。

值得一提的是，日前OpenAI方面宣布，已面向ChatGPT Plus、ChatGPTTeam、ChatGPT Edu、ChatGPT Enterprise用户开放智能体深度研究（Deep Research），并对该智能体进行升级。据悉，Deep Research是基于OpenAI o3模型打造，可使用推理能力综合大量信息，并为用户完成多步骤研究任务，在数十分钟完成人类专家需几小时才能实现的复杂研究任务。此前，该智能体仅面向ChatGPT Pro用户开放。

在此次升级后，Deep Research已能够更好地理解和引用用户上传的文件，并在输出报告中添加带有引用的图像。目前ChatGPT Plus用户每月可使用10次Deep Research，而ChatGPT Pro用户的每月可用额度则由100次提高至120次。

0 阅读：2