继此前在2024年面向ChatGPT Plus、ChatGPT Team、ChatGPT Enterprise等付费用户推出高级语音模式(Advanced Voice Mode)后,日前OpenAI方面宣布,自即日起该功能将免费开放,从而让更多用户体验更自然的语音对话。
据了解,ChatGPT的高级语音模式是基于多模态大模型GPT-4o系列打造,可提供自然的实时对话、允许用户随时打断,并且还能感知或响应用户的情绪语调,包括悲伤、兴奋等。同时用户可通过设置自定义指令来定制ChatGPT的说话方式,例如让其以特定的节奏说话、发音清晰、慢速说话,以及定期使用用户的名字等。

除网页版外,目前macOS 和 Windows 10、Windows 11系统的ChatGPT桌面应用程序也均已支持高级语音模式。
需要注意的是,与付费用户可体验由GPT-4o模型驱动的高级语音模式不同,目前免费用户仅可体验由GPT-4o mini驱动的高级语音模式。对此OpenAI方面表示。“其(GPT-4o mini驱动高级语音模式)自然的对话节奏和语气与GPT-4o版本相似,但服务成本更低”。
此外在音频输入和输出上,免费用户的每日可用额度也相对较少、为ChatGPT Plus用户的五分之一。据悉,当剩余可用时长不足3分钟时ChatGPT会发出警告,并在达到限额后自动结束对话。
值得一提的是,日前OpenAI方面宣布,已面向ChatGPT Plus、ChatGPTTeam、ChatGPT Edu、ChatGPT Enterprise用户开放智能体深度研究(Deep Research),并对该智能体进行升级。据悉,Deep Research是基于OpenAI o3模型打造,可使用推理能力综合大量信息,并为用户完成多步骤研究任务,在数十分钟完成人类专家需几小时才能实现的复杂研究任务。此前,该智能体仅面向ChatGPT Pro用户开放。
在此次升级后,Deep Research已能够更好地理解和引用用户上传的文件,并在输出报告中添加带有引用的图像。目前ChatGPT Plus用户每月可使用10次Deep Research,而ChatGPT Pro用户的每月可用额度则由100次提高至120次。