OpenAI宣布推出一款成本低廉、性能卓越的新型多模态人工智能模型“ GPT-4o mini ”。据称,GPT-4o mini 能够以比之前的 GPT-3.5 Turbo 低 60% 的成本提供更高的性能。这种创新模式有望促进人工智能的民主化和广泛应用。
旨在通过廉价且高性能的 GPT-4o mini 促进公司采用人工智能GPT-4o mini是OpenAI开发的最新小型多模态AI模型。通过改进模型架构、优化训练数据和方法,OpenAI 在模型很小的情况下却取得了很高的性能。目前的API支持文本和图像处理,但未来计划支持文本、图像、视频和音频的所有输入/输出,有望用于更广泛的应用。 GPT-4o mini的主要特点如下:
改进的长文本处理能力:支持128K token输入上下文,最多可输出16K token。这种处理长文本的能力使其适合需要大量上下文的任务(例如解析整个代码库或长对话历史记录)。知识更新:我所了解的信息截至2023年10月,能够处理相对最新的信息。高效的多语言处理:采用与 GPT-4o 相同的改进分词器,使非英语文本的处理更加高效。提高安全性:OpenAI 引入了一种称为“指令层次结构”的新技术,使模型更能抵抗越狱、提示注入攻击和提取系统提示。GPT-4o mini 在数学推理和编码任务中也表现出了出色的性能。例如,它在衡量数学推理的 MGSM 上得分为 87.0%,在衡量编码性能的 HumanEval 上得分为 87.2%。这些数字明显高于同一小型号市场中的竞争产品。
它还在多模态推理评估 MMMU 中取得了 59.4% 的分数,优于Google 的 Gemini Flash (56.1%)和 Anthropic 的 Claude 3 Haiku(50.2%)等竞争模型。
(来源:OpenAI)
OpenAI与Ramp、Super human等公司合作,验证了GPT-4o mini的实用性。这些公司发现,GPT-4o mini 在从收据文件中提取结构化数据以及提供线程历史记录以生成高质量电子邮件响应等任务方面显着优于 GPT-3.5 Turbo。
但GPT-4o mini最具创新之处在于其低成本。每个输入代币 15 美分和每个输出代币 60 美分的定价比 GPT-3.5 Turbo 便宜 60% 以上。这表明使用人工智能模型的成本正在急剧下降。据 OpenAI 称,与 2022 年推出的功能较弱的模型 text-davinci-003 相比,GPT-4o mini 的每个代币成本降低了 99%。成本的快速下降和模型性能的提高可以加速人工智能技术的民主化。
随着GPT-4o mini的出现,AI市场的竞争预计将更加激烈。其他人工智能公司,包括 Anthropic 和微软,也在竞相开发更小、更高效、更低成本的模型,未来可能会考验他们的技术。这场竞赛可以鼓励人工智能技术的进一步进步和更低的价格,从而为用户带来显着的利益。
此外,GPT-4o mini低成本、高性能的特性有望极大拓展AI技术的应用范围。此前一直不愿引入人工智能的中小企业和个人开发者将更加熟悉人工智能技术。这将导致利用人工智能的应用和服务多样化,并有望应用于各个工业领域。
此外,通过在 ChatGPT 的免费版、Plus 版和团队版中将 GPT-3.5 Turbo 替换为 GPT-4o mini,许多用户将能够每天体验更高性能的 AI。这将提升普通用户对人工智能的期待,也将成为加速人工智能技术向社会渗透的因素。
GPT-4o mini 的实际示例包括链接或并行化多个 API 的应用程序、需要将大量上下文传递给模型的应用程序以及需要快速、实时文本响应的客户支持聊天机器人。 GPT-4o mini 有望在这些应用中展现出高性价比。
OpenAI API 产品主管 Olivier Godement 热衷于继续开发尖端的前沿模型,同时提供最好的小型模型。这种态度可以说体现了OpenAI在拓展AI范围的同时,也不忽视对前沿技术的追求的策略。
从今天开始,GPT-4o mini 可供 ChatGPT 免费用户以及付费 ChatGPT Plus 和 Team 订阅者使用,并将于下周向 ChatGPT 企业用户提供。