IT之家4月3日消息,上周,负责维护和管理ARC-AGI的ArcPrizeFoundation对OpenAI的o3“推理”人工智能模型在ARC-AGI基准测试中的成本估算进行了重大修订,现在看起来o3的运行成本没有那么低。
去年12月OpenAI推出o3模型时,与ARC-AGI的开发者合作,展示了该模型在解决复杂问题上的强大能力。然而,几个月后,其成本估算结果却发生了显著变化。ArcPrizeFoundation最新估计,o3模型中表现最佳的配置o3high,解决一个单一的ARC-AGI问题的成本可能高达约3万美元(IT之家注:现汇率约合21.8万元人民币),而此前的估算仅为约3000美元(现汇率约合21821元人民币)。
这一成本估算的大幅上调,凸显了目前最先进AI模型在特定任务上可能面临的高昂成本。尽管OpenAI尚未公布o3模型的定价,也未正式发布该模型,但ArcPrizeFoundation认为,OpenAI目前最昂贵的o1-pro模型的定价可以作为参考。
“我们认为o1-pro更接近o3真实成本的比较对象,因为两者在测试时使用的计算量相近。”ArcPrizeFoundation的联合创始人迈克・库诺(MikeKnoop)在接受TechCrunch采访时表示,“但这仍然只是一个参考值,我们在排行榜上仍将o3标记为预览版,以反映在官方定价公布前的不确定性。”
o3high的高成本并非毫无依据。据ArcPrizeFoundation介绍,o3high在处理ARC-AGI任务时,使用的计算资源是o3模型中计算量最低的o3low配置的172倍。如此巨大的计算资源消耗,使得o3high的成本大幅上升。
此外,有关OpenAI计划为面向企业客户的高端定制服务收取高额费用的传闻也由来已久。今年3月初TheInformation报道称,该公司可能计划每月收取高达2万美元(现汇率约合14.5万元人民币)的费用,为企业提供像软件开发人员代理这样的专业AI“代理”服务。
尽管有人认为,即使是最昂贵的AI模型,其成本也远低于人类承包商或员工的薪酬,但AI研究员托比・奥德(TobyOrd)在X网站上发表的一篇文章指出,这些模型的效率可能并不如人们预期的那么高。例如,o3high在ARC-AGI测试中,需要尝试1024次才能达到最佳成绩。
随着AI技术的不断发展和商业化进程的加速,如何在保持模型高性能的同时,有效控制成本,将成为行业面临的重要挑战之一。