在经过持续12天的技术分享直播活动后,人工智能研究机构OpenAI终于揭开了他们最新一代推理模型o3的面纱。据该公司称,o3是一个由多个模型组成的系列,包括o3和o3-mini两个版本。此外,OpenAI还表示,至少在某些条件下,o3模型可以接近实现通用人工智能(AGI)。
根据OpenAI的说法,他们的新模型在ARC-AGI图形逻辑推理基准上获得了破纪录的分数。在低计算场景中,该模型得分为75.7%,而在高计算测试中则达到了87.5%,这一成绩超过了标志着达到人类水平的门槛85%。相比之下,之前推出的o1模型仅在25%到32%之间。
更令人关注的是,在全球著名的编码竞赛平台ODEFORCES上进行的评分测试中,o3取得了2727分,而o1仅为1891分。傅盛认为,“随着OpenAIo3的发布,人人都是程序员的时代马上就要带来了”,他表示:“看完o3的发布,我的一个感慨就是程序员可能不存在了。”他认为这次o3的发布标志着大语言模型的编程能力超越了99.9%的程序员。
据OpenAI透露,他们将在明年1月底正式推出o3。傅盛表示:“我可以负责任地说,人类程序员这次真的危险了。”他说,“说不存在了可能稍微有点夸张,程序员会存在,但更多的是比拼对用户需求的理解、大逻辑的构建,而真正把它变成代码的工作应该是大幅度地让AI去完成。”