近日,据路透社等媒体报道,生成式 AI 领域的领军者 OpenAI 正在开展一项神秘的计划,其代号为“草莓”(Strawberry)。
5 月份的一份 OpenAI 内部文件显示,该公司的内部团队正在全力开发“草莓”项目。其目的是增强 OpenAI 模型的推理能力,使模型不仅能够生成查询答案,还能提前进行充分规划,以便自主、可靠地在互联网上搜索并执行 OpenAI 所说的“深度研究”,这是目前 AI 模型尚未实现的功能。
“草莓”项目的前身是 Q*算法模型,Q*能够解决棘手的科学和数学问题。有内部人士指出,Q*可能是 OpenAI 在追寻通用人工智能(AGI)道路上的一项突破。而数学能力被视为生成式 AI 发展的基础,若 AI 模型掌握此能力,将拥有更强的推理能力,甚至有望与人类智能相媲美,这也是当前大语言模型尚未达到的水平。
此外,“草莓”项目似乎包含一种专门的“后训练”方法。类似于斯坦福大学在 2022 年开发的“自学推理者”(STaR)方法,STaR 可以让 AI 模型通过反复创建自己的训练数据,“引导”自己进入更高的智能水平。
OpenAI 还公布了未来 AI 发展的五级路线图。按照其猜想,AI 将经历五个阶段:第一级是具有对话语言能力的聊天机器人;第二级是能达到人类水平问题解决能力的推理者;第三级是可以采取行动的代理者;第四级是可协助发明的创新者;第五级是能够完成组织工作的组织者。OpenAI 高管表示,公司目前处于第一级别,预计很快将达到第二级别,即推理者,并致力于在特定任务上实现博士级别的智能,这一目标可能在一年或一年半内实现。