语言模型进展趋缓,OpenAI改变策略填补训练数据不足

逢纪说科技 2024-11-15 00:51:41

语言模型开发似乎达了某种程度的天花板,根据外媒报道,OpenAI即将推出的“Orion”模型性能只比GPT-4略胜一筹,这种进展趋缓的情况恐怕影响整个AI产业。

外媒The Information报道,OpenAI下一代大型语言模型代号Orion,性能提升比预期小,GPT-4到Orion的品质改善明显不如GPT-3到GPT-4的改善差异。

重要的是,The Information引述知情人士消息指出,Orion在程序设计等领域并未突破以往,只在语言能力方面有所改善,而且模型运行成本可能比以往更高。

OpenAI研究人员指出,高品质训练数据不足是语言模型进展趋缓的原因之一,大多数公开数据已被用于模型训练。为此,OpenAI内部成立一组“基础团队”(Foundations Team),由研究副总裁Nick Ryder带领,期望解决这方面问题。

Orion是以GPT-4和o1的合成数据进行部分训练,但据OpenAI员工说法,这种方法有新模型在某些方面与旧模型相似的风险。

近日与Y Combinator首席执行官陈嘉兴(Garry Tan)访谈中,OpenAI首席执行官奥特曼(Sam Altman)对模型开发抱持乐观态度。他表示通往通用人工智能(Artificial General Intelligence,AGI)的道路很明确,需要创造性地利用现有模型,可能意指语言模型与o1、AI代理的推理方法结合以达到目的。

不只OpenAI有语言模型进展趋缓的问题,外媒The Verge近期报道,Google即将推出的Gemini 2.0未能达到内部目标。据传创业公司Anthropic暂停旗舰版本Calude 3.5 Opus开发,先发布Calude 3.5 Sonnet,避免让用户和投资人失望。

(首图来源:Unsplash)

0 阅读:0

逢纪说科技

简介:感谢大家的关注