华尔街日报：OpenAIGPT-5未达到预期 - 未分类资讯(世良情感网)

鞭牛士报道，12月22日消息，据《华尔街日报》最新报道称，OpenAI开发下一个主要模型GPT-5的努力正在落后于计划，其结果尚未证明其巨大的成本是合理的。

这与TheInformation之前的一篇报道相呼应，该报道指出，由于GPT-5可能不会像之前的模型那样代表巨大的飞跃，OpenAI正在寻找新的策略。但《华尔街日报》的报道还包含有关代号为Orion的GPT-518个月开发的更多细节。

据报道，OpenAI已完成至少两次大规模训练，旨在通过对大量数据进行训练来改进模型。初始训练运行速度比预期的要慢，这意味着更大规模的运行既耗时又昂贵。据报道，虽然GPT-5的性能比其前辈更好，但它还不足以证明维持模型运行的成本是合理的。

《华尔街日报》还报道称，OpenAI不仅依赖公开数据和授权协议，还雇佣人员通过编写代码或解决数学问题来创建新数据。它还使用另一个模型o1创建的合成数据。

OpenAI尚未立即回应置评请求。该公司此前曾表示，今年不会发布代号为Orion的模型。

以下为全文：

OpenAI的新人工智能项目进度落后，而且花费巨大。尚不清楚它何时或是否会成功。世界上可能没有足够的数据让它变得足够聪明。

该项目正式名称为GPT-5，代号为Orion，已筹备了18个多月，旨在成为ChatGPT技术的重大进步。知情人士称，OpenAI最亲密的合作伙伴和最大的投资者微软原本预计将在2024年中期左右看到新模型。

OpenAI已经进行了至少两次大规模训练，每次训练都需要数月时间处理大量数据，目的是让Orion变得更智能。据了解该项目的人士称，每次训练都会出现新问题，软件无法达到研究人员所期望的结果。

他们表示，Orion的表现充其量比OpenAI目前的产品要好，但还不足以证明维持新模型运行的巨大成本是合理的。根据公共和私人对训练各个方面的估计，为期六个月的训练运行仅在计算成本方面就可能花费约5亿美元。

两年前，OpenAI及其傲慢的首席执行官SamAltman推出了ChatGPT，在硅谷引起了轩然大波。人工智能有望不断取得显著进步，并渗透到我们生活的几乎所有方面。分析师预测，未来几年科技巨头可能会在人工智能项目上投入1万亿美元。

这些期望主要落在了人工智能热潮的发源地OpenAI公司身上。

10月份投资者对OpenAI的1570亿美元估值，很大程度上基于奥特曼的预测，即GPT-5将代表各类学科和任务的“重大飞跃”。

GPT-5有望解锁新的科学发现，并完成诸如预约或航班预订等日常人类任务。研究人员希望它犯的错误会比现在的人工智能更少，或者至少承认怀疑——这对目前的模型来说是一个挑战，因为目前的模型可能会带着明显的自信产生错误，也就是所谓的幻觉。

人工智能聊天机器人运行在被称为大型语言模型（LLM）的底层技术上。消费者、企业和政府已经依赖它们来做从编写计算机代码到修饰营销文案和策划派对等所有事情。OpenAI的聊天机器人名为GPT-4，这是该公司自2015年成立以来开发的第四个LLM。

OpenAI的一位前高管表示，虽然GPT-4表现得像一个聪明的高中生，但最终的GPT-5实际上在某些任务上会拥有博士学位。今年早些时候，Altman在斯坦福大学的一次演讲中告诉学生，OpenAI可以高度科学地肯定GPT-5将比当前模型聪明得多。

目前尚无确定模型何时变得足够智能，可以指定为GPT-5的既定标准。OpenAI可以在数学和编码等领域测试其法学硕士。公司高管将根据直觉或许多技术专家所说的“感觉”来决定模型是否足够智能，可以称为GPT-5。

到目前为止，气氛还不太好。

OpenAI和微软拒绝对本文发表评论。去年11月，Altman表示，这家初创公司不会在2024年发布任何名为GPT-5的东西。

训练日

从2023年3月GPT-4问世的那一刻起，OpenAI就一直致力于GPT-5。

长期从事人工智能研究的研究人员表示，开发大型语言模型等系统既是一门艺术，也是一门科学。世界上最受尊敬的人工智能科学家因其如何获得更好结果的直觉而闻名。

模型在训练过程中进行测试，这是一个持续的周期，在此期间，模型可以输入数万亿个单词片段（称为标记）。大规模的训练运行可能需要几个月的时间，数据中心需要数万块昂贵且令人垂涎的计算机芯片，通常来自Nvidia。

在训练过程中，研究人员需要连续数周甚至数月坐在电脑前，尝试使用遥远的数据中心里最昂贵的硬件，将世界上的大量知识输入到人工智能系统中。

奥尔特曼表示，训练GPT-4的成本超过1亿美元。未来的人工智能模型预计将超过10亿美元。训练失败就像发射后不久在天空中爆炸的火箭。

研究人员试图通过较小规模的实验（在真正进行实验之前进行试运行）来最大限度地降低这种失败的可能性。

从一开始，GPT-5计划就存在问题。

2023年年中，OpenAI开始了一次训练，同时也是对Orion拟议新设计的测试。但这个过程进展缓慢，这表明更大规模的训练可能需要非常长的时间，这反过来会使成本变得异常高昂。而这个被称为Arrakis的项目的结果表明，创建GPT-5不会像预期的那样顺利。

OpenAI研究人员决定进行一些技术调整来增强Orion。他们还得出结论，他们需要更多样、更高质量的数据。他们觉得公共互联网的数据不够。

一般来说，人工智能模型吞噬的数据越多，其能力就越强。对于大型语言模型来说，这些数据主要来自书籍、学术出版物和其他受人尊敬的来源。这些材料有助于大型语言模型更清楚地表达自己并处理各种任务。

对于之前的模型，OpenAI使用从互联网上抓取的数据：新闻文章、社交媒体帖子和科学论文。

为了让Orion变得更智能，OpenAI需要让它变得更大。这意味着它需要更多的数据，但数据还不够。

DatologyAI是一家开发工具来改善数据选择的初创公司，其首席执行官AriMorcos表示：这变得非常昂贵，而且很难找到更多同等高质量的数据。

Morcos正在用更少但更好的数据构建模型，他认为这种方法将使当今的人工智能系统比OpenAI等所有顶级人工智能公司所采用的策略更强大。

OpenAI的解决方案是从头开始创建数据。

该公司正在招聘人员编写新的软件代码或解决数学问题，以供Orion学习。这些员工中有些是软件工程师和数学家，他们还会向Orion解释自己的工作。

许多研究人员认为，代码，即软件语言，可以帮助大型语言模型解决他们尚未见过的问题。

让人们解释他们的想法可以加深新创建数据的价值。这是法学硕士需要吸收的更多语言；它也是该模型未来如何解决类似问题的地图。

「我们正在将人类智能从人类思维转移到机器思维中。」与OpenAI、Meta等公司合作的人工智能基础设施公司Turing的首席执行官兼联合创始人乔纳森·西达尔特(JonathanSiddharth)表示。

图灵高管表示，在人工智能培训中，软件工程师可能会被要求编写一个程序来有效解决复杂的逻辑问题。数学家可能需要计算用一百万个篮球搭建的金字塔的最大高度。然后，答案——以及更重要的是，如何达到这些答案——将被纳入人工智能培训材料中。

OpenAI与理论物理等学科的专家合作，解释他们将如何处理该领域一些最棘手的问题。这也可以帮助Orion变得更聪明。

这个过程非常缓慢。GPT-4的训练使用了大约13万亿个token。一千人每天写5,000个单词，需要几个月才能产生十亿个token。

OpenAI还开始开发所谓的合成数据，即由人工智能创建的数据，以帮助训练Orion。研究表明，人工智能为人工智能创建数据的反馈回路经常会导致故障或产生无意义的答案。

知情人士称，OpenAI的科学家认为，他们可以通过使用另一个名为o1的人工智能模型生成的数据来避免这些问题。

OpenAI本已十分困难的任务因内部动荡和竞争对手几乎不断挖走其顶尖研究人员（有时甚至向他们提供数百万美元）而变得更加复杂。

去年，阿尔特曼突然被OpenAI董事会解雇，一些研究人员开始怀疑该公司是否还能继续运营下去。阿尔特曼很快被恢复首席执行官一职，并着手改革OpenAI的治理结构。

今年，OpenAI已有20多名重要高管、研究人员和长期员工离职，其中包括联合创始人兼首席科学家IlyaSutskever和首席技术官MiraMurati。上周四，广受赞誉的研究员AlecRadford宣布离职，他曾是OpenAI多篇科学论文的主要作者，在公司工作了大约八年后离职。

重启

到2024年初，高管们开始感受到压力。GPT-4已经问世一年，竞争对手开始迎头赶上。Anthropic的新法学硕士学位被业内许多人认为比GPT-4更好。几个月后，谷歌推出了今年最受欢迎的新AI应用程序NotebookLM。

随着Orion停滞不前，OpenAI开始开发其他项目和应用程序。其中包括精简版的GPT-4和Sora，后者是一款可以制作AI生成视频的产品。

据知情人士透露，这导致新产品开发团队和Orion研究人员之间争夺有限的计算资源。

人工智能实验室之间的竞争日趋激烈，以至于大型科技公司发表的有关最新发现或突破的论文数量比科学界通常的要少。两年前，随着资金涌入市场，科技公司开始将此类研究成果视为需要保密的商业机密。

一些研究人员对此非常重视，他们不会在飞机、咖啡店或任何有人能从他们身后偷看他们工作成果的地方工作。

这种神秘的态度让许多长期从事人工智能研究的研究人员感到沮丧，其中包括Meta首席人工智能科学家YannLeCun。LeCun表示，OpenAI和Anthropic的工作不应再被视为研究，而应被视为高级产品开发。

「如果你用商业时钟做这件事，那就不能称之为研究。」LeCun在最近的一次人工智能会议间隙表示，OpenAI在这次会议上几乎没有出席。「如果你秘密做这件事，那就不能称之为研究。」

2024年初，OpenAI准备再次尝试Orion，这次有了更好的数据。研究人员在年初的几个月里进行了几次小规模的训练，以增强信心。

到5月份，OpenAI的研究人员决定，他们已准备好对Orion进行另一次大规模训练，预计训练将持续到11月。

训练开始后，研究人员发现数据中存在一个问题：数据并不像他们想象的那么多样化，这可能会限制猎户座的学习能力。

这个问题在小规模的努力中并不明显，直到大规模训练开始后才显现出来。OpenAI花费了太多时间和金钱来重新开始。

相反，研究人员在训练过程中努力寻找更广泛的数据来为模型提供数据。目前尚不清楚这一策略是否卓有成效。

Orion的问题向OpenAI的一些员工发出了一个信号：推动其早期成功的多多益善战略正在失去动力。

OpenAI并不是唯一一家担心进展会遭遇阻碍的公司。整个行业都在激烈争论人工智能的进步是否开始停滞不前。

苏茨克弗最近与他人共同创办了一家名为SafeSuperintelligence或SSI的新AI公司，他在最近的一次AI会议上宣称，数据最大化的时代已经结束。

他告诉一群研究人员、政策专家和科学家：数据不会增长，因为我们只有一个互联网。甚至可以说，数据是AI的化石燃料。

而燃料也开始耗尽了。

推理

他们在Orion上的挣扎让OpenAI的研究人员找到了一种让LLM更聪明的新方法：推理。研究人员表示，花很长时间思考可以让LLM解决他们没有接受过训练的难题。

在幕后，OpenAI的o1会为每个问题提供多个答案，并对其进行分析以找到最佳答案。它可以执行更复杂的任务，例如编写商业计划或创建填字游戏，同时解释其推理——这有助于模型从每个答案中学习一点。

苹果公司的研究人员最近发表了一篇论文，认为推理模型（包括o1版本）很可能只是模仿他们在训练中看到的数据，而不是真正解决新问题。

苹果研究人员表示，他们发现，如果问题被修改以包含不相关的细节，例如对有关猕猴桃的数学问题进行修改，指出有些水果比其他水果小，则表现会急剧下降。

9月，OpenAI推出了其o1推理模型的预览版，并于本月初发布了o1的完整版本。

所有这些额外的脑力劳动都是昂贵的。OpenAI现在付费为单个查询生成多个答案，而不仅仅是一个。

在最近的一次TED演讲中，OpenAI的一位高级研究科学家强调了推理的优势。

OpenAI科学家诺姆·布朗(NoamBrown)表示：事实证明，在一手扑克牌中，让机器人仅仅思考20秒，所获得的性能提升，就相当于将模型扩大100,000倍，训练时间延长100,000倍。

更先进、更高效的推理模型可能成为Orion的基础。OpenAI的研究人员正在研究这种方法，并希望将其与旧方法结合起来，即获得更多数据，其中一些数据可能来自OpenAI的其他AI模型。然后，OpenAI可以使用人类生成的材料来完善结果。

周五，Altman宣布计划开发一种新的推理模型，该模型比公司之前发布的任何模型都更智能。他没有透露何时或是否会推出一个值得称为GPT-5的模型。