OpenAI未来猛料全曝光,奥特曼承认自己最大弱点是产品

虎嗅APP 2024-11-06 19:09:43

奥特曼在OpenAI伦敦开发者日上的最新采访,终于完整释出!

40分钟的采访过程中,奥特曼除了聊OpenAI未来模型发展方向、Agent、和最尊敬的竞争对手(就是此前碎片式走漏风声的几个问题)外,还就ScalingLaw、半导体供应链、基础模型竞争成本、该雇佣什么年龄段的员工等十多个问题进行了快问快答。

当被问及站在OpenAICEO这个位置上,有什么是他过去和现在都缺乏充分准备的。

奥特曼毫不避讳地表示:产品!

总体来说,我的弱点在产品方面。

现在公司需要我在这方面有更强大、更清晰的愿景。

有趣的是,如果让现年39岁的奥特曼回到23、24岁,他会考虑在垂直方向做一些AI相关的东西。比如辅导人类学习的AITutors,或者AI律师、AICAD工程师什么的。

以下附上这场精彩采访的采访全文,部分段落在不更改其原意的基础上有所删改。

最后还有11个快问快答彩蛋~

内容速览:

1.o1代表的推理模型这个方向对OpenAI非常重要。

2.创业公司的主要业务不要对着现有模型打补丁。

3.难道大家已经忘了几年前的模型表现多糟糕吗?其实才过去没几年。

4.同样的价值下,更广泛、更容易获得、更便宜,那就代表着“非常强大”。

5.“开源”和“闭源但提供API”都很合理。

6.真正有趣的事应该是让Agent做一些人类不会或不能做的事(比如高并发推进项目)。

7.模型确实是贬值的资产。

8.如果你训练的模型落后,或者没有一个有粘性和价值的产品,那么的确可能很难获得投资回报。

9.OpenAI将对o1进行多模态改进;在o1新范式下,预计基于图像的模型将迅猛发展。

10.对OpenAI最自豪的事情,是反复去做一些新的、完全未经验证的事情。

11.世界上很多有才的人因为他们在糟糕的公司工作(或者其他原因),没办法充分发挥潜力。

12.员工缺乏经验并不意味着没有价值。

13.ScalingLaw仍将有效,并持续相当长的时间。

14.用互联网技术变革来类比AI浪潮是一个不好的习惯,更愿意用晶体管来类比。

OpenAI伦敦开发者日奥特曼采访实录

Q1:当我们展望未来,未来OpenAI更多的是o1这样的模型,还是说可以期待参数更大的模型?

A:我们当然希望全面推进,但推理模型这个方向对我们来说特别重要。我们寄希望于用推理来解决许多多年来我们期待去完成的事。

比如,推理模型能够为新的科学做出贡献,帮助编写难度系数很高的代码——我认为这在很大程度上能推动世界向前发展。

所以可以期待一下o系列模型的快速改进,这的意义将非常重大。

Q2:也是从OpenAI的未来计划出发,您怎么看待作为非技术创始人通过开发无代码工具来构建、拓展AI应用程序?

A:肯定会有那一天的。

我们的第一步是让那些懂得写代码的人具备更高的生产力;但落到最后,还是希望提供真正高质量的无代码工具。

目前已经有一些有意义的(无代码)工具,但如果想完全用无代码的方式来创建一家初创公司,还需假以时日。

Q3:有一个创始人提问说,当下,OpenAI显然处于技术栈中的某个位置,OpenAI将会走多远?如果花费大量时间来调整RAG系统,是不是一种浪费时间的行为——因为OpenAI终将在应用程序中涵盖这一部分?

A:我们通常会回答说,OpenAI将尽最大努力,并且坚信我们一定会让推出的模型变得越来越好。

如果你创建的是一家以“给小漏洞打补丁”为生的公司,不管OpenAI是否顺利、正确地推进工作,对你的影响都不是那么大。

换个角度来说,如果你的公司会因为“OpenAI的模型越来越好”而更加成功,你肯定会为此感到高兴的。

就比方说甲骨文公司偷偷跟你说,OpenAI的o4会强得突破你的想象,你绝对乐开花了。

当然了,如果你非要挑一个o1-preview表现得不好的领域去深耕,勉强以此为基础,那你肯定会觉得我们的下一代模型不会像想象中表现得那么好。这就是我想告诉初创公司的。

我们相信,OpenAI身处的改进轨道相当陡峭,现在模型的缺陷将会被后来者解决和弥补。

Q4:从一个创始人的角度来看,OpenAI可能会在哪些地方(而不是另一些地方)取得成功?相信投资者们也很想了解这个问题,大家都不想投资亏钱。

A:OpenAI将创造出数万亿美元的市值,具体来说,是通过使用AI来构建以前觉得不可能或者不切实际的产品与服务,来创造出市值新高。

我们希望推出的模型非常棒,让使用者无后顾之忧,只需要用它做想做的事情就是了。

在GPT-3.5的时代,95%的初创公司、人,都在打赌模型不会变得更好。

其实他们做的事情,我们早就预料到GPT-4可以搞定,可以做得更好,不会再出现3.5时代模型会出的错了。如果创业者/开发者们做的事只是补全某一代模型的某个缺点,你就会发现这个缺点越来越无足轻重。

难道大家已经忘了几年前的模型表现多糟糕吗?其实才过去没几年。但是机会遍地都是,所以乍一看,给现有模型打补丁是不错的机会(所以就不去搞AI助教或者AI医疗顾问什么的)。

所以我才说,一开始的时候,95%的人肯定认为模型不会再改进,只有5%的人打赌模型会发展得越来越好。

不过我觉得现在的情况已经不是这样了。

大家现在反而觉得GPT-3.5进化到GPT-4的速度会是一种常态,但事实并非如此。好在我们内部员工都非常勤奋,我们知道将会发生什么。

Q5:软银孙正义说,AI每年都会创造9万亿美元的价值,这将抵消他所认为的每年9万亿美元的支出。看到这个说法的时候,您怎么想?

A:从数量级上来说,现在已经差不多了。AI显然会导致大量资金支出,同时创造大量的价值。

这种情况发生在每一次大型技术革命的过程中,AI显然是其中之一。

明年将是OpenAI向下一代系统大力推进的一年。

刚才咱们谈到什么时候会出现无代码软件Agent,我无法给定一个准确的时间,但可以畅想一下,如果任何人都可以描述他们想要的整个公司的软件,这将为世界带来多少经济价值。

同样的价值下,更广泛、更容易获得、更便宜,那将非常强大。

还有一些其他的例子,比如我之前提到的医疗保健和教育,这两个领域对世界而言价值数万亿美元。

如果AI能够真正以不同于以往的方式实现这一点,我认为它带来的经济价值的具体数字根本不是重点,更别提到底是9万亿还是1万亿了。

但可以肯定,AI创造的价值确实令人难以置信。

Q6:开源是一种非常重要的方法。您如何看待开源在人工智能未来中的作用?OpenAI内部讨论过“我们应该开源所有模型或其中某些模型”吗?

A:毋庸置疑,开源模型在生态中非常重要,而且现在市面上也有非常好的开源模型。

但我认为提供良好的服务和API也是有意义的——这很合理,人们会选择适合自己的方式。

Q7:您如何看待当今Agent的定义?对你来说,Agent是什么?

A:我没有充分考虑过这个问题,但我可以给Agent一个长期任务,并且尽可能少地去监督它的执行过程。

Q7':您认为人们对Agent的看法其实是错误的吗?

A:可能我们都没有一个准确的了解,但我们都知道一些重要的指标。

比如人们在谈论代他们做事的AIAgent时,常常举的例子是让Agent去预定餐厅。Agent可能在线预订,或者给餐厅打电话订座。

确实,Agent可以帮忙做一些事节省时间。不过我认为真正有趣的事,应该是让Agent做一些人类不会或不能做的事。

打个比方,Agent不是打电话给具体某家餐厅订座,而是联系300家餐厅,找出哪家最适合我。如果打过去的电话都是Agent接的,那就更酷了!因为人类无法大规模并行推进这种事情。

再举个更有趣的例子。

Agent可能更像一个非常聪明的同事,你和它合作一个需要耗时2天或2周项目,Agent可以自己执行,还做得很好,在必要的时候它会跟你沟通,最后交出一份出色的成果。

Q7'':这是否从根本上改变了SaaS的定价方式?SaaS通常按用户数量定价(席位收费),但现在AI实际上在替代劳动力。你如何看待未来的定价方式?

A:我只能猜测一下,我真的不知道。

我可以想象一个世界,你可以要求说“我想要1/10/100个GPU不断地为我工作”,这就不会按席位收费,而是根据持续处理这个问题的计算量来定价。

Q7''':我们是否需要为Aengts的使用场景构建特定的模型?

A:它当然需要大量的基础设施,但我觉得o1模型指出了通向能够出色完成Agent任务的模型的道路。

Q8:每个人都说模型是贬值的资产,模型的商品化非常普遍。您对此有何回应和思考?当你考虑到训练模型所需的资本密集度不断增加时,我们是否会发现“这个领域需要大量的资金,但实际上只有很少人能做到”会发生逆转?

A:模型确实是贬值的资产,但这并不意味着它们不值训练投入的成本。况且你训练模型的时候会产生积极的复合效应,让你能更好地训练下一个模型。

我们从模型中获得的实际收入证明了这项投资的合理性——当然,并非所有人都能做到这一点,而且有很多人在训练模型这件事上重复造轮子。

如果你训练的模型落后,或者没有一个有粘性和价值的产品,那么的确可能很难获得投资回报。

OpenAI非常幸运地拥有ChatGPT,拥有数亿使用我们模型的用户。

所以即便成本很高,我们也可以把这个天文数字分摊到大量用户身上摊薄它。

Q9:随着时间推移,OpenAI模型如何继续保持差异化?你最想专注于扩展这种差异化的领域是什么?

A:推理是我们当前最重要的关注领域,我认为这将解锁下一次在创造价值方面的巨大飞跃。

因此,我们将在各个方面改进模型,我们将进行多模态工作,并添加其他功能,我们认为这些功能对人们希望使用这些模型的方式非常重要。

Q9':你如何看待推理和多模态工作,包括挑战和你想要实现的目标?

A:我希望它能顺利实现。这显然需要一些努力才能完成。但是人类的婴儿和幼儿时期,即擅长语言之前,仍然可以进行相当复杂的视觉推理。

Q9'':视觉能力将如何随着o1的新推理范式而扩展?

A:在不剧透的情况下,我预计基于图像的模型将迅猛发展。你可以期待在图像模型方面的快速进展。

Q10:OpenAI如何在核心推理方面取得突破?除了Transformer之外,是否需要开始推动强化学习作为一种途径或其他新技术?

A:这是两个问题:我们如何做到,以及Transformer之后是什么。

首先,我们如何做到是我们的秘诀。

复制已知有效的东西真的很容易,原因之一是你有信心知道什么是可能的。在研究人员做了一些事情之后,即使你不知道他们是如何做到的,你也可以去复刻它。这一点可以在GPT-4和o1的复制版中得到验证。

真正困难的事情,也是我对OpenAI最自豪的事情,是我们反复去做一些新的、完全未经验证的事情。

很多机构、组织声称有能力去做这样的事,但实际上很少有真正做到的,包括AI领域之外。

从某种意义上说,我认为这是对人类进步最重要的投入之一。

我期待在退休后想写一本书,一本介绍我学到了些什么的书,分享我如何建立一个能够做到这一点的组织和公司文化的经验(而不是一个单纯复制他人成果的组织)。

我认为世界需要更多这样的组织,虽然它的数量会被人类才智所限。

但现实情况是有大量人才被浪费了,因为这个世界不擅长建立这样的组织。但我还是希望有更多这样的组织。

Q11:人才是如何被浪费的?

A:世界上有很多有才的人,但因为他们在糟糕的公司工作,或者一些其他原因吧,没办法充分发挥他们的潜力。

我对AI最兴奋的一个点,就是我希望它能让我们更好地帮助每个人来发挥最大潜力,这个目标还远远没有达成。

我敢肯定,如果世界上很多人的人生轨迹稍有不同,他们都会是出色的AI研究人员。

Q12:在过去的几年里,你有一段令人难以置信的经历,(带领出)令人难以置信的高速增长。你提到退休时会写回忆录,那么当你回顾过去10年,你的领导方式有了什么样的显著变化?

A:对我而言,这几年最不同寻常的就是事情变化的速度。

在一家常规的公司,你有充足的时间去实现从0到1亿美元的营收,再从1亿到10亿,一直到100亿。你无需在两年内达成这个过程。我们确实并非传统意义上的硅谷初创公司,

我们不得不如此迅速地达成这一目标,有很多东西我本该花费更多时间去学习(但没有去学习)。

Q12':有什么东西是你不知道,且本希望花更多时间去学习的?

A:我说一个吧,就是“让公司专注于如何增长下一个10倍”,而不是增长10%。

这需要付出多大的努力?这件事有多困难?

如果是增长下一个10%,之前有效的东西会仍然有效。但要让一家营收10亿美元的公司增长到营收100亿美元,那就不能简单重复之前做的事,而是需要大量的变革。

在一个人们甚至没有时间掌握基础知识的世界中,因为增长太快,我严重低估了马不停蹄向前冲刺到下一步所需付出的努力,同时又没有忽视我们必须做的其他一切。

Q13:KeithRabois(硅谷投资人,Paypal前副总裁)说你应该雇佣非常年轻的、30岁以下的人,这是彼得·蒂尔(PeterThiel,Paypal创始人)教给他的建立伟大公司的秘诀。我很好奇,你如何看待这种观点?你如何平衡雇佣年轻的有活力但缺乏经验的人,与那些更有经验的人?

A:我们创办OpenAI的时候,我就30岁左右,并不是特别特别年轻。但目前为止,OpenAI的进展似乎还不错~

Q13':你如何看待雇用30岁以下的人来工作?他们年轻、精力充沛、雄心勃勃,但经验较少(有的可能也很丰富)?

A:显而易见,答案是你可以通过雇佣两类人来取得成功。

我们的团队最近雇用了一个年轻人,他的工作令人惊叹。我都不懂这些人怎么能在如此年轻的时候把工作干得这么漂亮?!但这就是事实。

如果你能找到这样的人,他们会带来令人惊叹的新视角、能量等。

另一方面,当设计一些人类有史以来最为复杂、最为昂贵的计算机系统时,我可不愿意押注于一个刚刚起步的人。

所以需要两者兼具。

我认为你真正想要的是一个由任何年龄段的人组成的极高人才标准,以及一个策略,即我只会雇用年轻人,或者我只会雇用年长的人。

我对YCombinator最感激的事情之一是“缺乏经验并不意味着没有价值”。

有一些非常有潜力的人在职业生涯的初期就可以创造巨大的价值,我们应该把赌注押在这些人身上,这是一件伟大的事情。

Q15:有人跟我说,有时候Anthropic的模型更适合编码任务,这是为什么?你认为这种评价公正吗?开发者该在什么时候选择OpenAI而不是其他模型厂商呢?

A:没错,Anthropic有一个非常擅长写代码的模型,令人印象深刻。

我认为开发者大多数时候都会使用好几个模型,而且随着Agent的作用越来越大,我不知道未来会如何发展。

我认为AI将无处不在,而我们目前谈论或思考它的方式感觉不太对。如果我必须描述清楚,我们会从讨论模型转向讨论系统,但这需要一些时间。

Q16:当我们考虑scale模型时,你认为在多少次模型迭代内,ScalingLaw(缩放定律)仍将适用?人们普遍认为它不会持续太久,但它似乎持续的时间比人们想象的要长。

A:我理解这个问题的核心是“模型能力的改进是否会像过去那样?”我相信答案是肯定的,并且会持续很长时间。

Q16':你怀疑过这件事吗?

A:完全没有。

Q16'':为什么?

A:我们遇到过我们不理解的行为,比如失败的训练运行,或其他各种各样的事情。

当我们接近一个范式的结束时,不得不想出下一个范式。

Q16''':哪一个是最难驾驭的?

A:当时研究GPT-4的时候,有一个问题非常棘手,我们真不知道怎么解决它。

虽然最后找到了解决办法,但很长一段时间我们都不知道该如何推进这个项目。

后来我们转向我们长期以来感兴趣的方向,就是o1和推理模型,但在此之前经历了一条漫长而曲折的研究之路。

Q17:训练和运行都可能失败,保持士气是不是一件困难的事?你会如何保持/提振士气?

A:像你知道的那样,我们很多员工都对构建AGI感到非常兴奋,这是非常直接的动力。

没有人期望通往成功的这条路是轻松的、直线的。

有句话说得好,大概是说“我从不祈祷上帝站在我这边,我从来都是祈祷并希望自己站到上帝那边”。

在某种程度上,押注深度学习感觉就像站在了天使那侧,尽管你沿途会遇到一些大的绊脚石,但最终会发现它似乎总是会奏效。

因此,对此有深刻的信念对团队保持士气十分有利。

Q18:我可以问一个非常奇怪的问题吗?我最近听到一句很棒的话,“生活中最沉重的东西不是铁或金,而是未做出的决定”。哪一个未做出的决定最让你烦恼?

A:我每天做(及没做)的决定都不太一样,但没有一个是“大的”决定。

有一些重大的事情,比如是否会押注于下一个产品,或者我们是否会喜欢以这种或那种方式构建我们的下一台计算机——这些都有点像高风险的单向传送门,我会像其他人一样拖延很久。

但大多数情况下,困难的是每天都有些事情在投票比例为51:49的情况下让我最终拍板。这些事可能本身就是51:49的,而且我不觉得我能比其他人做得更好,但我又必须做最终决定。

Q18':当你要对这些51:49的事做决策时,你通常会打电话给谁?

A:没具体的谁。

如果做一切事情都要依靠一个人,我觉得是错误的。对我来说,正确的做法是有15或20个人为我建议,他们中每一个都在特定的领域有良好的直觉或背景。

你可以给(某个领域)最好的专家打电话咨询,而不是在各个方面都只依赖一个人。

Q19:接下来我想谈谈半导体供应链。你对半导体供应链有多担心?

A:我不知道如何量化这个担忧。

不可否认对它是担心的,但这不是我的首要担忧,但它在所有担忧的前10%之内。

我们已经陷入了太多的麻烦,已经超过了为此担心的阶段。

在某种程度上,我认为这一切都会顺利进行,但现在感觉有一个非常复杂的系统,每个层面都各自运作。在OpenAI内部也是如此,在任何一个团队内部都是如此。

举个半导体的例子,你必须平衡电源可用性与正确的网络决策,以及能够及时获得足够的芯片,以及研究可能存在的任何风险并准备好与之相交,这样你就不会完全措手不及,或者手里拿着一个无法利用的系统。

“供应链”听起来太像一个pipeline了,但每个层次上的、整体生态系统的复杂性,是我在任何行业中前所未见的。

怎么说呢,这可能是我最大的担忧。

Q20:很多人把这一波AI浪潮与互联网相比较,尤其是在兴奋和热情方面。我觉得两者所耗费的金额还是有些不同。拉里·埃里森(甲骨文公司创始人)说进入基础模型竞赛的起点将花费1000亿美元,你同意这个说法吗?这是合理的吗?

A:不,我认为会花费更少。

在基础模型领域竞争的成本将不到1000亿美元。

一个有趣的现象是,每个人都喜欢用此前的技术革命作为例子,来谈论新的技术。我认为这是一个不好的习惯,但我理解人们为什么这样做。

在我眼中,人们用来类比AI的例子特别糟糕,显而易见,互联网和AI非常不同。

你提到一个关于成本的事情,以及是否需要花费1000亿美元来竞争,但互联网革命的特征是那时候起步真的很容易,而且对不少公司来说,这一波浪潮只是互联网的延续。

就像有人制造了这些AI模型,你可以使用它们来构建各种伟大的东西;但如果你试图构建AI本身,那就完全不同了。

人们常用来类比AI的另一个例子是电力。出于很多原因,我觉得这也不合理。

我最喜欢用来类比的例子是晶体管。这是一项新的物理发现,它具有令人难以置信的缩放特性,很快就渗透到了各个地方。

我们现在可以想象到摩尔定律之类的东西,就像人工智能的一系列定律告诉我们它会以多快的速度变得更好。

每个人都受益于它,整个科技行业都受益于它。产品和服务中有很多晶体管,但你并不真正将它们视为晶体管公司。

这是一个非常复杂、非常昂贵的工业过程,具有庞大的供应链。

基于这个非常简单的物理发现,带来了长期的巨大经济增长——尽管大多数时候你并没有考虑它。

你不会说“这是一个晶体管产品”,只会觉得“OK,这东西可以为我处理信息”。

你甚至会理所当然地忽视晶体管的存在。

快问快答彩蛋

Q1:如果你现在20岁出头,使用我们今天的基础设施,你会选择做什么?

A:某个AI支持的垂直领域,我会选择AI助教,或者我能想象到的最好的AI律师、AI医疗顾问,任何类似的东西。

Q2:如果你要写一本书,你会给它取什么名字?

A:我还没有准备好标题,除了部分我想写的东西,我还没有完整构想过这本书。

不过我认为它会与人类潜力有关。

Q3:在AI领域,有什么是没受到足够关注,但每个人都应该花更多时间在上面的?

A:某种能够理解你整个生活的AI,我希望看到有很多不同的方法可以解决这个问题。

并不一定需要真的有无限的上下文,但以某种方式,你可以拥有一个知道关于你的所有事情、可以访问你的所有数据的AIAgent。

Q4:上个月有什么事情让你感到惊讶,Sam?

A:一个我不能谈论的研究成果,但它好得令人震惊。

Q5:你最尊敬哪位竞争对手?为什么是他们?

A:我想说,我尊敬目前这个领域的每个人。

我认为整个领域充满了才华横溢、非常努力的人。

我不是在回避问题,我可以指出每个地方都有超级有才华的人,做着超级出色的工作。

Q6:告诉我,你最喜欢的OpenAIAPI是什么?

A:我认为新的实时API非常棒,我们现在有一个庞大的API业务,里面有很多好东西。

Q7:你今天最尊敬AI领域的谁?

A:让我向Cursor团队致敬。

有很多人在AI方面做着令人难以置信的工作,但在使用AI、让AI提供真正神奇的体验、创造大量价值的方面,Cursor以人们之前没有想到的方式将这些部分拼凑在一起,我认为这是非常了不起的。

这个答案排除了OpenAI里的人,不然我得说出一长串名字。

Q8:你如何看待延迟和准确性之间的权衡?

A:需要一个在延迟和准确性之间的刻度标准。我们正在做快问快答,我没有特意加快速度,但也尽量不想太久。

在这种情况下,你想要的是(降低)延迟。如果换成想在物理学上做出新的重要发现,就愿意多等待几年。

答案是,应该由用户控制这个权衡。

Q9:我相信每个人都会对自己的领导力感到不安,这种情况下,以及您希望改进自己的领导力领域时,作为OpenAI的领导者、CEO,您最希望改进哪些方面?

A:这是一个很长的清单……我试图厘清排名第一的是哪一个。

这周最困扰我的事情是,我对我们产品策略的细节比过去还要不确定。

我认为该产品总体上是我的弱点,现在公司需要我在这方面有更强大、更清晰的愿景。

我们有一位出色的产品主管和一支出色的产品团队,但我希望在这个领域我能更强大。

Q10:你雇用了KevinWeil(来担任CPO),我认识Kevin很多年了,他非常出色。是什么让你觉得Kevin是世界级的产品领导者?

A:“纪律”是我想到的第一个词。

我们将专注于我们要说“不”的事情,真正试图代表用户说为什么我们要做或不做某件事,真正努力不抱有幻想。

Q11:Sam,你接受了很多采访。

最后我想谈一谈,我们对OpenAI有五年的展望和十年的展望。

A:如果我们是对的,我们可以轻松地在接下来两年内开始制造系统,帮助科学进步。

五年后,OpenAI的技术进步速度会快到令人难以置信,完全可以用疯狂来描述。

第二点是,社会本身的变化实际上很小。

就像五年前问大家计算机是否会通过图灵测试,大家都会摇头。

如果你说一个神谕告诉你会怎么怎么样,他们会说:oh,这将会是一个疯狂的、惊人的社会变化。

而现在,我们确实通过了图灵测试,而且社会并没有发生太大的变化。

一切只是呼啸而过。

我期望不断发生的事情就是进步,科学进步,不断前进,以一种我认为良好和健康的方式超越所有期望,同时社会变化并没有那么大。

参考链接:https://www.youtube.com/watch?v=peg-aX1oii4

0 阅读:3