十二天直播结束,GPT-5果然还是没有来……
当地时间12月4日,OpenAI首席执行官山姆·奥特曼在社交媒体透露,接下来的12个工作日中,每天都将进行一场直播。在总共12场直播中,公司将展示一些新产品或者样品。时间一晃而逝,我们来汇总一下,OpenAI这12天里,都发布了哪些东西:
DAY1:增强推理模型o1正式版,以及每月200美元的ChatGPT Pro订阅服务;DAY2:强化微调(Reinforcement Fine-Tuning),实现定制化推理模型;DAY3:文生视频模型Sora 正式版;DAY4:编辑协作工具ChatGPT Canvas,深度融合写作与编程场景;DAY5:ChatGPT集成Apple Intelligence,集成 Siri、写作工具升级、视觉智能能力;DAY6:视频输入和实时屏幕共享功能,高级语音模式支持音频输入输出;DAY7:Projects in ChatGPT,用于项目管理与写作、文件与数据管理、个性化定制等场景;DAY8:ChatGPT搜索全量上线,支持语音功能;DAY9:发布o1模型API并升级实时API;DAY10:推出可电话直呼的ChatGPT功能;DAY11:ChatGPT桌面程序推出“应用协作”功能;DAY12:新一代推理模型o3及精简版o3-mini压轴发布,更加专注于高性能推理任务,OpenAI表示o3可以接近实现AGI。回顾12天的直播内容,虽然在中场迎来了视频生成大模型Sora和新一代推理模型o3系列的“炸场”,但差强人意的表现并没能值回他它跳票10个月的期待,反而是备受期待的GPT-5并没能在本次连续的直播中亮相,这也让行业对于OpenAI乃至基础大模型的发展产生了一丝担忧。
Scaling Law失效,GPT-5难“力大砖飞”关于GPT-5的“跳票”,其实从种种迹象中都可以发现,自2023年3月14日GPT-4发布以来,不少业内人士都期待OpenAI能在次年推出它的迭代版本GPT-5。然而21个月的时间,虽然GPT-4更新了多个衍生版本,但作为大迭代的GPT-5却迟迟没有露面。
在刚刚落幕的Meet 2025智能未来大会上,零一智能创始人李开复透露了OpenAI的一些发展近况,并强调“他们(OpenAI)的GPT5训练不是很顺利”,主要原因在于GPT-5训练的过程中,碰到了一些10万张卡带来的不稳定的问题,常常会出现不得不回到上一个check point的情况。
曾被大模型行业奉为圭臬的“Scaling Law”,似乎正在走向他的终局。
日前, OpenAI 前首席科学家 Ilya Sutskever 在NeurIPS上发表公开演讲时指出,当前 AI 模型预训练方式将不可避免地走向终结。他还将 AI 训练数据比作“化石燃料”,认为互联网上的人类生成内容是有限的,业界已经达到了数据峰值,下一代 AI 系统将突破当前局限,具备真正的主动性和类人推理能力。
此言一出,迅速引起了业内的恐慌,首当其冲的便是对于堆算力、对规模的硬件与云服务企业,如果Scaling Law当真失效,意味着行业对于算力需求的增长将陷入停滞。
面对质疑,OpenAI也不得已紧急“灭火”,OpenAI大神,o1核心成员Noam Brown表示,o1代表的是一种全新的,以推理计算为代表的Scaling。换言之,Scaling Law并没有失效,只是换了一种形式的“Scaling”。但无论如何,由于当前Scaling Law的方法受到限制,OpenAI不得不通过寻求其他方式来训练GPT-5。
正所谓,成也Scaling Law,败也Scaling Law。
转向营利,OpenAI没得选而OpenAI对于Scaling Law的“孤注一掷”,也让它在营收方面承载了巨大的压力。
李开复透露:在Scaling Law逐渐失势的前提之下,OpenAI的商业模式依然是通过大量的去融资,然后买大量的算力,然后靠算力来继续“大力出奇迹”。
然而,OpenAI遇到的瓶颈,不仅仅是GPT-5的训练,在融资方面,OpenAI碰到了一些瓶颈。OpenAI在2024年完成了多轮融资,其中包括一轮66亿美元的融资,使得公司整体估值达到了1570亿美元。这一估值使OpenAI成为全球第三大独角兽公司,仅次于字节跳动和SpaceX。
但即使如此,李开复透露:对于OpenAI而言,上一次的融资60多亿是“不到预期”的,所以现在又不得不紧锣密鼓开启新一轮的融资。
数据显示,OpenAI预计2024年的营收将达到37亿美元。然而,有专业机构预测OpenAI的全年总收入将超过50亿美元,比2023年的16亿美元大幅增长约225%。收入主要来自ChatGPT的订阅服务和API业务。其中,ChatGPT的订阅收入预计为27亿美元,占比超过70%;API收入预计为10亿美元,约占27%。
尽管营收大幅增长,但OpenAI仍未摆脱亏损泥淖,预计在2024年将亏损50亿美元。这一亏损主要与运营服务的成本、员工工资、办公室租金以及高昂的研发成本有关。
2019年,OpenAI宣布转型为“有限盈利”组织,并计划进一步转型为完全营利性公司。这也导致OpenAI早期投资人埃隆·马斯克离开OpenAI,并另立山头成立了x.AI,后续马斯克又对于OpenAI提出了指控,强调这一转变违背了OpenAI最初的非营利公益使命,可能对行业竞争产生不公平影响。
然而,对于山姆·奥特曼这样的创始团队也好,对于OpenAI的投资人也罢,都深刻地明白,资本的“输血”只是暂时的。如果坚持“非营利”道路,等到“弹尽粮绝”之时,等待OpenAI的,只会是被巨头吞并的结局。
这也是奥特曼无视马斯克出走,也要将OpenAI转型为营利公司的原因之一。
聚焦应用层,最后的自救回顾OpenAI的直播,可以发现,OpenAI推出的产品,一部分集中在推理能力的提升与成本的下降,而另一部分则集中在应用层面,通过自身的产品实例,吸引更多的个人与企业付费用户。
去年年底,奥特曼宣布GPT Store时,OpenAI发力AI应用的计划便已初见端倪。彼时OpenAI希望通过商店的方式,为开发者提供一个上架基于OpenAI相关技术搭建产品的平台,并让用户更容易地获取这些AI应用。
GPT Store于2024年1月11日正式上线,很快OpenA便声称用户已创建超300万个定制ChatGPT。然而,这一计划从推出到现在,并不顺利。
首先,GPT Store并没有足够吸引力让开发者入驻,不少开发者抱怨流量有限、体验不佳,且支持不足,有人质疑OpenAI已放弃GPT Store。
其次,平台垃圾内容泛滥,尽管有双重审核,仍存违规GPT,如模仿迪士尼、漫威风格,甚至助长学术造假,引发版权争议。
再者,GPT Store推广难,因设20美元付费墙限制用户访问,影响用户增长及开发者吸引力。此外,OpenAI分心于多项目,如搜索引擎、AI agents等,导致难以专注GPT Store运作。
这一系列“灾难”运营之下,再叠加彼时大模型技术能力,不足以满足开发AI应用的需求,导致GPT Store并没能掀起大的波澜。
但AI应用的道路,在产业继续新的引擎来驱动价值增长的背景之下,依然成为了行业共识。
在AI应用方面,除了海外除了OpenAI,还包括谷歌、Meta,国内诸如阿里巴巴、百度、360、智谱等走在前沿的企业,也纷纷开始重视智能体技术的应用,并将其落地到实际场景中产生价值。
智谱CEO张鹏曾表示:在大模型技术之前,没有任何一种方法能够智能化的代替人,跟机器进行交互。时至今日,这些Chatbot正逐步进化为具备“手、脑、眼”全面能力的自主Agent,为人类带来前所未有的智能体验。
如今,OpenAI在产品中更加强化工具属性,也让其对于B端打造AI应用方面有了更多的可塑性,乃至C端市场有了前所未有的掌控力。
尤其在C端市场,OpenAI拥有所有友商望尘莫及的优秀市场。OpenAI首席财务官Sarah Friar最新对媒体透露,公司约75%的收入来自消费者订阅。OpenAI成功将5%至6%的免费用户转化为了付费会员。目前,ChatGPT每周活跃用户数量已达2.5亿。据此估算,OpenAI付费订阅用户数量应该在1000万左右。此前还有消息称,OpenAI商用订阅用户数,已突破100万。
与其他AI大模型厂商主要依赖搭售配套服务(如云服务)来实现盈利的模式不同,OpenAI选择了一条更为直接且富有潜力的道路——通过用户订阅的方式获取大量收入。这种盈利模式不仅稳固了其与用户的直接联系,还确保了收入的持续性和稳定性。
以谷歌和微软为例,这两大巨头在国内外的AI市场中占据重要地位,它们通过提供与AI紧密结合的云服务,为用户带来更加全面和高效的能力,从而推动了业绩的显著增长。而在国内,百度、阿里巴巴和字节跳动等科技巨头也所见略同,利用各自在AI和云服务领域的优势,为用户提供一站式的解决方案,进而实现商业价值的最大化。
此外,还有例如英伟达这样的企业,通过推动大模型训练与推理方面的升级,创造出全行业对于整个算力的巨大需求,同时背靠CUDA成熟的开发生态,无疑使其成为大模型时代最大的得益者之一。财报显示,英伟达营收、利润增长。
而反观国内,华为、壁仞科技和摩尔线程等企业正在以不同的方式填补这一空白。其中华为昇腾系列,技术能力较为全面与供应链能力最为领先,生态建设也正在初步成型。壁仞科技依靠强算力定位AI,灵活但通用性存疑;摩尔线程则刚刚开始从游戏到AI的跨越尝试。除此之外,当前国内还有很多家寒武纪,燧原、沐曦、景嘉微等企业,但在体量、技术、产业链成熟度上还与前者有差距。
大模型之家曾指出考虑到to B产业方面,只有华为具备稳定供货能力和强大的综合实力,未来在中国市场可能成为最大受益者。但在大模型发展的道路上,我们也要正视差距,才可能实现追赶与超越。
此外,OpenAI近期推出的o1 Pro及其迭代版本o3,在推理能力上实现了质的飞跃,尤其强调了“慢推理”策略的核心价值。相较于以往单纯追求知识广度的扩展,OpenAI此番更加注重通过构建精细且连贯的思维链来确保答案的精准无误。这一转变,不仅彰显了OpenAI在抑制大模型常见幻觉问题上的坚定决心,也预示着其向更加实用化方向的迈进。众所周知,幻觉问题一直是制约大模型广泛应用的关键因素,而OpenAI的这一系列升级,无疑为克服这一障碍提供了有力支持,为AI技术的产业落地铺就了一条更为坚实的道路。
作为人工智能产业发展的风向标企业,OpenAI的发展状况在一定程度上影响着全球AI产业发展的格局,而从其连续12天的直播中也能够看出,随着基础模型能力的发展正在趋近于临界点,随着技术的基本成熟,AI企业开始寻求向应用侧需求发展,一方面通过产业价值增强自身造血的能力,减轻对于投资的依赖;另一方面则落地于产业,以实战代练,实现产业、技术、数据多方面齐头发展。
AGI虽远,行则将至。