当杰夫·辛顿在2024年获得诺贝尔奖的时候,他或许会想起12年前的冬天,来找到他的那家叫百度的中国公司。因为是百度最早发现了他关于神经网络研究的价值,并极力邀请他加盟。
2012年12月初的一天,美国滑雪胜地太浩湖的一家赌场酒店里,杰夫·辛顿和他两名学生迎来了四方的竞拍者,他们分别来自百度、谷歌、微软和DeepMind。
辛顿名下的这间叫DNN research公司,其实没有任何实体业务,它唯一的资产,其实就是这三位学者脑中的学识。
可能是觉得中国太过于遥远,当时已经年近七旬的辛顿,最后接受了谷歌的出价。
但在彼时的大洋彼岸,中国的信息产业的诸多企业中,几乎没有人知道发生过一件这样的事情,更不知道有一家中国企业已经开始对人工智能的探索。
客观讲,拍板参加这次竞拍的百度创始人李彦宏,是一个有方向感的科技企业家。在过去十几年里,他的很多关于AI发展方向的判断,都对产业产生了价值。
但也有人不认同他的一些判断,于是,边争论边发展,直至逐渐被验证,成为共识,成为这个行业的有趣现象。
那么,我们不禁要问,李彦宏的方向感,从何而来?
——导语
01应用来了?!2024年的百度世界大会,李彦宏的主旨演讲,从一个技术问题开始。
这个问题,叫“AI幻觉”,它特指在生成式人工智能时代,模型生成的内容与现实世界事实或用户需求不一致的现象。
你也可以简单的理解为,大模型在一本正经的胡说八道。
李彦宏用一个四层的天坛图片举例,告诉台下的听众——真正的天坛只有三层,但模型往往会自动生成一幅四层的图片而不自知。并且,这是所有的生成式模型都会遇到的问题。但在真实世界里,这类问题往往出现的更加隐蔽且诡异,从而给用户更多的困扰和误导。
李彦宏告诉观众,百度用RAG(检索增强)和Image based RAG(/基于检索增强的文生图)的技术,改善了文字和图像生成中的幻觉问题。
而之所以把这个技术细节放在这次重要的演讲的开头,和李彦宏接下来要作的一个判断有关——他认为,“AI幻觉”直接导致了“(生成式)多模态大模型其实还没有什么成规模的应用出来”。
故而,在他看来,消除幻觉既是大模型领域在过去24个月实现的最大进展,也应该是AI应用出现爆发的起点。基础模型的能力已经就绪,行业将迎来一个物种大爆炸的应用爆发期。”
如果仔细的研究李彦宏过去18-24个月的讲话,会发现“应用”是一个出现频率极高的词汇。
22个月前,也就是早在2023年3月,李彦宏就提醒行业“不要重复造轮子”,并表示应用才是大模型真正的机遇。
11个月前,也就是2023年12月16日,李彦宏更直接的表示了自己的焦虑:““我多多少少有点着急”,他在与极客公园的对话中谈到:“整个国内的AI大模型行业,现在其实卷偏了。实际上,眼下更应该抓住的机遇,是大模型原生应用”。
而到了今天,他把2024年的百度世界大会的主题词定为“应用来了”,简单、直接、强硬。
在实际行动方面,他在百度内部推动了“百度所有业务,都要根据⽣成式 AI理念重构,重做⼀遍原来的产品”;而在外部,为了给自己心目中的“应用潮”再加一把力,他还在会上展示了遴选出来的Top100智能体和Top100产业应用。
在当下,谈大模型原生应用的当然远非仅李彦宏一个人,但如此执着且狂热的业者,也着实不多见。
在笔者看来,李彦宏急于推动大模型的应用落地,并非因为大模型已经完美,而是他的底层认知决定的。
早在21世纪的第一个十年,他就反复的释放一个观点:中国由于是(网民人数)的互联网第一大国,就有机会先遇到问题,进而有机会先去解决这些问题,从而在应用创新上实现跨越。
而这已经变成了现实。
在近年,他把这个观点浓缩成一个词汇:“反馈式创新”,在很多场合提及——只有真实世界的实际反馈才能持续驱动创新。
这也解释了,为什么他始终认为,在大模型通往完美的路上,急需百万级的“应用”作为导航仪,去探索大模型的能力、产品与市场的契合度(PMF)。
但是,真实世界这次会按照他的判断而做出改变吗?
02方向感当ChatGPT横空出世后,在中国出现了百模大战,数百家公司纷纷投入大模型这个赛道,资本的眼神都是火热的。
在很多人为这种图景叫好、上头的时候,李彦宏唱了反调,他认为——百模大战造成了社会资源的巨大浪费,尤其是算力的浪费,这种局面不可持续。
但极多人当时并不认同他的观点,他们的理由是:只有150个员工时的oepnAI就做出了ChatGPT,那我们为啥不能 搏一搏?
事实是,虽然openAI起了个大早,但现在各大巨头的大模型都赶上来了。
这反映了一种现象——巨头公司往往在行业出现突破式创新时会因为体量过大、反应较慢而落后半步,如IBM、微软、甲骨文都犯过这样的错误,但一旦庞大的资源和组织被真正动员起来,很容易赶上并碾压初创公司。
这也几乎注定了,大模型不是一条对初创公司友好的赛道。
国内的事实似乎也说明了这一点,有统计显示,截至2024年4月底,国内共计推出了305个大模型。而截至5月16日,只有约140个大模型完成了生成式人工智能服务备案,不足总量的一半……其中一小部分或许是因为用于学术研究,但大部分则死于弹尽粮绝。
事实也是,由于大模型赛道的天花板很高,现在的大模型技术距离理想情况还相差非常远,所以模型要不断快速迭代、更新和升级,不断满足用户需求,以及降本增效……这意味着巨大的、无穷无尽的投入,更直接导致了AI还没有形成生产力,但卖算力卡的英伟达却成为全球市值老大。
对于此,巨头们尚且身不由己,初创企业怎么独善其身?
再举一个例子,李彦宏和很多行业观点对撞的一个判断,是他认为:商业化模型比开源模型更有潜力和价值。
在“开源模型”十分盛行、部分开源模型宣布取得了比闭源模型取得更好的打榜成绩的当下,“开源派”声势浩大。甚至,扎克伯格这种大佬还亲自撰文——《开源AI是前进之路》,亲自下场为开源站台。
怎么看待这个问题,这里,笔者要讲两层意思。
第一层:“开源”在一开始可能是更快、更便宜的,但更有商业潜力的还是商业化大模型,因为最后拼的是产品力。
例如,在差不多10年前,分布式计算和分布式存储开始大行其道,国内大部分存储企业都去用免费的分布式系统,只有两家企业——华为和曙光,决心自研全栈、闭源的分布式存储体系。
10年过去了,这两家有自研体系的企业牢牢占据了国内分布式存储市场的头两名,而那些用开源分布式的企业,受限于对底层技术的控制能力有限、bug多、没有技术支持等方方面面的原因,始终没法打入头部市场。
第二层,开源是有标准的,在AI语境下,“伪开源”可能更多。
在软件时代,开源相对比较简单,能够拿到源代码、二进制代码就算开源。
开源的经典精神是——如果开发人员无法学习、使用、修改和共享特定程序,则该程序就不能被称为开源项目。
根据这个逻辑,一些专家认为,Meta 和谷歌的免费大模型(任何人都可以检查和调整)并不是真正的开源,因为“许可证限制了用户可以对模型做什么,而且训练数据集不公开”。
李彦宏的看法则是:“开源模型基本上是⼀堆参数,⼈们不知道这些参数是如何推导出来的,也⽆法更改这些参数,因此不会对世界各地的⼈产⽣影响,也不会让世界变得越来越好。”
事实上,有些模型的开源只是为了营销,一位专家讽刺的说:”将模型描述为开源可能会使它们被认为更值得信赖,即使研究人员无法独立调查它们是否真的是开源的。
但是,在这些争论成为公众话题前至少半年,李彦宏就有明确的观点:在商用层面,闭源是终局模式,因为闭源远比商业效率高。
简单说,免费的就是最贵的。
这就好像你去A店,免费送你一个车的底盘,但你得自己配车壳子、发动机和轮胎,还要让它们组装起来可以正常运转;而B店提供二手的整车,且因为经营规模大,单车价格能打下来,还提供服务和救援。
对于不是汽车机械师的99%的人来说,选择B店无疑才是符合需求的。对于AI应用创新企业来说,同样的道理是——企业不用也不该花钱去打磨大模型,应该把这部分资源投入到研发大模型的创新应用上来。
一个有趣的现象是,有时候李彦宏明知自己的观点还不是行业共识,但他还是愿意抛砖。
例如,在智能体方面。
百度也在智能体方面发力,李彦宏对于智能体的看好也由来已久,他认为——目前,搜索和大模型的结合,更多应该是在智能体上。
不过,李彦宏说对智能体的判断时,还说了一句“冷话”:“智能体现在还并不是一个行业的共识,只是百度下的一个赌注。”
这句话看似突兀,仔细深思,又觉得李彦宏有李彦宏的道理。
千行百业竞逐智能体,但真正有几家公司真懂智能体?是真的为了成就智能化而做智能体?
如果问的再尖锐一点,大部分企业对智能体的研发能投入能占到总研发经费的20%吗?10%?
恐怕一百家里没有一家。
这就跟我最近追的《小巷人家》这部剧的情节一样——庄家坚持要让一双儿女上高中、考大学的时候,大家嘴里都说“蛮好蛮好,大学生有前途”,但是一回头,还是安排自己的子女上技校、上中专,因为好就业。
等到一夜间情势变了,中专、技校不再包分配的时候,这时候大家才是真的意识到,庄家的决策做的太对了,自己在信息茧房里呆的太久,耽误了儿女的前程。
可以说,直到这一刻“共识”才形成,但绝大多数人都无法受益于这个共识,因为他们在“等”共识的时候,时机已经悄悄错过了。
历史从来不是由共识推动的,而是由先于共识形成时就做出独立判断的人推动的,共识只是尘埃落定后的结果。
03创始人模式的底层逻辑如果说以上关于卷应用、闭源、智能体的观点是显性的,那么,也必然也有解释这种方向感的隐性因素。
恰好,硅谷最近热议的“创始人模式”,似乎为我们寻找隐性的底层逻辑提供了线索。
这个定义,出自YC创始人Paul Graham的一篇文章。
它的核心观点很简单——相较于只通过下属掌控公司的职业经理人,亲力亲为的创始人更有利于一家大公司的发展。因为创始人具有三个职业经理人无法具有的特质——
创始人相当于公司的亲生父母;
可以完全决策如何作出改变;
知道如何重建公司;
说“亲力亲为”,是不过分的。仔细想想,和李彦宏同年龄段但还在一号位上的企业家,着实已经不多。
对于创始人模式的第一条,在十几年前,我曾经和李彦宏本人在一次出差期间,有一个短暂的交流。我问他为何在有些事上坚持亲力亲为,他的回答是:“因为你们中的任何人都有可能离开,但我必须留在这里与百度同生共死,无法离开。”
“创始人模式”中的第二条也适合于百度,那就是“可以完全(自主)决策做出改变”。
我们都知道,百度在自己的第二个10年,也就是移动互联网时代,发展的路径可谓是跌宕起伏,也错过了不少机会。
但是,在国内产业界没有任何企业看出AI的潜力(大部分人是在2016年也就是阿尔法狗战胜人类棋手时,才意识到AI的潜力)的2010年,百度就已经将NLP研发部门从各个业务线中独立出来,一面攻坚前沿技术,一面追求业务落地。
事实上是,早在2006年,百度就已经有员工自发的把人工智能技术用在产品的提升上。
换言之,百度提前十几年就开始走自己的AI之路,而且投入了非常高的研发经费,除了“创始人模式”之外,没有任何一种可能性能让一个企业开始这种高昂的、看似无边无际的远期投入。
第三,我们前面已经说过,李彦宏推动了百度所有产品“用AI重做一遍”,这与文中的观点三即——知道如何重建公司,可谓严丝合缝。
从微观角度,我不怀疑个人兴趣或性格影响了李彦宏对AI的执着;但从宏观角度,如此执着的追求,倒不如说AI是他的欲望、信仰和对未来的寄托。
《创始人模式》里有一句话说的很好——他们(创始人)所做的事情,使他们被许多人视为古怪,甚至更糟。但(你要)看看创始人已经取得的成就——他们是在逆风而行的情况下取得的这些成就。
已有的杯子装满小石块,向杯子里加点水,增加装满小石块的杯子重量
已有的杯子装满小石块,可以向杯子里加点水,增加装满小石块的杯子重量