导语:本文和其它类似文章的区别在于,基于一手事实而非推测得出结论。
1
水煮鱼
这几天,北京市率先发布政策,支持“类ChatGPT产业”发展,可以认为是官方层面对这一技术方向的认可。那么问题来了,国内目前拥有类似ChatGPT的技术的企业里,到底谁最强?其实,这个问题的答案,很容易寻找。就跟你问我,北京哪一家水煮鱼做的最好?我给你的答案肯定是,你看谁家门口排队的最长、停的车最多的,就是水煮鱼做的最好的。目前,玩得起ChatGPT的一线玩家,主要还是BAT和字节跳动这样的互联网巨头。单纯的AI企业,目前可能还处于有心无力的阶段,这主要是ChatGPT的特点——大模型、大算力、大数据,决定了其一定是少之又少的头部企业才能烧的起,其他AI企业根本没有足够的资源跟进。现在,国内企业都在卡位争取首发类ChatGPT的服务,但绝大多数企业在这方面的人才储备明显不足。所以,只要看这些企业集体去哪里挖人,就大致可以推断出谁的水平更高。而笔者得到的准确消息是,目前所有有资格玩ChatGPT的企业,包括A和T,都把挖人目标锁定到了一家企业身上,这家企业就是百度。没错,还是百度。而且,根据笔者掌握的情况,这轮挖人基本没有猎头公司什么事,或者说猎头公司基本上发挥不了什么作用。因为,他们想从百度挖走的可不是几个算法工程师。挖人的起点,至少瞄准都是高级别的技术专家、部门负责人这些,甚至有企业希望能把百度在大模型方面的团队成建制的挖走。所以,这轮挖人的主力,大部分是资深投资人。毕竟,投资人的身份适合游走于各个企业之间,而且,投资人也有随时往自己的夹带里储备高级人才的习惯。百度,当然也是对此严阵以待。毕竟可想而知,AT等企业能开出来的条件,一定极为丰厚。所以,百度还要用另一种方法留住人才,这种方法叫“希望”,也可以叫“梦想”。你可以走,你可以在另一个团队里重新起步……但如果你希望亲手做出中国第一的ChatGPT应用么?那你就别走,就在百度。这就是百度能成建制的留住人才最有利的条件——我离成功最近,我有技术信仰。另外,一个可以从侧面佐证百度在类GPT大模型方面在国内遥遥领先的,还有百度对外公布的消息。目前,百度是唯一给出类似产品(文心一言)预期上线时间的公司,而你细品品其它公司发布的信息,虽然有的公司有路线图,但在时间线上都相当模糊,这已经很说明问题了——底气不足所致。2
点对科技树
当然,挖人和官宣都是侧面的佐证,笔者敢说百度在该领域里面跑在国内最领先,肯定是有些更直接的证言的,下面就披露一些目前国内还没有公开的信息。根据笔者掌握的消息,去年年中,百度内部就做过深度的专项对标评估。这次评估的核心内容,就是百度大模型和OpenAI的GPT-3.0的优劣对比(当时还没有ChatGPT)。从笔者掌握的材料看,在一些关键指标上,百度是领先OpenAI的,百度对“文心”的竞争力,相当有信心。虽然肯定了GPT还是行业最前沿,但对“文心”的比较优势,也做了客观的对比。简而言之,这个汇报评估对百度决策层是相当提气的。由此可见,百度在这一领域事实上已经持续投入和积累了很长时间。我们可以这么理解,在国内AI大模型发展的多种路径中,百度 “文心”,是这一路径上走的最远,而且落地实践也最多、技术路径也经过验证的。上一次,百度这么说话,还是好多年前。还是百度刚开展AI研究不太久的时候,李彦宏曾经有一个发言,他说,我们把(深度学习)用在图像、语音等搜索中,发现一次取得的进步,比过去好多年加起来还要多。大家都知道,ChatGPT是GPT-3的进阶,或者按有些人的说法是GPT的3.5版本或分支。那么,从百度的这次内部评估对比透露出来的信息是——百度这一次点对了科技树。至少,是选对了在生成式人工智能这条路线上重点投入研发。也正因此,百度应该是国内企业中,和该领域的世界级水平最接近的,且几乎没有之一。对于重注押上AI的百度来说,这是一个战略级的好消息。但百度并没有着急对外公布这些细节,我的猜测是,百度对外的此类产品,还需要打磨。另一个版本的说法也来自内幕消息,说的是——即使没有ChatGPT的出现,百度大概率也会在今年做产品升级,而且很可能就是推出类似微软bing这样的模式,把整个检索系统变成检索+生成双模系统。笔者还要补充一个信息——其实百度的生成式搜索早就上线了,但没有做大的官宣。不过你多试几次就可以发现,百度对一些搜索的结果,已经从提供搜索的结果变成了提供问题的答案。不信,你可以搜索一下“特斯拉和比亚迪谁的利润高”、“北京和广州谁的GDP高”这样的问题,看看百度怎么回答的。另一个角度看,笔者相信,关心这件事的读者也会发现,随着微软搜索bing和ChatGPT的合体,ChatGPT的用户激增之后暴露的问题也越来越多。这说明,ChatGPT虽然已经展示了不凡的禀赋,但在忠实度、可信度、精准度方面还存在很多不足,这其中很重要的一个原因,是缺少垂直的领域知识,同时整个训练的数据量还不够大,使其虽然很好玩,但短期难以在真实应用层广泛落地开花。在如此多的用户公测下,ChatGPT不断暴露低级错误,这反而回归了科技发展的本质——因为作为一项人类创造的超级技术,它也要遵循一个不断自我完善的过程。在本尊都不断暴露出问题的情况下,想必,百度也对推出类似应用,抱有高度的谨慎,毕竟此前谷歌的打脸在前,2000亿的教训太深刻了。3
谁主沉浮?
如果你问我,中文互联网世界谁最有可能是ChatGPT的赢家,那我也坦率的告诉你,我还是认为是百度。有人也许会质问,谷歌不是在奋力直追openAI吗?如果谷歌能够反超,为什么在同样的赛道里,国内的巨头企业不能反超百度。其实,这个答案已经有了,谷歌和OpenAI在ChatGPT上差距最小的一天,就是ChatGPT发布的那一天。据瑞银集团的一份研究报告,ChatGPT 在推出仅仅两个月后就实现了 1 亿的月活跃用户数,成为史上用户增长最快的消费应用。在此之前,这一最短时长纪录由 TikTok 保持,其达成 1 亿月活用户,用了约 9 个月时间。而在2个月并拥有了1亿用户后,谷歌基本已经没有机会追赶上OpenAI了。为什么呢?也许你注意到这样一些现象:——谷歌成为全球搜索老大以后,就没有人在搜索上赢过谷歌,包括微软和苹果;——微信在成为中国即时通讯老大后,多少企业(包括字节和阿里)奋起直追,但也没有能超过微信;——百度占据中文搜索老大的位置快20年了,中间遇到过无数挑战,但为什么至今也没有人能挑战百度的位置;你可以举出很多理论,例如用户习惯、迁移成本、后发劣势等等,但我觉得都不如用两个概念解释来得准确,那就是Self-reinforcement effect(自增强效应)和飞轮效应。自增强效应,在心理学上、企业战略上和深度学习技术上,都各自有自己的对应特性,这是一个很神奇的词。而飞轮效应,大家可能更熟悉一些。骑过自行车的人都知道,为了让静止的轮子转起来,刚开始需要付出很大的努力,当飞轮转动起来达到临界点之后,就会越转越快,踩起来会越来越轻。所以,这两个效应联系起来,就产生这样一种趋势:根据自增强效应,百度在做这个业务之前,总会为自己确定一个标准,并以之判断和评定自己的行为结果与所立标准的差距,如果结果超过了标准,就会产生积极的自我评价,如果不断的收到的都是正反馈,从战略上的信心到执行上的坚决,就会越来越强。那么,与这种不断增强的信心和行动力相对应的是,百度如果率先拿出了合格线以上的水准的产品,就会第一时间收获海量的用户,加上百度本身就是中文搜索的绝对领先者,所以这些用户会快速增长,达到一个很高的水平,进而产生大量的用户数据和反馈。而百度就可以进一步利用这些反馈和数据不断优化自己的模型和服务,最终让飞轮高速的转起来,从而再次成为新一代搜索的绝对领先者。记得还是十几年前,我曾经问过李彦宏一个问题,我说,最有可能赶上谷歌(百度)的,是不是微软?李彦宏回答的原话是:搜索引擎不是谁最有钱谁就做的最好的,否则,这世间做搜索做的最好的,不就应该是微软么?我问这句话的时候,苹果还没有发布iPhone,微软是最有钱的IT公司。事实也证明了,如果不是微软用“钞能力”买下了部分OpenAI的股权,它在搜索市场上,就永远只是一个二流产品。李彦宏后来也很清楚的从自己的角度解释了这种为何“一旦领先 永远领先”的现象,他说:“好的应用一定和用户规模有关系,因为用户多,问题就暴露的多。而如果领先者先于其他企业解决了这些问题,那他就永远走在创新的前列。”这也就是自增强效应+飞轮效应的放大版。记得当时李彦宏还意犹未尽的说:“中国和美国的互联网发展也是一样,中国的网络用户多,遇到问题也多,如果中国企业能够先于美国企业解决一些问题,我们就可能在互联网创新上反超。“这句话,后来至少被部分证实了,比如我们前面说的Tik-tok,不就是一个很明显的例子么?由于自增强效应+飞轮效应的存在,后发企业很难用“蛮力”来解决赶超问题。对此,我还可以举一个例子。当年,360对百度在搜索引擎市场的份额十分觊觎。周鸿祎想出一招,说要在很短的时间里,抢掉百度20%的市场份额。这可是当时谷歌在中国都做不到的事情。但周鸿祎几乎做到了,360搜索一度飙升到接近20%的位置,让百度很紧张。这时候百度开了个内部会,他们要算一笔账,为什么360赶的这么猛?一算之后,他们发现,360之所以赶超的很猛,是因为360有很多外部流量资源,比如导航站、还有各种万恶的弹窗……周鸿祎把这上面所有的搜索位,都替换成了360搜索。所以一时间,360的搜索份额直线上升,逼近百度的警戒线。但这时候,百度反而不紧张了,因为根据他们计算的结果,有两个判断:第一,周鸿祎倾尽所有资源位,大概最多能上升到22%的市场份额,不会再高了;第二,由于这些搜索量都是用360搜索去强行替代百度搜索所产生的,所以它们的商业价值非常低、用户体验差、转化效率也非常低,成本却相当高。所以,360能坚持的时间不会超过3个月。事后果然如此,3个月后,360的攻势烟消云散。之所以在这里讲这个故事,还是为了说明,在超大规模、超大用户人群的互联网杀手级应用中,先发者的优势可以到何等惊人的程度。基本上,就是一旦领先,从此领先。要想超越,就要做一次代际更替的革命,这次ChatGPT完美的演绎了这种理论。目前,虽然百度遇到了方方面面的困难,但其在中文搜索领域的地位仍牢不可破,而ChatGPT的第一应用场景就是搜索。也就是说,虽然百度版的ChatGPT(也就是文心一言)和原版比起来,肯定有差距。或许是8分、或许是7分甚至6分。但这都不要紧,只要在及格线以上,并迅速和百度的搜索业务结合起来推出双模形式,百度的第一业务曲线就将重获新生。但事实上,除了搜索之外, “文心一言”如果能和百度的智能云服务结合起来,更将颠覆云服务的方式,会在内容和信息相关行业和场景找到更多的落地业务,这已经得到了公开的证实。而这既是百度正在打造的第二增长曲线,也是一个天花板更高的市场。你也许不喜欢百度,但是,10年投入1000亿在AI上的决心和行动,在中国,也只有百度做到了,何况人家还确实用战略远见点对了科技树。