1998年,第七届万维网大会在澳大利亚举行,李彦宏作为嘉宾做了How to find spam in web search的主题演讲。30岁的他是那届大会上的明星。
台下的茫茫听众中有两个人,拉里·佩奇(Larry Page)和谢尔盖·布林(Sergey Brin),他们等着向李彦宏请教。一年前,李彦宏就已经拿下“超链分析”的专利,成了搜索技术的大佬。
三人在澳大利亚短暂相逢,很快分别,各赴前程。美国硅谷互联网创业热火朝天,李彦宏兴起,写了本《硅谷商战》,越写越兴奋,回国创立了百度。佩奇也不上学了,四处借钱,租住在一个车库,和布林一起创立了Google。
大幕已经拉开,属于他们的时代到来了。风云际会,接下来的岁月里,他们多次在搜索、AI、自动驾驶赛道上相遇。算起来,距离他们第一次握手已经有26年了。
搜索是他们之间的第一场战争,但不算李彦宏与佩奇的直接交手。Google股东嫌佩奇年轻,请来了职业经理人施密特,2001年至2011年施密特任谷歌CEO,2005年Google请来李开复大举进军中国,5年后兵败退出了中国。
AI、自动驾驶这两场战争才刚刚开始,佩奇再次缺位:11月13日,谷歌公告称,佩奇将不再担任谷歌母公司Alphabet 董事长,由斯坦福大学前校长亨尼斯接替。早在2019年,佩奇就辞任了Alphabet CEO,由皮查伊接任。
佩奇早在2019年之后就很少负责公司具体业务了,由同时担任谷歌董事长及CEO的皮查伊负责。只是谁都知道,佩奇是谷歌的大股东,有控制董事会的能力,谷歌所有战略方面的重大决策都由佩奇决定,是谷歌的灵魂,比如AI与自动驾驶。
11月12日百度世界2024大会在上海举办,李彦宏发表了主题为《应用来了》的演讲,宣布“过去24个月,这个行业最大的变化是大模型基本消除了幻觉,回答问题的准确性大幅提升。”
李彦宏在演讲中透露: 文心大模型日调用量达15亿,是过去18个月中国大模型应用爆发缩影。在自动驾驶领域,萝卜快跑已经在北京、长沙、上海、重庆等地落地服务。10月10日有媒体报道,萝卜快跑将在香港落地,但没有百度官方的回应。
敢说“大模型基本消除了幻觉”,百度是全球第一家公司,自动驾驶在具体应用场景中落地,百度还是第一家。但还不能说百度已经赢得了战争,正如前文所说,战争才刚刚开始。
百度与谷歌的竞争一直在进行,一次又一次,李彦宏与佩奇失去面对面的机会,但他们又是真正的“一生之敌”,在百度和谷歌,他们是战略的制定者和发起者。他们谁也没有打败谁,而是互为镜像,彼此印证,相互成就。
他们都是战略家,以终为始,是战略家分析事情的逻辑:信息面前人人平等,是他们看待搜索的逻辑。如何看待AI?2024年百度世界大会,李彦宏给出了逻辑:“AI会让复杂的世界变得简单。”
1
AI去幻觉:大模型这事儿“成了”
2022年11月,OpenAI发布GPT 3.5,大模型风暴席卷全球。两年过去了,越来越多的人开始质疑:过去两年全球性的大模型狂热,是一场新的技术革命,还是一轮新的泡沫?期待中的超级应用没有出现,更加剧了这一质疑。
2024年5月,文心大模型API日均调用量达到2亿。李彦宏在百度内部与高管们讨论大模型的未来,讨论怎么就叫大模型“成了”。李彦宏的标准是:如果日均API的调用量,一年之内能够涨10倍,从2亿涨到20亿,大模型就“成了”。
时间仅仅过去半年,文心大模型日均调用量已经超过15亿,半年增长7.5倍。从9月份开始,文心大模型日均调用量进入了一条非常陡峭的增长曲线。基于这些数据和增长趋势,李彦宏说:大模型这事儿“成了”。
为什么文心大模型从9月份开始进入了非常陡峭的增长曲线?根本原因是大模型消除了“幻觉”:AI从一本正经地胡说八道,变得可用,可被信赖。如果大模型总是一本正经地胡说八道,就不会有人相信,也不会有应用。
大模型是如何消除“幻觉”的?是RAG(Retrieval-augmented Generation)技术的应用,采用了RAG技术后,大模型就会利用检索得到的信息主导文本或者答案的生成,从而极大地提高了内容的质量和准确性。
百度的主业是搜索,RAG技术全球领先。2023年3月份,李彦宏公开表示,百度大模型的特色是知识增强、检索增强。到今天,RAG不仅是百度的特色,也逐步成为了行业的共识。
今天大多数大模型在文字层面已经和RAG结合很好了,但图像、视频等多模态内容和RAG结合还不够,生成的图片、视频仍然“一眼假”,充满了机器味。
今年2月,OpenAI发布文生视频大模型Sora,整个中文互联网捶胸顿足,一遍哀嚎:中美大模型的竞赛中,中国又被美国同行远远甩到了身后。百度不服气,决定来解决这个问题。
百度开发了一项新技术iRAG(image base RAG),检索增强的文生图技术,百度iRAG就是把百度搜索的亿级的图片资源跟强大的基础模型能力进行结合,这样就可以生成各种超真实的图片,去掉了机器味。
百度世界2024大会现场,李彦宏现场演示了文心大模型生成的爱因斯坦打卡、大众揽巡汽车飞越长城等图片,不止内容符合逻辑,同时图像生动、逼真,爱因斯坦在故宫、鸟巢、长城、悉尼歌剧院等场景自由切换。
百度在AI上领先是有原因的,百度的主业是搜索,搜索的本质是人工智能,拥有语音识别能力、图像识别能力、自然语言理解能力,为用户画像的能力,这些都是人的最本质的智慧能力。计算机拥有了人的这些能力时,就是人工智能。
只有搜索还不行,还得有远见。在2013年1月李彦宏在百度年会上宣布了IDL(深度学习研究院)的成立,这是全球企业界第一家用深度学习来命名的研究院。李彦宏自任院长,方便集中资源致力深度学习研究。
2014年,百度第一次披露“百度大脑”,外界并没有当回事。2016年乌镇世界互联网大会上百度“第一次向外界系统介绍百度大脑”,外界才得知它已经和超过3万家企业展开合作。
在AI这条路上,李彦宏与佩奇又一次狭路相逢。2012年为了争夺诺奖得主辛顿(Hinton)和他的两学生,Ilya和Alex,百度、谷歌、微软三家公司竞价,微软最先退出,百度最后出价为4400万美元。众所周知的是,辛顿后来选择了谷歌。
因为在深度学习领域的杰出贡献,2018年辛顿获得了图灵奖,2024年获得诺贝尔物理学奖。
2023年辛顿离开了谷歌,此时的AI已经展现出堪比工业革命的巨大可能性,当年为了竞得辛顿的三家公司成了这轮AI竞赛中实力最强的公司。
2
群星闪耀:智能体无所不能
“我父亲去世前我录了很多他的声音,拍了很多他的照片,那个时候我就有一个想法,有一天能够把这些资料都聚集起来,能够按照他的思维逻辑来推理一些事情,当我想跟他聊聊天的时候,我还能得到一些反应。”
李彦宏的父亲于2017年去世了,以前他很少做梦,但他父亲去世不到一年里,他就梦到父亲至少五、六次。李彦宏需要一个产品,一个人可以在数字世界复活、永生的产品,简单说就是“数字人”。今天已经出现了这样的产品,它们叫“智能体”。
目前在文心智能体平台上已经吸引了15万家企业和80多万名的开发者参与,百度按智能体的分发量,对话轮次,用户喜爱程度等指标遴选出来了Top100智能体,其中包括农业院士、法行宝、自由画布等爆款智能体。
百度网还邀请英伟达作为技术合作伙伴,共同发起了智能体创新大赛,大赛共吸引了近万名参与者,总计提交了近 4000 智能体,涌现出了不少非常有价值的智能体。
按照适用对象、特点的不同,百度将智能体分为四种不同类型,包括公司类的智能体、角色类的智能体、工具类的智能体和行业内智能体。
公司类智能体相当于AI时代的公司官网,传统官网具有的能力,如公司介绍,产品图片参数的展示,线下门店的位置等,公司类的智能体都有,传统网站没有的主动推荐、及时响应、一对一的服务能力等,公司智能体也有。
目前比亚迪、沙宣、洋河等行业头部企业都与百度合作拥有了官方智能体。基于传统的搜索业务,百度拥有海量客户资源,公司类智能体市场空间巨大。
角色智能体就是“数字人”,数字人有自己的人设,有自己的知识库,这些都是典型的智能体的基本要素。基于iRAG技术,智能体和多模态进行有效结合的时候,就变成了一个有形象有动作,并且动作跟语言完美匹配的“数字人”。
以前的数字人缺点肉眼可见,说话的声音,肢体的动作以及口型都非常机械呆板,在大模型的加持之下,数字人逐渐变成了高度拟人化的智能体,更聪明、有情感、有态度,可能是教育辅导老师、留学顾问、心理咨询师、私人健身教练等。
大模型加持,基于大量的数据积累,直播互动的规律的提炼总结,今天的数字人甚至“以数乱真”,比如用于直播电商,直播在很多情况下的转化率已经超越了真人。值得一提的是,基于数字直播,百度推出了电商业务百度优选。
工具类智能体目前是个热门赛道,比如AI写作、设计助手、logo生成器等等。2024百度世界大会上,百度推出了百度文库和百度网盘联合开发的全新工具类智能体“自由画布”,从现场展示效果看,写研究报告就跟资深行业分析师一样。
行业智能体针对垂类行业,如法律、医疗、健康、金融、体育、旅行等,目前在这些行业,都涌现了很多很有用的智能。比如法律行业的“法行宝”,在百度的平台上已经回答了超过1660万个问题。
李彦宏认为:智能体就像PC时代的网站,移动时代的自媒体账号,不过智能体更像人、更智能,就象公司的销售、客服、助理一样,是AI原生时代内容、信息和服务的载体。
基于iRAG技术,基础模型的能力就绪,人类即将迎来一个AI应用的群星闪耀时刻,每一个应用都是一颗星,每个应用都将成为改变世界的力量。
从2013年百度筹备IDL算起,百度在AI这条道路上已经走了11年。有战略,还得有定力,放眼全球,百度都是最早进入AI领域并且坚持下来的公司。
李彦宏做事情的这份定力跟父亲有关,父亲对李彦宏说过一句话:三军可夺帅也,匹夫不可夺志也,认准了就去做,不跟风不动摇。
3
心想事成:人人都是程序员
有了弓箭人人都能成为猎人,有了铁器人人都能成为农民或战士,有了蒸汽机人人都能成为神奇造物的工人,有了AI呢?人人都能成为程序员,我们正在进入人人都是程序员的时代。
在2024百度世界大会上李彦宏带来了“one more thing”,一个新物种“秒哒”。秒哒有让一行代码都看不懂的人具备程序员的能力,有让任何一个想法都能够迅速的低成本的变成现实的能力。秒哒将于2025年一季度正式发布。
有了秒哒,人类将进入一个“心想事成”的时代:一个只靠想法就能赚钱的时代。这是前所未有的,以前有了想法还要去执行,把想法做出来。
“秒哒”是一个不需要写代码就能够实现任意想法的软件,一个由大模型和智能体组成的全新的软件。这是迄今为止人类历史上最复杂的多智能体协作工具,它包括无代码的编程、多智能体的协作,以及规模化的调用各种工具的能力。
“秒哒”与辅助代码生成工具是有本质区别的,根本不需要看得懂代码。
2024百度世界大会上演示了一个案例:萝卜快跑要开一个新技术发布会,需要打造一个活动邀请系统,把邀请函分享给其他人,并且收集他们的想法和反馈。
在策划智能体、小编智能体、程序员智能体、质检员智能体的协作下,只用了大概三分钟时间,可以说是立等可取,用户不需要写一行代码,这个活动邀请系统就完成了。按照传统编程模式,这样的系统的几人小组,花上几周才能完成。
“秒哒”有三个能力,一是无代码编程,二是多智能体的协作,三是多个工具的调用,每个能力背后都是百度的技术在做支撑:
无代码编程,是由大模型直接生成代码,不需要人写一行代码,所以门槛就大大降低了,人人可上手;
多智能体协作,是基于文心大模型思考、规划等能力,实现对不同类型智能体的调度、编排,活动邀请系统的开发任务中一共有5个智能体协作完成;
多工具调用,这里包含网页检索、iRAG、地图API等各类工具。
这公司不需要去招募项目经理、设计人员、开发人员、测试人员等,老板自己就可以指挥多个智能体来协同完成任务。“秒哒”将对未来的商业世界产生颠覆性影响。
“只靠想法就能赚钱”,这是AI之所以被称为堪比产业革命的机会,因为它对社会经济带来了生产力的无限的扩张,让每一个人都具备程序员的能力,会说话就能做出应用,人类的工作效率将得到前所未有的提升。
4
百万超级应用:从“信息平等”到“AI让世界更简单”
李彦宏在1987年考入北京大学,专业是信息管理。选择信息管理专业的原因很简单,人与人之间的不平等是由信息获取的不平等造成的。他想解决这个问题。
在美国布法罗纽约州立大学读计算机科学硕士的时候,教授问了他一个问题,你们中国有电脑吗?教授不了解中国,是因为信息鸿沟。他想填平这个鸿沟。
在纪录片《二十度》中,据李彦宏回忆:这是一个商机,没有信息,正是创造信息的好机会,信息不平等,正是实现信息平等的机会。
百度诞生的故事与阿里巴巴诞生的故事类似:1995年,马云去西雅图出差,这辈子第一次用电脑,输入beer,显示了一堆啤酒,输入China,显示“no data”。马云觉得机会来了,结果创立了阿里巴巴。
那是一个英雄辈出的时代。李彦宏毕业之后从事的正是与兴趣相关的工作,先后担任道·琼斯公司高级顾问,《华尔街日报》网络版实时金融信息系统设计者,Infoseek公司资深工程师,还获得了“超链分析”技术专利。
百度的理想、百度的使命是什么?2006年第一届百度世界大会举办,李彦宏的答案是“让人们平等便捷的获取信息达到所求。”2017年百度世界大会,他的答案是“百度希望用人工智能的技术把复杂的世界变得更简单。”
除了智能体外,在百度智能云的千帆大模型平台上,已累计帮助用户精调了3.3万个大模型,开发出了77万个企业应用。百度智能云拥有中国最大的大模型产业落地规模,一半以上的央国企以及很多民营企业都在联合百度进行AI创新。
百度的实力从最有说服力的专利技术可见一斑。中国人工智能专利申请量排名中,百度以5712件位列第一,语音识别领域远超、三星加微软,竞争最激烈的自动驾驶领域,专利数超过了其他车企总和。
财富杂志曾评选出全球人工智能4强,百度、谷歌、Facebook和微软入选,这样的结果并不是运气,每年15%的研发投入,这在全球大型互联网公司中都是领先的。
在移动互联网时代,人类预测未来时,认为未来是一个智能终端爆发的时代。软银创始人孙正义就曾经说过,未来每个人将对应数百个、数千个智能设备。事实上目前每个人已经对应数台,甚至十多台智能设备。
人们越来越感受到设备太多的麻烦,对每一个人来说,管理设备的数量的能力是有边界的,设备太多,人类就成了设备的囚徒。
智能体/数字人将把人类从智能硬件的奴役中解放出来,他们召之即来,挥之即去,无影无踪,却又无时无处不在,不会对个人的管理能力形成挑战。
现在地球上有80亿人,未来每一个人同一时间都有十个、百个数字人围绕服务。未来会有多少数字人?可能超过千亿、万亿,甚至更多。
针对“没有出现超级应用”的质疑,李彦宏的答案是:百度不是要推出一个超级应用,而是要不断的帮助更多人、更多的企业打造出来数以百万级的超级有用的应用。这一判断的逻辑正是“AI让世界更简单”。