百度王海峰和他的“深度学习+”

胡说成理 2023-01-15 11:22:38

1月10日,百度Create AI开发者大会于线上召开。期间,百度CTO王海峰发表了《“深度学习+”,创新发展新引擎》主题演讲,提出人工智能的技术创新和产业发展,进入“深度学习+”阶段。

这个新概念“深度学习+”,引发了行业的关注和讨论,有人认为这是“互联网+”之后的又一次生产力革命,也有人认为这将极大的推动深度学习的普及。

那么,不吹不黑,让我们看看“深度学习+”在当前可否推广普及成为数字化转型新动能的主要范式。

1

时来天地皆同力

较近期的统计数据显示,全球47个主要国家数字经济增加值规模达到38.1万亿美元,占GDP的45%。其中,中国数字经济规模达到7.1万亿美元,占47个国家总量的18%以上,位居世界第二,成为全球唯一能和美国竞争的数字技术创新策源地。同样没有争议的全球共识是,人工智能将是第四次工业革命的核心。但长期以来,对于人工智能究竟依照什么路径来在第四次工业革命中发挥核心作用,整个产业界的格局不够、讨论不充分、意见不一致。而2023年1月10日举行的百度Create AI开发者大会,可谓是点出了整个问题的“题眼”,出场的李彦宏、王海峰等百度高管从不同角度提出了一个新的议题,即在人工智能推动第四次工业革命的浪潮中,深度学习相关技术将成为 “领潮人”,而“深度学习+”则将成为这一技术落地的主范式。在今天推动“深度学习+”,有更好的时代背景和条件。从宏观角度来讲,2023年是经历疫情三年后的转折之年,最高层已经在多个场合释放强烈信号,把2023年定为中国经济恢复增长的关键之年,并且释放了大量积极政策红利。其中,新基建和科技创新定为重中之重,而深度学习作为人工智能中的“显学”,将得到前所未有的应用推广。从技术体系来讲,仅就王海峰的履历来说,如今距离他从2013年上半年作为执行负责人协助创建百度深度学习研究院(IDL)有10年之久。百度在人工智能方面的研发投资已过千亿。再看百度Create 2022大会,可以说“深度学习”是一个绝对的主题。而且,绝非标语口号。王海峰对“深度学习+”进行了三个维度的展开,分别从技术、生态、产业三个角度解释了“深度学习+”。当然,不得不承认,中国的人工智能经历了十几年的导入期,在技术普及、深度学习框架、大模型、行业典型应用、人才培养方面都有充足的储备,但有一个普遍性问题没有解决,那就是人工智能在千行百业中的大规模商业化落地,迟迟没有找到经典范式和可以迅速推广的商业模式。所以选在这个时点提出“深度学习+”,王海峰并不仅仅是替百度发声这么简单,而是抓住了一个难得的天时地利人和的机会,所谓”时来天地皆同力“,他希望替整个深度学习领域甚至是人工智能领域的大规模落地,找到一个突破点,可谓用心良苦。

2

深度学习落地之难

有人问笔者,为何王海峰提出的是“深度学习+”而不是“人工智能+”。在笔者看来,是因为深度学习是目前人工智能中最主流的流派,有大量的研发成果和技术储备,是AI领域”全村的希望“,是打开局面的突破口。

而用王海峰自己的话来说,就是以人工智能为重要驱动力的第四次工业革命,深度学习是其关键核心技术,具有很强的通用性,呈现出标准化、自动化、模块化的工业大生产特征,推动人工智能进入工业大生产阶段。

王海峰还做了更细致的分析——一方面,深度学习+知识,标志性事物是大模型,而百度的文心大模型不但进一步增强了人工智能的通用性,成为AI开发和应用的新基座,而且也宣告了跨模态、统一大模型向着通用人工智能迈进;另一方面,深度学习平台的标准化、自动化和模块化特征越来越显著,不断降低人工智能的应用门槛,规模化的AI大生产落地已然形成成熟的条件。

不过,事实也说明,“深度学习+”落地条件成熟,但行业的现状是错综复杂、冰碳同炉。从目前看来,无论是百度、华为这样的头部前沿企业,还是人工智能“四小龙”以及一大批人工智能企业,以及海外的人工智能领域,都存在“一面火热一面冰冷”的局面。一面火热,是人工智能的热度不断提升。笔者访问过的多位AI从业者,都提到2016年的AlphaGo大战李世石对自己的深刻影响,很多AI人也是从此入行。在社会领域,人们对人工智能也十分钟爱,从早期的智能音箱,到智能(无人)驾驶,到虚拟人、元宇宙,以及最近火爆的ChatGPT、AI作画等等,都是人们高度关注的黑科技,人工智能有了一大批忠实的拥趸。一面冰冷,是不管中国还是美国,不管是巨头企业还是创新公司,在深度学习的商业化落地方面,都没有探索出一条通途大道。如果仅仅从财务角度来讲,很多深度学习的企业研发投资和营收预期的比例,已经到了危险的程度。所以这时候提出“深度学习+”,有着极其迫切的现实意义。其实,王海峰提出的深度学习+,包含三个维度,分别是深度学习+知识、深度学习+生态,以及深度学习+千行百业。深度学习+知识,前面已经说过;而深度学习+生态,解决了深度学习源头企业和服务对象之间具体的工程建设服务能力问题。简单说,百度作为深度学习源头企业,主要任务不是服务单一项目、单一企业,而是提升中国深度学习的整体水平,并下放到生态中,通过生态传导而进入千行百业。但真正的困难是,为什么深度学习在千行百业的落地那么难?笔者为此访问了多位不同行业的AI负责人,他们的共同特征是,绝大多数是企业中层,身在研发一线,对深度学习充满信心和热情,也为深度学习在行业里落地速度太慢感到焦虑。最后,我们一起总结了深度学习落地的4大难关:第一关,也是最难的一关,是企业的最高层对深度学习的相对陌生,对深度学习产生效益充满不确定性感。要知道,能推动深度学习落地的,从来不是企业的CTO或者CIO,而一定是企业的最高负责人。如果最高负责人对于深度学习没有认知、感知和信赖,一个企业就很难自上而下的形成合力,在内部掀起一次学习和应用深度学习的高潮。第二关,深度学习技术与行业场景的适配性应用。虽然深度学习平台+大模型可以解决一部分深度学习能力向具体行业泛化的问题,但如果没有对这个行业的痛点真正了解的“明白人”,由通用人工智能企业开发出的深度学习模型,并不能很快的应用于真实的行业场景,往往需要复杂的二次开发、三次开发,而这对于深度学习企业和应用单位来说,都是时间、资源、精力上的巨大考验。第三关,深度学习的人才培养机制和需求之间还存在着广泛的不适配。有的企业规模很宏大,但研发和应用分离,真正的终端用户反而因为架构、成本问题无法配置真正的AI关键人才,而这些恰好是最接近痛点的岗位。第四关,传统企业获取IT服务一般有三个阶段,第一个是咨询阶段,第二个是寻找总包商,第三阶段是分包供应商入场干活,这套体系在传统IT领域已经非常成熟,但深度学习乃至整个AI领域在这方面的建设还处于很早期的阶段,这也就是王海峰重点提“深度学习+生态”的背景。由于以上种种困难,深度学习叫好不叫座的现象十分普遍。那么,我们为何相信“深度学习+”必然取得成功呢?

3

“深度学习+”成功的关键是什么?

在这一节,笔者释放一个比较个人的观点——王海峰笃定“深度学习+”能够成功,主要源自百度及他这十余年的专注努力。简单说,在这十多年里,以百度为代表的企业,以王海峰为代表的中国AI科学家,持续推动深度学习形成了产业链,并不断完善和壮大。其中关键的两环是——第一,产业链初见规模——深度学习框架平台和大模型贯通了从硬件适配、模型训练、推理部署,到场景应用的全产业链,为人工智能技术创新和产业增长夯实了智能化基座;第二,手中有“利器”,特别是集核心框架、产业级模型库、开发套件、工具组件和服务平台于一体的飞桨深度学习平台。飞桨平台已经凝聚535万开发者,服务20万家企事业单位,创建了67万个模型。所以,“深度学习+”不仅仅是一个技术口号,更是一个体系建设的呼吁,也是一个我们经济深层动能变化的新方向。首先,“深度学习+”这个提法,不仅是一个技术概念,也是一个管理概念。它的独特之处在于,初步捋顺了深度学习推广中的主体和客体的关系问题。“深度学习+”的结构,初步消弭了赋能过程中的主客体博弈的关系,有一份躬身入局的谦虚和务实,有一份甘当助手的平和,也有一份分担责任与担当的坦率,如果经营得当,这是一个和“互联网+”一样具有长期生命力的概念,也是王海峰超越其技术成就对行业的更大贡献。其次,也是非常关键的是,中国是深度学习发挥作用的良好场景,中国的产业体系品类齐全、体量庞大,使得深度学习驱动的创新有丰富的应用场景,也就是有“用武之地”。场景越多,需求越多,就越有助于形成良性循环,促进底层技术突破,加快升级现代化产业体系。最后,深度学习已经有出色的社会实践,例如百度在智能交通领域,已经落户全国50多个地区,通过自动驾驶、车路协同、绿色减排等多点驱动,逐步实现了全局感知、全域协同,进而实现对整个区域交通流量的全局调控,最大限度减缓道路拥堵,节省出行时间。当然,“深度学习+”要发挥作用,还要做很多很多的工作:——例如,类似于石油勘探、航空、海洋等行业,属于“传统的高科技行业”,其对外引入的技术密度大、跨年度时间长、复杂性高,对此,通用AI企业很难短期摸清痛点,需要有深入行业多年,搞“伴随式开发”,“板凳一坐十年冷“的研发精神。——又例如,人才培养问题。这些年,深度学习头部企业在高、中、低多个层面,与知名机构、企业合作培养人才的开支已经是一个天文数字,也培养出了百万规模的人才梯队。但事实上,很多企业的负责人都认为,未来长期的发展,还是需要自己企业内部的深度学习技术团队去掌握相应的AI技术,无论这些人是先学行业知识,后学AI,还是先学AI,后熟悉行业,但“关键人才要掌握在自己手里”。所以,百度如何一方面生态化的推进“深度学习+”,又帮助(而不是替代)用户提升其自身AI团队的整体水准,这里面也要长期摸索规律。此外,互联网+提出还不到10年,中国还有很多行业没有完成数字化转型,而深度学习是需要在已经有一定数字化底座的基础上发挥价值的。从这个角度看,“深度学习+”可以跟更基础的数字化转型服务(譬如云计算结合),像百度的“云智一体”就是很好的概念。在企业服务市场,云属于底层架构,是陆军,“深度学习+”是空军。如果没有陆军打开一片天地,建立各种“机场”和“地勤”设施,空军是很难着陆的。说了这么多,笔者还是非常看好“深度学习+”的,用美国科学哲学家托马斯·塞缪尔·库恩的《科学革命的结构》一书的观点来看,任何一个社会阶段,都有一个社会发展的科技“主范式”,这个主范式必须成为这个社会的最大共识,才能充分发挥作用。我想,现在已经不会有人怀疑深度学习乃至人工智能是移动互联网的下一个世代的社会发展主范式,不会怀疑数字化社会的下一步一定是智能经济社会。真正的问题在于,如何在科技界的共识已经达成的前提下,深度学习企业与应用行业之间形成“深度学习+”的价值、潜力、成功率的共识,形成合作方式与人才培养机制的共识,只有广泛的共识,才能让深度学习不是徘徊在千行百业之外的“游侠”,而真正成为干一行就升级改造一行的新基建的核心动能。

0 阅读:7

胡说成理

简介:关于智能时代和智能时代的生意逻辑的小天地。