【潮汐商业评论/原创】
最近,人工智能领域现象级产品ChatGPT在海内外引发热议,掀起一阵全球科技竞速赛。百度将在3月16日围绕其生成式AI产品、大语言模型“文心一言”召开新闻发布会,消息一出就引起了业界人士的广泛关注。这意味着百度有机会成为全球第一个做出类ChatGPT的大语言模型的科技大厂。有外媒评价称,中国的百度已将自己投入到全球商业化竞赛中,这场关于生成式AI这样的下一代人工智能技术将会给互联网带来重大变革。
1、多年AI沉淀,百度厚积薄发文心一言由最新大语言模型(LLM)提供支持,是百度的生成式AI产品。虽然今年百度才对外宣布开发类ChatGPT产品文心一言,但这对于百度来说并不是从零开始,更不是突击了一两个月做出来的。
百度的文心大模型和OpenAI的GPT模型类似,早在2019年就已推出,且经过了多次的迭代了,从刚开始单一的自然语言理解延伸到目前的多模态,包括视觉、文档、文图、语音等多模态多功能,因此“文心一言”所基于的ERNIE系列模型也已经具备较强泛化能力和性能。
百度是全球为数不多、进行全栈布局的人工智能公司,进入人工智能时代之前,IT的技术栈一般可以分三层,底层的芯片,中间的操作系统和上层的应用。进入人工智能时代之后,百度的技术栈变成四层,分为芯片层、框架层、模型层和应用层。
从这个节点上我们去看,不管是美国还是中国,全球范围内能够在四层都有较强布局的公司是寥寥无几。
具备四层全栈能力的好处是可以实现端到端优化,大幅提升效率。针对一些特定场景,四层之间互相可以有较多反馈,做到极致的优化。像在搜索场景,百度的芯片在百度的搜索上已经优化了十年,所以今天百度AI芯片,在搜索场景上,就是全球效率最高的。
而即将发布的文心一言是基于百度自主研发的产业级知识增强大模型,全景图由模型层、工具与平台层、产品与社区层构成。在模型层,文心大模型已经包括36个大模型,涵盖基础大模型、任务大模型、行业大模型的三级体系,全面满足产业应用需求,构建了业界规模最大的产业大模型体系;在工具与平台层,通过大模型开发套件、文心API和提供全流程开箱即用大模型能力的EasyDL和BML开发平台,全方位降低应用门槛;产品与社区层,包括AI艺术与辅助创作平台“文心一格”、产业级搜索系统“文心百中”和旸谷社区,让更多人零距离感受到最先进的AI大模型技术带来的新体验。2023年2月IDC发布《2022中国大模型发展白皮书》显示,百度文心大模型处于行业第一梯队,产品能力、应用能力、生态能力全面领先。
2、AI市场最佳代表,百度位居浪潮之巅OpenAI、微软想通过ChatGPT实现商业化落地,而他们的主要市场在英文场景,所以他们为英语优化是合理的。相反,百度并不试图占领英语市场,作为中文自然语言处理起家的百度,必定会针对中文市场进行优化。
李彦宏也公开表示,百度的文心大模型是中国市场非常本土化的大模型,这意味着百度现在正在研发的文心一言,将比国外开发的模型更适合中国。其先进性不仅体现为对中文语言的理解,还体现为对中国文化的理解。
按照百度的规划,文心一言会率先落地在百度搜索。李彦宏也曾表示,文心一言将重塑信息的生成和呈现方式,推动搜索体验的代际变革,并作用于百度移动生态服务场景与市场规模的扩大。一方面带来更好的搜索和答案,另一方面用户能直接与大语言模型交互,这将是对传统搜索体验的补充、升级,有机会形成新的流量入口,吸引更多用户,并获得市场份额,同时赋能平台广告商、内容创作者和商家。
此外,文心一言将通过百度智能云对外提供服务,这将是百度“云智一体”战略的里程碑,也意味着云市场游戏规则的根本性改变。
云服务从数字时代跃迁至智能时代,之前选择云厂商更多看算力、存储等基础云服务,未来,更多会看框架好不好、模型好不好,以及模型、框架、芯片、应用之间的协同。与此同时,文心一言还将与小度进行集成,升级小度智能设备和服务。
在马太效应愈发凸显的当下,科技竞赛本身就是快鱼吃慢鱼,谁先卡位谁是赢家。所以从某种程度上来说,中国一定要有自己的ChatGPT,哪怕初期阶段无法做到完美无缺,但若能达到ChatGPT去年问世的水平就实属难得了。毕竟作为中国企业的唯一代表,能在此时第一个站在全球技术竞赛的“奥运赛场”上,“上场”这个行动本身就是一种胜利。
况且只要文心一言对外发布,数据、query闭环起来后,早上线一个月都意义非凡,且拥有巨大优势。同时,随着真实的用户、开发者调用和模型迭代之间的飞轮开始转动,大量训练会快速积累经验,系统会显著提升,初期的不完美也会被不断迭代。