【眼观】百度“文心一言”让我们看到中国生成式AI的未来

百度“文心一言”，欲打造中国版的ChatGPT

OpenAI前脚刚发布ChatGPT语言模型（GPT-3.5）的进阶版本GPT-4，百度后脚便发布了中国首个生成式AI 语言大模型“文心一言”，并展示了其在多模态、大语言模型方面的突出表现。

不同于ChatGPT上一个版本仅能处理文本信息，此次GPT-4和文心一言均选择了多模态作为其主要演示点。

较为遗憾的是，GPT-4仅演示了其在图片识别及代码生成网页方面的进化，对于视频、图片生成等方面，暂未看到其潜力；

而文心一言则展现的更为全面，除了对文本、图像的处理和反馈，还有视频的AI式生成（这点，其实我们早在百家号图文转视频的功能里，便看到了其大规模应用）。

而更令人惊喜的则是其在文学创作、商业文案创作、数理推算、中文理解等维度的表现，不禁让人有种强人工智能（一种类似于人类级别的人工智能，在各方面都能和人类比肩，人类能干的脑力活它都能干）时代已经来临的恍惚感。

两场发布会仅相隔一天，因此不可能说谁抄谁，而只能说双方都想到了一起，对生成式AI的未来达成了基本共识，即多模态一定会是未来的演进方向。

自上一代基于GPT-3.5的ChatGPT惊艳亮相以来，关于生成式AI的讨论便此起彼伏。普通人害怕AI的强大，而商业界却狂欢于新风口的到来。看到ChatGPT的威胁，高调宣布加速布局的企业也不在少数。其中，谷歌快马加鞭，短短几个月便迎头赶上，推出类ChatGPT产品，但从实际反馈看，体验效果似乎并不乐观。国内方面，百度可谓一马当先，率先发布了自有生成式AI大语言模式“文心一言”，而这也无可置疑地成为了近期全民关注的焦点。

从近几天舆论看，其讨论热度委实不低。而资本层面也给出了积极反馈，截至3月18日收盘，百度港股及美股全线飘红，百度终于一扫发布会后短暂下跌的颓势，为自己的技术优势正了名。

然而，鉴于发布会是录播而非直播，且之后百度并未宣布全面开放，而是针对部分用户和企业用户开放API接口，这不免引起人们对百度“文心一言”真实水平的质疑，吐槽百度“PPT发布会”“画大饼”的不在少数。而从部分媒体对比测试文心一言和GPT-4的结果来看，“文心一言”输多胜少的表现，似乎确实有点打脸百度。

不过在我看来，目前“文心一言”逊色于GPT-4是很正常的。

要知道，GPT-3.5的参数量是1750亿，而GPT-4只会更高；

从训练成本看，训练一次GPT-3.5的成本，需要460万到500万美元，而训练一次GPT-4的成本恐怕不会少于500万美元；

从硬件成本看，更早的GPT-3，需要用到1万枚英伟达GPU芯片，以英伟达A100芯片为例，单颗价格约1万美元，1万枚就是1亿美元；后来的GPT-3.5、GPT-4硬件成本只会更贵，而这还不算数据中心以及人力方面20多亿的成本。

如此看来，生成式AI是多么烧钱的一项技术，真不是谁都可以玩的。百度再有钱，恐怕也不可能全部押注，何况训练也需要时间，百度虽然有基础，但并不具备一夜赶超的实力。

发布会上，李彦宏也坦言：“大家的期望值，是我们对标ChatGPT，对标GPT-4，这个门槛有点高。”

微软已经陆续向ChatGPT的开发者OpenAI投资了近900亿人民币，而这些钱目前才刚刚看到商业化的苗头。不过短期看，想要大规模商用还需假以时日，微软要想拿回自己的投资回报还需要漫长的时间。

而百度方面，商业化似乎走得更靠前一些。今年2月份，百度官宣“文心一言”以来，已有超过650家企业宣布接入文心一言生态。

而近期，我们也看到不少车企搭载文心一言的相关宣传，比如发布会当天，长安汽车旗下的逸达，宣布成为国内首款搭载“文心一言”的量产车型。

产品未完善，商业化先行，由此可以看出百度的超前思考和布局：一方面，证明百度具备强大的技术实力和品牌感召力；另一方面，通过企业合作，也可以为“文心一言”训练提供强大的多元化数据支撑，进一步提升其迭代水平，更好展现自身更智能、更人性、更懂你的商业价值。

结语

对比来看，文心一言将比ChatGPT具备更强的本土化优势，其应用场景也会更多元，垂直度和准确度也会更高，这是百度被资本市场看好的重要原因所在。

从全球范围看，生成式AI大模型，必将成为科技发展又一个兵家必争之地。原因不仅在于其优越性和广泛性，更在于其所具备的前瞻性和思想性——当然，说思想性可能为时尚早，不过从文心一言和ChatGPT对创作和数据推理的水平看，生成式AI大模型显然已经超出了一般意义上的机器智能。

近期，微软宣布将GPT-4整合进Office全家桶，并且演示了其在办公软件中的强大应用之后，更多人表示不淡定了：这次，打工人可能真的要被AI取代了！