实测文心一言，百度可以再自信一点

不到一年时间，AI完成了从“袪魅”，到重回主流、再度引发“恐慌”的逆袭。

随着AIGC应用愈发成熟，不仅科技语境涌起新一轮浪潮，一直同AI略显疏离的C端用户亦被不断刷新着认知。当下，不论是投资圈，还是学术界，抑或是普通用户，几乎所有人的目光都聚焦在了生成式AI产品身上。

显然，2023年，属于AIGC的时代已然到来。但纵观行业，大众讨论的核心始终没有脱离那几款明星产品，国内部分企业虽表示正在布局，大多停留于概念层面，鲜有真正拿出成果的玩家——直至百度下场，局面有所逆转。

3月16日下午，百度发布厅内，李彦宏亲自上台，将外界期待许久的文心一言端上了台面。从发布会现场演示来看，文心一言在面对五个典型的使用场景时表现得不错，回答的准确性、逻辑性、流畅性均接近人类水平。耕耘AI多年的百度，或许即将迎来属于自己的时刻。

文心一言：百度AI十几年荆棘闯出的结果

细数国内互联网语境，百度无疑是在AI领域扎根最深的玩家之一。早在十年前，百度便已将未来的飞轮押注在了AI上面。

2010年，当玩家们还在思索如何通过互联网思维改造传统行业时，百度便已成立了自然语言处理部，开始了对自然语言处理NLP的探索。而过去十多年间，在视觉识别、自动驾驶等AI更为广阔的落地领域，几乎也都遍布着百度的身影。

只是，科技发展需要跨越裂谷，正如千禧年的互联网的崩溃，以及后来云计算遭冷落等，前沿技术研发及落地过程中往往充满着痛苦，即便是OpenAI，也难逃多年苦坐“冷板凳”，百度AI亦曾陷入过单边投入的长周期之中。

而文心一言，正是百度这十多年AI路，踩着“荆棘”所闯出的结果。

2019年3月，文心一言背后的文心大模型ERNIE1.0首次亮相，并登顶了全球权威数据集GLUE榜单。此后，其不断升级迭代，从自然语言延伸至视觉、语音等多模态，直到最新的ERNIE3.0 Zeus模型，已然具备了千亿级参数。换言之，百度能够抢跑国内AIGC赛道，绝非偶然。

而切入正题，文心一言实际表现到底如何？发布会上，李彦宏通过文学创作、商业文案创作、数理推算、中文理解、多模态生成五个场景下的Demo，向外界秀了一把肌肉。

以数理逻辑推算为例，其向文心一言抛出了经典的鸡兔同笼问题，并在提问中埋下了彩蛋——即误导性的提问。而经过演算，文心一言非但没有踩坑，反倒指出了题目出现了错误，且在面对正确的题目时，给出了正确结果及解题步骤。

如果说，顶级厂商大模型均具备的数理逻辑推算能力，尚不足以证明文心一言的能力，那么其关于“洛阳纸贵”的表达，则令人眼前一亮。毕竟中文语境较为复杂，汉字数量较多，即便是ChatGPT，面对中文时偶尔也会出现词不达意，言不由衷的情况。

以“用洛阳纸贵四个字写一首藏头诗”为例，文心一言稍加思索，写下了“洛阳城里春光好，阳艳无双不负赏。纸贵漫天诗词赋，贵比黄金乐未央。”

这首诗虽谈不上有多少文学、审美价值，但至少兢兢业业地按照要求完成了创作。相比之下，ChatGPT似乎并没有很好地理解“藏头诗”的含义。

从中不难窥见文心一言的中文理解能力。显然，在中文语境里，具备搜索优势的百度拥有“主场优势”，有着更多的中文语料数据参与训练，自然也有着更为成熟的结果。

总之，就发布会来看，文心一言的表现优秀。

实测文心一言：优势非虚

或许是早已习惯了国内玩家的PPT发布会，外界对发布会上文心一言的表现褒贬不一，甚至有一种声音认为“Demo并非实时提问，其中有一定的‘修饰’空间”。

对此，光子星球拿到了文心一言的内测资格，并第一时间测试了其实际表现。先说结论，就当前版本的文心一言而言，仍有提升的空间，但整体表现超出了我们此前的预期。

首先是百度重点展现的中文理解领域，从烧烤店老板的视角分别向文心一言和ChatGPT提出相同的问题。

提问是东北烧烤，但ChatGPT的回答似乎有些驴头不对马嘴，将串串香、烤鸭等五湖四海的美食汇聚一堂。相比之下，文心一言的回答不仅到位许多，甚至还呈现出了不同答案的取名逻辑。

同样的逻辑，在贴合本地文化的网吧取名中同样有所体现。文心一言的回答，显然比ChatGPT毫无逻辑的回答要精准。

此外，在发布会展现的藏头诗创作方面，文心一言对内容的理解亦优于ChatGPT。