百度敲响大语言模型战鼓 - 科技资讯(世良情感网)

伴随着ChatGPT的火爆，很多AI创业者都将中国版ChatGPT视作自己的创业目标，然而，两个月过去了，在中国，目前公布具体产品的只有百度一家。

2023年3月16日14时，百度在北京总部召开新闻发布会，介绍其基于百度新一代大语言模型的生成式AI 产品文心一言，展示了文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的综合能力。

“人工智能会彻底改变我们今天的每一个行业。AI的长期价值，对各行各业的颠覆性改变，才刚刚开始。”百度创始人、董事长兼首席执行官李彦宏在出席发布会的时候表示说。

从全球范围的大厂来说，百度可以说创造了奇迹。

中国版ChatGPT来了百度文心一言走进现实

文心一言的能力到底如何？

在发布会现场，李彦宏特别对文心一言的中文理解能力进行了展示。在展示过程中，文心一言正确解释了成语“洛阳纸贵”的含义、“洛阳纸贵”对应的经济学理论，还用“洛阳纸贵”四个字创作了一首藏头诗。

小编也在开放测试之后体验了一下百度的文心一言。可以肯定的说，其逻辑能力及语言表达能力与ChatGPT不相上下——具体来讲，文心一言基本上可以提供和ChatGPT差不多的功能，包括文学创作、商业文案创作、数理推算、中文理解、多模态生成等，综合来看，文心一言在某种程度上已经具备了对人类意图的理解能力，其逻辑性等方面正在逐步接近人类水平，当然，这依旧需要百度文心一言继续在大语言模型当中不断完善。

比如，在文学创作场景中，文心一言根据对话问题将知名科幻小说《三体》的核心内容进行了总结，还准确回答了《三体》作者、电视剧角色扮演者等事实性问题，其准确率颇高，甚至很多与事实相差无几。

“文心一言将建立起真实用户反馈、开发者调用和模型迭代之间的飞轮，效果会迅速提升，给你‘士别三日，当刮目相看’的惊喜。”李彦宏表述说。

文心一言能够在短期内推出并且获得“刮目相看”的成就，这跟百度在人工智能领域的长期积累密不可分——众所周知，百度有世界上最大的知识图谱，一直致力于给用户提供唯一答案，这个积累让文心一言回答准确性及生成结果的可信度得到提升，据悉，文心一言大模型的训练数据包括万亿级网页数据，数十亿搜索数据和图片数据，百亿级语音日均调用数据及5500亿事实的知识图谱，这使得文心一眼大模型涌现出知识和逻辑推理能力，在自然语言问答和创意内容生成上有突出表现。文心一言还可以把问题拆分为子问题，一步步推理，更容易给出正确答案。

不过，上述功能已经算是大模型的标配，而文心一言的真正亮点在于其中文理解能力和多模态生成能力。

尽管刚刚升级到GPT4的ChatGPT让ChatGPT的各项能力再一次提升，但这项世界顶尖大模型无论研发还是应用主要针对的还是英语，在中文理解方面，特别是隐藏在文字背后的中式思维和东方文化方面还有很多不足。尽管百度的文心一言当前还谈不上完美，仍有很大的提升空间，但是其依旧拥有当前中文领域最先进的自然语言处理能力。

与此同时，多模态生成能力作为生成式AI的未来，百度也同样在AI生成文本、图片、音频、视频等方面已经有了非常多的积累，虽然在单独某一项类别上，百度未必是最顶尖的，但在多模态生成方面，目前还鲜有和百度拥有相同能力的公司，随着百度多模态统一大模型的能力增强，文心一言的多模态生成能力，也会不断提升。

此外，在基础的搜索领域，文心一言不仅能够对用户提出的问题进行解答，而且还能根据用户的需要做藏头诗这样的需要进一步加工的作品。在商业创作方面，用户只需要提出需求，文心一言就可以自己生成文案、海报、视频等等，乙方公司完全可以将甲方的需求原封不动地转给文心一言，再将生成的作品发给甲方，如果甲方不满意，那就让文心一言接着改。至于数理逻辑这个连ChatGPT都翻过车的领域，文心一言至少已经能够做鸡兔同笼这样的初中难度的数学题，而且还能发现题干中的错误，而不是用错误的题干乱算一通。