伴随着ChatGPT的火爆,很多AI创业者都将中国版ChatGPT视作自己的创业目标,然而,两个月过去了,在中国,目前公布具体产品的只有百度一家。
2023年3月16日14时,百度在北京总部召开新闻发布会,介绍其基于百度新一代大语言模型的生成式AI 产品文心一言,展示了文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的综合能力。
“人工智能会彻底改变我们今天的每一个行业。AI的长期价值,对各行各业的颠覆性改变,才刚刚开始。”百度创始人、董事长兼首席执行官李彦宏在出席发布会的时候表示说。
从全球范围的大厂来说,百度可以说创造了奇迹。
中国版ChatGPT来了 百度文心一言走进现实
文心一言的能力到底如何?
在发布会现场,李彦宏特别对文心一言的中文理解能力进行了展示。在展示过程中,文心一言正确解释了成语“洛阳纸贵”的含义、“洛阳纸贵”对应的经济学理论,还用“洛阳纸贵”四个字创作了一首藏头诗。
小编也在开放测试之后体验了一下百度的文心一言。可以肯定的说,其逻辑能力及语言表达能力与ChatGPT不相上下——具体来讲,文心一言基本上可以提供和ChatGPT差不多的功能,包括文学创作、商业文案创作、数理推算、中文理解、多模态生成等,综合来看,文心一言在某种程度上已经具备了对人类意图的理解能力,其逻辑性等方面正在逐步接近人类水平,当然,这依旧需要百度文心一言继续在大语言模型当中不断完善。
比如,在文学创作场景中,文心一言根据对话问题将知名科幻小说《三体》的核心内容进行了总结,还准确回答了《三体》作者、电视剧角色扮演者等事实性问题,其准确率颇高,甚至很多与事实相差无几。
“文心一言将建立起真实用户反馈、开发者调用和模型迭代之间的飞轮,效果会迅速提升,给你‘士别三日,当刮目相看’的惊喜。”李彦宏表述说。
文心一言能够在短期内推出并且获得“刮目相看”的成就,这跟百度在人工智能领域的长期积累密不可分——众所周知,百度有世界上最大的知识图谱,一直致力于给用户提供唯一答案,这个积累让文心一言回答准确性及生成结果的可信度得到提升,据悉,文心一言大模型的训练数据包括万亿级网页数据,数十亿搜索数据和图片数据,百亿级语音日均调用数据及5500亿事实的知识图谱,这使得文心一眼大模型涌现出知识和逻辑推理能力,在自然语言问答和创意内容生成上有突出表现。文心一言还可以把问题拆分为子问题,一步步推理,更容易给出正确答案。
不过,上述功能已经算是大模型的标配,而文心一言的真正亮点在于其中文理解能力和多模态生成能力。
尽管刚刚升级到GPT4的ChatGPT让ChatGPT的各项能力再一次提升,但这项世界顶尖大模型无论研发还是应用主要针对的还是英语,在中文理解方面,特别是隐藏在文字背后的中式思维和东方文化方面还有很多不足。尽管百度的文心一言当前还谈不上完美,仍有很大的提升空间,但是其依旧拥有当前中文领域最先进的自然语言处理能力。
与此同时,多模态生成能力作为生成式AI的未来,百度也同样在AI生成文本、图片、音频、视频等方面已经有了非常多的积累,虽然在单独某一项类别上,百度未必是最顶尖的,但在多模态生成方面,目前还鲜有和百度拥有相同能力的公司,随着百度多模态统一大模型的能力增强,文心一言的多模态生成能力,也会不断提升。
此外,在基础的搜索领域,文心一言不仅能够对用户提出的问题进行解答,而且还能根据用户的需要做藏头诗这样的需要进一步加工的作品。在商业创作方面,用户只需要提出需求,文心一言就可以自己生成文案、海报、视频等等,乙方公司完全可以将甲方的需求原封不动地转给文心一言,再将生成的作品发给甲方,如果甲方不满意,那就让文心一言接着改。至于数理逻辑这个连ChatGPT都翻过车的领域,文心一言至少已经能够做鸡兔同笼这样的初中难度的数学题,而且还能发现题干中的错误,而不是用错误的题干乱算一通。