不到一年时间,AI完成了从“袪魅”,到重回主流、再度引发“恐慌”的逆袭。
随着AIGC应用愈发成熟,不仅科技语境涌起新一轮浪潮,一直同AI略显疏离的C端用户亦被不断刷新着认知。当下,不论是投资圈,还是学术界,抑或是普通用户,几乎所有人的目光都聚焦在了生成式AI产品身上。
显然,2023年,属于AIGC的时代已然到来。但纵观行业,大众讨论的核心始终没有脱离那几款明星产品,国内部分企业虽表示正在布局,大多停留于概念层面,鲜有真正拿出成果的玩家——直至百度下场,局面有所逆转。
3月16日下午,百度发布厅内,李彦宏亲自上台,将外界期待许久的文心一言端上了台面。从发布会现场演示来看,文心一言在面对五个典型的使用场景时表现得不错,回答的准确性、逻辑性、流畅性均接近人类水平。耕耘AI多年的百度,或许即将迎来属于自己的时刻。
文心一言:百度AI十几年荆棘闯出的结果细数国内互联网语境,百度无疑是在AI领域扎根最深的玩家之一。早在十年前,百度便已将未来的飞轮押注在了AI上面。
2010年,当玩家们还在思索如何通过互联网思维改造传统行业时,百度便已成立了自然语言处理部,开始了对自然语言处理NLP的探索。而过去十多年间,在视觉识别、自动驾驶等AI更为广阔的落地领域,几乎也都遍布着百度的身影。
只是,科技发展需要跨越裂谷,正如千禧年的互联网的崩溃,以及后来云计算遭冷落等,前沿技术研发及落地过程中往往充满着痛苦,即便是OpenAI,也难逃多年苦坐“冷板凳”,百度AI亦曾陷入过单边投入的长周期之中。
而文心一言,正是百度这十多年AI路,踩着“荆棘”所闯出的结果。
2019年3月,文心一言背后的文心大模型ERNIE1.0首次亮相,并登顶了全球权威数据集GLUE榜单。此后,其不断升级迭代,从自然语言延伸至视觉、语音等多模态,直到最新的ERNIE3.0 Zeus模型,已然具备了千亿级参数。换言之,百度能够抢跑国内AIGC赛道,绝非偶然。
而切入正题,文心一言实际表现到底如何?发布会上,李彦宏通过文学创作、商业文案创作、数理推算、中文理解、多模态生成五个场景下的Demo,向外界秀了一把肌肉。
以数理逻辑推算为例,其向文心一言抛出了经典的鸡兔同笼问题,并在提问中埋下了彩蛋——即误导性的提问。而经过演算,文心一言非但没有踩坑,反倒指出了题目出现了错误,且在面对正确的题目时,给出了正确结果及解题步骤。
如果说,顶级厂商大模型均具备的数理逻辑推算能力,尚不足以证明文心一言的能力,那么其关于“洛阳纸贵”的表达,则令人眼前一亮。毕竟中文语境较为复杂,汉字数量较多,即便是ChatGPT,面对中文时偶尔也会出现词不达意,言不由衷的情况。
以“用洛阳纸贵四个字写一首藏头诗”为例,文心一言稍加思索,写下了“洛阳城里春光好,阳艳无双不负赏。纸贵漫天诗词赋,贵比黄金乐未央。”
这首诗虽谈不上有多少文学、审美价值,但至少兢兢业业地按照要求完成了创作。相比之下,ChatGPT似乎并没有很好地理解“藏头诗”的含义。
从中不难窥见文心一言的中文理解能力。显然,在中文语境里,具备搜索优势的百度拥有“主场优势”,有着更多的中文语料数据参与训练,自然也有着更为成熟的结果。
总之,就发布会来看,文心一言的表现优秀。
实测文心一言:优势非虚或许是早已习惯了国内玩家的PPT发布会,外界对发布会上文心一言的表现褒贬不一,甚至有一种声音认为“Demo并非实时提问,其中有一定的‘修饰’空间”。
对此,光子星球拿到了文心一言的内测资格,并第一时间测试了其实际表现。先说结论,就当前版本的文心一言而言,仍有提升的空间,但整体表现超出了我们此前的预期。
首先是百度重点展现的中文理解领域,从烧烤店老板的视角分别向文心一言和ChatGPT提出相同的问题。
提问是东北烧烤,但ChatGPT的回答似乎有些驴头不对马嘴,将串串香、烤鸭等五湖四海的美食汇聚一堂。相比之下,文心一言的回答不仅到位许多,甚至还呈现出了不同答案的取名逻辑。
同样的逻辑,在贴合本地文化的网吧取名中同样有所体现。文心一言的回答,显然比ChatGPT毫无逻辑的回答要精准。
此外,在发布会展现的藏头诗创作方面,文心一言对内容的理解亦优于ChatGPT。