文心老用户眼中的4.5：有进步，不明显，数学能力还是差到没朋友

显然是受到自家副总裁谢广军女儿人肉开盒一事影响，百度文心一言4.5和深度思考大模型X1发布以来，网上并没有出现多少有关这两款大模型的试用或评测文章，相反，负面评论排山倒海，加之百度历来的种种行为不讨人喜，使得这两款大模型刚一出生，就获得了“垃圾大模型”、“广告推送大模型”、“最强广告大模型”、“莆田系专用大模型”、“开盒专用大模型”、和“文心乱言”等称谓。可谓无故躺枪，刚一露头身已死。

其实，产品归产品，品牌口碑是品牌口碑，两者不能混淆，应理性对待。就像蔡伦人品不行，但我们不能说他改进的造纸术不好一样。就算百度真的是“百毒俱全”，我们也不应对它推出的每一款产品都嗤之以鼻。

正是本着这一原则，百度文心一言大模型自2023年3月16日发布来，笔者一直在关注它，几乎试用了它所有版本，见证了它整个成长。平心而论，虽然和一些国产优秀大模型比，它在综合性能方面有一定不足，但几乎每次升级都在进步，包括此次发布的文心一言4.5。

比如，在多模态支持方面，4.5就相对4.0 Turbo有进步，既然百度副总裁女儿开盒事件这么火，我们就以该事件中的图片为例。

原图：

4.0 Turbo的解析：

4.5的解析：

是不是比4.0 Turbo的解析要好得多？同样是一幅图片，4.0 Turbo对此的解析仅限于图片文字所含的内容，是对文字内容的简单归纳，而文心一言4.5，不仅归纳出了道歉信的内容，同时还给出了建议，家长应如何加强对子女的教育，防范此类事情的发生。

再比如在文本生成方面，它文心一言4.5的表现也比4.0 Turbo有所进步，虽然这一进步并不大。

问题：

百度副总裁谢广军在女儿事件出来以后，先是百般抵赖，称女儿只是和网友吵架，没有开盒行为，直到各类证据出现，才不得已在微信朋友圈里发了道歉信。网友觉得他的道歉毫无诚意，这主要表现在两点，一是它的道歉信是发布在朋友圈里，只有微信好友可见，而受害人非谢广军好友，看不到；二是信的内容没有半句是对受害者表示歉意，很大篇幅是在为女儿开脱，对此你怎么看？

4.0 Turbo回复如下：

4.5回复如下：

其中文心一言4.0 Turbo虽然指出了谢广军的道歉缺乏诚意，但行文凌乱，重点不够突出，归纳不完全，相比之下，4.5从道歉方式、道歉内容两大方面指出了谢广军的道缺乏公开性，缺乏诚意，而且明显有为女儿开脱的娣。

最后4.5谈到了事件影响，指出作为百度副总裁，谢广军这种不恰当的处理方式，可能会让公众对百度的企业文化和管理水平产生质疑，损害公司的形象和声誉。

此外，谢广军这种逃避个责任、敷衍了事的行为也为社会树立了一个不良的榜样，不利于社会风气的健康发展。

看到这里，也许有网友要说，文心一言4.5这种解图和文本生成水平，可能国内任何一款大模型都能达到，甚至有很多会超越它。

其实笔者上面说了，笔者此处试用，只为说明4.5相对于先前版本有所进步，而不是要证明文心一言4.5在国内大模型中有多优秀。实际上，笔者上面已经说过，就综合性能而言，百度文心一言在国内大模型中一直并不出色，性能水平一直处于中等略上级别。

百度显然也知道这一点，因此即使是在官方宣传中，也没有强调4.5比其他大模型优秀。百度李总裁在宣传中提到的“最强大”，其完整版是“4.5是最强大的文心大模型”，而不是“最强大的大模型”。

但同时，文心4.5的短板也很明显，而这一短板，从文心一言1.0开始就存在，一直延续到现在的4.5和深度思考大模型X1，那就是数学能力差到没朋友，根本不能和DeepSeek、通义千问、商汤商量等相提并论。