显然是受到自家副总裁谢广军女儿人肉开盒一事影响,百度文心一言4.5和深度思考大模型X1发布以来,网上并没有出现多少有关这两款大模型的试用或评测文章,相反,负面评论排山倒海,加之百度历来的种种行为不讨人喜,使得这两款大模型刚一出生,就获得了“垃圾大模型”、“广告推送大模型”、“最强广告大模型”、“莆田系专用大模型”、“开盒专用大模型”、和“文心乱言”等称谓。可谓无故躺枪,刚一露头身已死。
其实,产品归产品,品牌口碑是品牌口碑,两者不能混淆,应理性对待。就像蔡伦人品不行,但我们不能说他改进的造纸术不好一样。就算百度真的是“百毒俱全”,我们也不应对它推出的每一款产品都嗤之以鼻。
正是本着这一原则,百度文心一言大模型自2023年3月16日发布来,笔者一直在关注它,几乎试用了它所有版本,见证了它整个成长。平心而论,虽然和一些国产优秀大模型比,它在综合性能方面有一定不足,但几乎每次升级都在进步,包括此次发布的文心一言4.5。
比如,在多模态支持方面,4.5就相对4.0 Turbo有进步,既然百度副总裁女儿开盒事件这么火,我们就以该事件中的图片为例。
原图:
4.0 Turbo的解析:
4.5的解析:
是不是比4.0 Turbo的解析要好得多?同样是一幅图片,4.0 Turbo对此的解析仅限于图片文字所含的内容,是对文字内容的简单归纳,而文心一言4.5,不仅归纳出了道歉信的内容,同时还给出了建议,家长应如何加强对子女的教育,防范此类事情的发生。
再比如在文本生成方面,它文心一言4.5的表现也比4.0 Turbo有所进步,虽然这一进步并不大。
问题:
百度副总裁谢广军在女儿事件出来以后,先是百般抵赖,称女儿只是和网友吵架,没有开盒行为,直到各类证据出现,才不得已在微信朋友圈里发了道歉信。网友觉得他的道歉毫无诚意,这主要表现在两点,一是它的道歉信是发布在朋友圈里,只有微信好友可见,而受害人非谢广军好友,看不到;二是信的内容没有半句是对受害者表示歉意,很大篇幅是在为女儿开脱,对此你怎么看?
4.0 Turbo回复如下:
4.5回复如下:
其中文心一言4.0 Turbo虽然指出了谢广军的道歉缺乏诚意,但行文凌乱,重点不够突出,归纳不完全,相比之下,4.5从道歉方式、道歉内容两大方面指出了谢广军的道缺乏公开性,缺乏诚意,而且明显有为女儿开脱的娣。
最后4.5谈到了事件影响,指出作为百度副总裁,谢广军这种不恰当的处理方式,可能会让公众对百度的企业文化和管理水平产生质疑,损害公司的形象和声誉。
此外,谢广军这种逃避个责任、敷衍了事的行为也为社会树立了一个不良的榜样,不利于社会风气的健康发展。
看到这里,也许有网友要说,文心一言4.5这种解图和文本生成水平,可能国内任何一款大模型都能达到,甚至有很多会超越它。
其实笔者上面说了,笔者此处试用,只为说明4.5相对于先前版本有所进步,而不是要证明文心一言4.5在国内大模型中有多优秀。实际上,笔者上面已经说过,就综合性能而言,百度文心一言在国内大模型中一直并不出色,性能水平一直处于中等略上级别。
百度显然也知道这一点,因此即使是在官方宣传中,也没有强调4.5比其他大模型优秀。百度李总裁在宣传中提到的“最强大”,其完整版是“4.5是最强大的文心大模型”,而不是“最强大的大模型”。
但同时,文心4.5的短板也很明显,而这一短板,从文心一言1.0开始就存在,一直延续到现在的4.5和深度思考大模型X1,那就是数学能力差到没朋友,根本不能和DeepSeek、通义千问、商汤商量等相提并论。