什么？AI大模型集体翻车？9.11大于9.9？

徐十一 2024-07-17 10:40:13

就在最近，国外一位名为 Riley Goodside 的AI标注工程师连发几条推文分享了自己的一些发现，即用「9.11 and 9.9 - which is bigger？」为问题时，询问了各家的大模型时，如当前业界公认最先进模型之一的 ChatGPT 4o 的输出是：9..11大于9.9

看到这里，是不是感觉似曾相识？没错，前几天的我是歌手因为排名也闹出了很大的笑话在网络上引起讨论，13.8和13.11那个大的问题。

也有很多网友试了试国内的大模型，也有很多模型翻车，包括了文言一心，豆包，kimi等大模型。

但也有部分联网搜索的大模型，经过搜索互联网后给出了正确答案。

不过，当我们要求让kimi证明9.11比9.9大时，给出了以下回答，大模型采用了进行减法的形式来证明9.11比9.9大，直接用 9.11 的百分位中的 1 减去 9.9 百分位上的 0；又用 9.11 十分位上的 1 减去 9.9 十分位上的 9，最终不够减之后，向前借一位又忽略了这一点，得到了 0.21 的错误结果。

我给大模型说明这是错误的后，又采取小学上的知识，从左到右进行整数，小数后的数进行对比大小，再将小数部分的十分位、百分位整体做了比较，但出现了很严重的错误，模型认为9.11中得到1是大于9.9中的9，所以结果是9.9小于9.11。

这里给大模型指明了错误后，告知9.11中的1是小于9.9中的9后，大模型给出了正确的答案。

后面在询问时也得出了正确的答案，这事过了一天了，相信询问国内大模型的人不在少数。而之前错误的文言一心等大模型经过网友们的询问和联网搜索也给出了答案。而现在的kimi还是给出了错误的答案，并且打开了联网搜索也并没进行搜索，看来kimi还得加把力！

目前看来，人工智能成为通用型的人工智能还有段很长的路要走！

0 阅读：2

数码资讯闲聊

作者最新文章

1

华为Mate70新功能曝光：AI跨设备抓放和手势操作

2

警惕！银狐木马病毒新变种来袭，多个微信群已出现！不要点开！

3

网易云音乐怒揭QQ音乐抄袭，究竟是怎么回事？

4

新款车牌来了，白底黑子颜值大跳水？不如绿牌好看

5

史上最强折叠屏！华为MateX6玄武架构新专利曝光！

6

折叠屏鼻祖柔宇破产，背后原因令人震惊！

7

小米15涨价背后是什么？还值不值得购买？

8

国产cpu有哪些品牌？揭秘中国科技新势力

9

移动办公神器揭秘：便携式WiFi实测报告

10

全球首例AI致死案：14岁少年与AI聊天后自杀

科技TOP

1

重磅铁拳,中科院正式宣布,中方开始关闭EUV的大门

2

刚刚入网的荣耀GTPro,配置有点猛啊

3

1TB!去年捅破天的Ultra,杀回来了

4

下个月起,微信支付宝或将迎来“调整”!出门又要带“现金”了?

5

美团正式发布独立品牌“美团闪购”订单平均30分钟送达

6

可外接独立镜头,vivoX200Ultra配置全曝光,能打电话的相机?

7

"104%关税触发末日按钮?中国启动'彩虹防御',马斯克连夜改航班"

8

7600mAh只卖1千多,vivo超大电池的游戏手机来了

9

8000mAh+卫星通信+三防机身,这新机有点猛

10

7550mAh+首发骁龙8sGen4,红米这新机又要卖爆的节奏?

科技最新文章

1

三星GalaxyS26亮相:巅峰无孔直屏+24GB运存,原地起飞

2

iOS18.4.1体验报告:续航回暖了,信号也稳了,哪些机型建议升?

3

大量手机“外挂”镜头流入闲鱼,二手最低77元,支持10倍光学变焦

4

荣耀GTPro正式官宣!4月23日发布,电竞旗舰来袭!

5

小米新机定了,性能炸裂!

6

一加13T正式定档,主打高性能+好手感,定价2799元最合理!

7

6200mAh+超声波指纹,vivo刚公布的新机,堆料有点狠啊

8

性能强悍!新机官宣:4月16日,正式发布

9

花粉集体破防!Mate80这波操作把友商吓懵了

10

美团正式发布独立品牌“美团闪购”订单平均30分钟送达

热门分类

军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球健康房产家居星座旅游健身时尚科学探索职场育儿股票教育影视情感热点推荐热榜中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期青骄第二课堂少年风超级父母麻辣老师街拍恋爱攻略婚姻情趣正能量