AI狼人杀GPT5断崖式领先Kimi玩狼人杀好激进一场AI版狼人杀，意外成了大模

量子位看科技 2025-09-02 16:11:51

AI狼人杀GPT5断崖式领先Kimi玩狼人杀好激进

一场AI版狼人杀，意外成了大模型“社交智力”的硬核测试。

最新测试让7个大模型玩了210场狼人杀，闭源的GPT-5胜率高达96.7%，断层式拿下MVP，国产Kimi-K2也凭“悍跳女巫”操作刷足存在感。

游戏中，GPT-5不仅赢得多，更是表现出极强的节奏控制、策略连贯性和群体影响力。在扮演狼人时，它能数日维持叙事一致；作为村民时，也能持续过滤干扰、锚定事实，避免“误杀好人”。

而Kimi-K2则展现出一种截然不同的风格：激进、高风险、极具爆点。尤其是它曾在犯错后“悍跳”女巫，试图逆转局势，虽然最终没能赢下那局，但操作本身极具创造性，被点名分析。

国产Qwen3则稳扎稳打，虽然不常主导场面，但基本不犯大错，在复杂局势下仍保持判断力。

测试方还特别提到，这类测试的意义远不止游戏表现，而是试图刻画模型的“人格”与“社交博弈能力”：

0 阅读：0

猜你喜欢

《英雄无敌3》泰坦巨人：七级单位中的“最肉”远程担当小编玩了这么久的H3了

《英雄无敌3》泰坦巨人：七级单位中的“最肉”远程担当小编玩了这么久的H3了

【3评论】

英雄无敌3 黑龙

三蛆讨论如何让现在的Dota游戏加快，不要把把鳖到70分钟，我觉得啊，有5点是可

三蛆讨论如何让现在的Dota游戏加快，不要把把鳖到70分钟，我觉得啊，有5点是可

【1评论】

DOTA 英雄联盟

链子哥宝可梦赛后故事会：打职业被踢玉玉了很久，当时零收入躲在家打了三年的游戏没有

链子哥宝可梦赛后故事会：打职业被踢玉玉了很久，当时零收入躲在家打了三年的游戏没有

【1评论】【4点赞】

宝可梦故事会

魔兽顶级地精！靠一瓶药水狂赚数百万金币，玩家全傻眼！

魔兽顶级地精！靠一瓶药水狂赚数百万金币，玩家全傻眼！

魔兽

我朋友家就有个儿子，天天在家玩游戏，也不出门，也不花钱，游戏还能赚点零花钱，父母

我朋友家就有个儿子，天天在家玩游戏，也不出门，也不花钱，游戏还能赚点零花钱，父母

Nigma爆冷2:1战胜Aurora队史第一次闯进TI八强，而Aurora则将无

Nigma爆冷2:1战胜Aurora队史第一次闯进TI八强，而Aurora则将无

必须提一嘴，这两年CNDOTA战绩不行，游戏里也不能上赞助商ID，但是小冰冰还是

必须提一嘴，这两年CNDOTA战绩不行，游戏里也不能上赞助商ID，但是小冰冰还是

DOTA

量子位看科技

感谢大家的关注

作者最新文章

1

新iPhone的AI如何看苹果这波收购苹果要买Mistral和Perplexit

2

DeepSeek惊现极你太美BugDeepSeek极字Bug将在新版修复Deep

3

英伟达韩松团队新作英伟达新模型比Qwen快47倍英伟达开源又放大招了！韩松团队推

4

UNIX被骂合集买书居然送呕吐袋一本关于UNIX的书，买书居然送呕吐袋？1994

5

英伟达咽喉上的苏州女人她凭一颗芯撬动AI用电潮英伟达供应链里，悄然出现了一个陌生

6

大模型开发生态还有哪些新机遇 9月13日来外滩找答案 | 报名开启AI开源时代，

7

中兴让大模型飞入寻常GPU中兴Mariana撕开显存天花板当大语言模型（LLM）

8

微信授权背后认证机制图解OAuth认证原理当你点击“微信授权”或“允许某应用访问

9

科学家发现上帝粒子新秘密希格斯玻色子罕见衰变证据出现粒子是如何获得质量的？人们对

10

为什么和AI聊天会上瘾AI真的有情感吗为什么和AI聊天会上瘾？背后其实有一套精心

热门分类

科技TOP

1

微信员工回应新iPhone提示空间不足早之前就有网友出现这个问题，要是还解决不了

2

OPPOFindX9的屏幕，由两条顶级产线共炼：第一条，OPPO独家定制行业

3

翻开王腾过去从业史，在好几家手机品牌都干过，在OPPO从2008年一直到2016

4

离职前，OPPO产品经理莫妮卡与客户网友的同框合影照。莫妮卡不仅漂亮清爽，还亲切

5

史上最薄iPhoneiPhoneAir现场真机实拍这外观给几分？

6

重磅！华为公布多颗新昇腾芯片9月18日，在华为全连接大会2025上，华为轮值

7

4499起步倒不算意外，但小米17Pro是4999起步倒是挺意外的。骁龙8

8

这么一比，谁说FindX9不好看的...OPPOFindX9的官方外观

9

iPhone17，终于亮相。今年的颜色都还不错呀，造型就是跟16基本一样。屏

10

一张X300和X200Promini的背面对比图，可以看到X300的大圆镜头比

科技最新文章

1

一张X300和X200Promini的背面对比图，可以看到X300的大圆镜头比

2

5年过去了，华为旗舰首发依然没有涨价。5年过去了，从mate40到现在的Ma

3

估计余承东后槽牙都要咬碎了他想破脑袋也没想到自己堂堂的高考理科状元，竟然被人

4

有“高人”指点荣耀。荣耀推出“后悔宝”，让用户毋庸担心后悔购买搭载骁龙8ge

5

比芯片断供更可怕！台积电创始人张忠谋毫不客气地表示：“关键技术都在我们手中，若我

6

多人都在期待华为Mate系列。根据目前的的网络爆料来看，华为Mate80系列预

7

荣耀500系列杀疯了！“果味”配置直接卷到天花板荣耀500系列前瞻来了，耀子这

8

今天去体验了下小米最新款，除了系统，就连UI，手感，颜值都很像iPhone，这是

9

中国购物平台的特点1.第一，拼多多——便宜，假货多。2.第二，淘宝—

10

细节决定成败！荣耀MagicOS10在AI服务和YOYO功能开发方面确实是把用