AI狼人杀GPT5断崖式领先Kimi玩狼人杀好激进
一场AI版狼人杀,意外成了大模型“社交智力”的硬核测试。
最新测试让7个大模型玩了210场狼人杀,闭源的GPT-5胜率高达96.7%,断层式拿下MVP,国产Kimi-K2也凭“悍跳女巫”操作刷足存在感。
游戏中,GPT-5不仅赢得多,更是表现出极强的节奏控制、策略连贯性和群体影响力。在扮演狼人时,它能数日维持叙事一致;作为村民时,也能持续过滤干扰、锚定事实,避免“误杀好人”。
而Kimi-K2则展现出一种截然不同的风格:激进、高风险、极具爆点。尤其是它曾在犯错后“悍跳”女巫,试图逆转局势,虽然最终没能赢下那局,但操作本身极具创造性,被点名分析。
国产Qwen3则稳扎稳打,虽然不常主导场面,但基本不犯大错,在复杂局势下仍保持判断力。
测试方还特别提到,这类测试的意义远不止游戏表现,而是试图刻画模型的“人格”与“社交博弈能力”: