发布 Grok 4.1,盲测登顶第一。OpenAI 刚推出 GPT-5.1,主打情商革命,结果马斯克的 xAI 直接扔出一颗重磅:Grok 4.1 全量上线,直接在 LMArena 盲测排行榜空降总榜第一。xAI本次发布了两个Grok 4.1模型:Grok 4.1(非推理模式)和 Grok 4.1 Thinking(思考模式),这两个模型均可免费使用,其中:Grok 4.1的“思考模式”,以1483 Elo的成绩位列总榜第一,领先所有非xAI模型31分。Grok 4.1的“非推理模式”,无需使用thinking tokens,可立即生成回答,并以1465 Elo的成绩排名第二。更狠的是,Grok 4.1 的“非推理”快速模式,都能打赢所有对手的“完整推理”模式。并且xAI在真实流量上进行了盲测式的成对比较评估,结果显示:64.78% 的用户更偏好 Grok 4.1。这次升级重点不是参数,而是真实世界体验:情绪理解更自然、对话更像人、创意写作逼近 GPT-5.1,事实性幻觉已经下降了三分之二。





