发布Grok4.1，盲测登顶第一。OpenAI刚推出GPT-5.1，主打

发布 Grok 4.1，盲测登顶第一。OpenAI 刚推出 GPT-5.1，主打情商革命，结果马斯克的 xAI 直接扔出一颗重磅：Grok 4.1 全量上线，直接在 LMArena 盲测排行榜空降总榜第一。xAI本次发布了两个Grok 4.1模型：Grok 4.1（非推理模式）和 Grok 4.1 Thinking（思考模式），这两个模型均可免费使用，其中：Grok 4.1的“思考模式”，以1483 Elo的成绩位列总榜第一，领先所有非xAI模型31分。Grok 4.1的“非推理模式”，无需使用thinking tokens，可立即生成回答，并以1465 Elo的成绩排名第二。更狠的是，Grok 4.1 的“非推理”快速模式，都能打赢所有对手的“完整推理”模式。并且xAI在真实流量上进行了盲测式的成对比较评估，结果显示：64.78% 的用户更偏好 Grok 4.1。这次升级重点不是参数，而是真实世界体验：情绪理解更自然、对话更像人、创意写作逼近 GPT-5.1，事实性幻觉已经下降了三分之二。

0 阅读：3

发布Grok4.1，盲测登顶第一。OpenAI刚推出GPT-5.1，主打

GrokAI用户惊讶地发现，Grok正在疯狂肉麻地吹捧马斯克。此前就有报道，G

微软和OpenAI谈了这么久，终于把合作细节敲定了，微软拿到了27%股份，约13

deepseek揭露了冰山一角，openai离职人员进一步加强了理论基础，

中美AI之间最大差别，或许不在技术，而是在这个地方！就像英国《金融时报》早

只要是黑小米的，无论有多离谱都会有人信

纽约时报中文网：硅谷反华情绪高涨，但美国人工智能发展仍靠中国人才推动。扎克伯格公

有人说，长江存储和长鑫存储是中国存储界的两大巨头。其实，目前长鑫在内存的地位和长

发布Grok4.1，盲测登顶第一。OpenAI刚推出GPT-5.1，主打

GrokAI用户惊讶地发现，Grok正在疯狂肉麻地吹捧马斯克。此前就有报道，G

微软和OpenAI谈了这么久，终于把合作细节敲定了，微软拿到了27%股份，约13

deepseek揭露了冰山一角，openai离职人员进一步加强了理论基础，

中美AI之间最大差别，或许不在技术，而是在这个地方！ 就像英国《金融时报》早

只要是黑小米的，无论有多离谱都会有人信

纽约时报中文网：硅谷反华情绪高涨，但美国人工智能发展仍靠中国人才推动。扎克伯格公

有人说，长江存储和长鑫存储是中国存储界的两大巨头。其实，目前长鑫在内存的地位和长

中美AI之间最大差别，或许不在技术，而是在这个地方！就像英国《金融时报》早