昨天 DeepSeek 刚放出 V3.2-Exp,深夜 Anthropic 立刻回应,带来了 Claude Sonnet 4.5。这一次,Claude 不只喊出了世界最强编程模型的口号,更是把 AI 写代码的极限从 GPT-5 Codex 的 7 小时,一口气拉到 30+ 小时,能生成真正生产力的应用。
在评测上,Claude 4.5 在 SWE-bench 斩获 SOTA,还在 OSWorld 测试里从 42.2% 提升到 61.4%,把“AI 用电脑干活”的门槛推高一大截。
更重要的是,它带来了一整套工具链升级:代码检查点、VS Code 扩展、Chrome 插件、Claude Agent SDK,开发者甚至能用它搭建属于自己的智能体。你会把 30 小时的系统开发,交给 AI 来跑吗?ai