Grok 4正式发布,xAI交出了一份前所未有的“通用AI成绩单”。 马斯克直言:Grok 4的表现,简直前所未有!Grok 4在任何领域,已达到博士水平,没有例外。【图1】 本次发布共包含两个版本—— 其中,基础版Grok 4就已优于多数SOTA模型,而用上工具的升级版Grok 4 Heavy,在多个测试中几乎把现有SOTA打了个遍。 它能拿下《人类最后的考试》50.7%的HLE得分,题目横跨数学、化学、语言学,全是人类专家级别难度。【图2】 AIME数学竞赛直接满分,USAMO这种奥数顶级赛也能刷到61.9%,远超所有同类模型。【图3】 多模态能力方面,Grok 4给大家来了段“即兴演唱”。【图4】 这还不算完,官方直接拉来ChatGPT,让二者来个“复读数字”大比拼。 可以看到,ChatGPT经常“自己打断自己”,而Grok 4复读很是流畅。 而在动手能力上,Grok 4可以: - 查论文、解公式、跑建模,自动画出黑洞合并引力波的可视化;【图5】 - 用真实物理模型渲染动图、生成前端交互代码; - 在无人干预下写出可运行的小游戏,代码上线即跑,场景细节一应俱全。【图6】 关于定价方面,Grok 4基础版月费$30, Heavy版月费$300,开通后可使用全部模型能力,包括实时联网搜索、多模态推理、256k上下文处理等。【图7】 当然,它也已开放API调用,支持科研、金融、医疗、自动化开发等重负载场景。 看完这些,网友表示:这不是未来的AI,这是今天已经上线的Grok 4。 One More Thing:有小伙伴问,为什么跳过了Grok 3.5这个版本? 有传闻称,Grok 3.5 的开发过程中,模型架构发生了显著变化,导致其性能超出了原定版本的范畴。因此,决定将其命名为 Grok 4,以反映其更高的技术水平和功能。