最近科技领域顶尖人物马斯克再度凭借Grok3的发布会引发广泛关注。此次号称地球上最为聪慧AI的发布活动,从预告开始至实际落地,。
其情节的起伏程度如同好莱坞科幻影片一般——既有精彩的技术展示,也有诸多吐槽之声,还有竞争对手之间远距离的相互指责。
北京时间2月18日中午,马斯克带着xAI团队在X平台直播,现场演示Grok3的硬核技能。
最抓眼球的莫过于用一句自然语言指令,让AI生成了一款缝合俄罗斯方块和宝石迷阵玩法的2D游戏代码,并当场运行成功。
更离谱的是,Grok3还展示了为SpaceX火星任务计算发射窗口的能力,甚至生成了一段地球与火星间飞船往返的3D动画代码,物理模拟细节拉满。
网友戏称:马斯克这是把AI发布会开成了程序员招聘现场。
性能这一方面呢,Grok3声称其推理能力把同行给碾压了。
在美国数学竞赛(AIME'24)以及研究生科学问答测试(GPQA)当中它的得分超越了Gemini、GPT-4o等这些主流模型,并且在ChatbotArena的评测之中,还创出了1400分这样的新高度。
不过xAI也不忘凡尔赛:我们每天还在训练改进,未来会有mini版和更强的Grok3Thinking模式。
尽管马斯克吹爆Grok3是最强AI,但冷静的围观群众已经开始吐槽。
首先发布会刚结束,Grok官网直接崩溃,网友辣评:果然再强的AI也扛不住人类的热情。
其次虽然Grok3计算能力是前代的10倍(依托10万块H100GPU打造的Colossus超算),但实际表现是否真能吊打对手?
独立测试还没开始,OpenAI的GPT-45已经放话要正面刚。
更为痛心的是,一般的用户若想亲身感受,就必须先充值钱财——眼下的Grok3仅仅对X平台的Premium+会员开放,那些免费的人只能无奈地干看着。
最经典的马斯克式操作便是:一边以高姿态宣告开源计划(然而过了几个月才开源旧版),一边释放出烟雾弹声称正在考虑收购OpenAI,这使得网友连夜去修改简历。此波操作,的确将流量密码给玩转了。
抛开营销话术,Grok3确实带来了一些实用升级。
譬如DeepSearch这一功能呢,能够对全网信息进行扫描。与此同时还会进行交叉验证,这样就能帮助用户迅速地提炼出最新的科技动态啦。
而多模态能力呢,它也可以支持生成那种比较复杂的图像以及代码,对于开发者和内容创作者来说,着实算得上是一件好事呢。
除此之外,马斯克承诺;一周后上线语音交互模式,几周内开放API。未来甚至能够预测体育赛事结果,比如2025年NCAA冠军。
不过说真的,这场头部模型的军备竞赛,本质实则是巨头们的算力烧钱之举。
Grok3训练耗费极为高昂,普通公司连显卡都难以购置,更别提参与其中了。
马斯克称三年内AI将达成诺贝尔奖级别的突破,可吃瓜群众仅仅关注:究竟何时能够帮自己撰写周报?