近期马斯克高调宣布推出Grok 3。这个被马老师称为“地球上最聪明的人工智能”是否名副其实呢?
从马斯克放出的测试图(数学、科学、代码)可以看出Grok3有四个版本:
分别是Grok-3、Grok-3 mini、Grok-Reasoning Beta和Grok-3 Reasoning mini。
其中Grok-3和Grok-3 mini是传统模型,Benchmark分别对标GPT-4o和DeepSeek V3
Grok-Reasoning Beta和Grok-3 Reasoning mini是最新的推理模型,benchmark分别对标OpenAI o1/o3和DeepSeek R1。
从基座测试结果来看,Grok-3的得分领先于DeepseekR1和Open AI的O1/O3mini,但差距并非很大。
马斯克这次可能是被迫应战,而且是xAI拿20万张GPU卡训出来的模型,除了基座测试分数之外,并无其他令人震撼的地方。
所以对比起Deepseek的训练成本,这款雄心勃勃的产品有点“起了个大早,赶了个晚集”的感觉。
Grok 3可以为Scaling Laws强行续命,但是从性价比上看:Scaling Laws的ROI(投资回报比)太低。
这还是因为DeepSeek的惊艳,货比货得扔。
马斯克财大气粗,也不意味着可以无限砸钱,而且Grok3的路子感觉被OpenAI给带偏了,都有一股“算力垄断”的金融资本意味在里面。
回顾一下xAI的大模型路径:
2023年11月,xAI发布第一款大模型Grok-1。
2024年3月18日,xAI团队发布参数量高达3140亿的Grok-1模型,这一参数量远超OpenAI GPT-3.5的1750亿,成为当时参数量最大的开源大语言模型。
2024年8月,Grok 2大模型发布 。
Grok 2主要应用于训练AI聊天机器人。
与Grok 1相比,Grok 2在训练数据的使用上有所改进。
Grok 1在训练时未完全依赖真实世界数据,采用了大量合成数据,导致在处理真实世界中的细微差别和复杂性时表现欠佳。
Grok 2融入了少量高质量的真实世界数据,一定程度上弥补了初代模型在处理真实场景方面的不足。
Grok 3,其最大的特点在于引入了“思维链”(Chain Of Thought)推理能力。该能力让Grok 3能够像人类认知过程一样逐步处理复杂任务,显著提高了模型处理复杂查询和提供更连贯、更有逻辑的响应的能力。
(眼熟不。DeepSeek R1已经具备这个能力。)
Grok 3模型在推理、编程能力以及文本和图像分析等多模态功能方面有了显著的提升。
2024年中,马斯克高调宣布:Grok-3将依托10万张英伟达H100 GPU的超强算力进行训练,计划在2024年底推出,并称赞其 “将会是非常特别的”。
但实际上,2024年底Grok-3并没有推出,业内的说法是xAI团队规模小资源少,因此进展缓慢。但2024年底规模、资源比他们小得多的DeepSeekR1惊艳一击,异军突起,让国内外震惊之余,很多大型企业已经纷纷接入DeepSeek。
我们国内就不说了,美国的一些巨头都是第一时间接入,这直接倒逼了OpenAI不情不愿的迅速开源和Grok 3的快速(相对于2024年的延期)发布。
如果Grok-3在DeepSeekR1之前发布,市场上或许还能抢占一块巨额蛋糕,但目前的情况下,DeepSeekR1如黑马崛起,逐鹿天下,而Grok-3在堆砌资源的情况下姗姗来迟,AI领域格局已经完全改变,曾经是一家独霸天下的OpenAI也不得不紧跟DeepSeek的开源步伐。
而后来的Grok-3并没有奇点突变,也没有令人惊艳的质变,仅凭着雄厚身家训练出基座测试领先(仅仅是领先而非代差)的产品,恐怕很难再改变市场格局。
农毒孔遗巷
必须是国内的胜出,训练ai用中文比用英文效率高几百倍。单靠这一点,国外的ai做高铁都追不上。要相信语言的尽头是中文,迟早有一天全世界通用语言会变成中文,而随着ai的诞生发展,这一趋势会加快。大胆预估,10年内英语可能会退出高考主科。
小清新是纠结体
以前叫盗版,后来叫模拟,现在创新了一个词条叫蒸馏技术。眼看他在楼上起高楼,眼看他楼塌了
一只死去活来的
建议老马来中国见识一下ai科技前沿,不要随意嘴大赚眼球,我们用实力说话不用广告!
朴三省
AI大竞争!又一成果出现!科技富豪埃隆·马斯克(Elon Musk)的人工智能初创公司xAI将于2月17日太平洋时间晚上8点发布最新的Grok 3聊天机器人。马斯克将Grok 3描述为“地球上最聪明的人工智能”。这一发布正处于人工智能大模型竞赛升级之际。马斯克表示,Grok 3的模型是在合成数据上进行训练的,能够通过反复查看数据来实现逻辑一致性,从而反思所犯的错误。
like
deepseek一整就服务器繁忙,跟chatgpt没法比[捂脸哭][捂脸哭][捂脸哭]。整个吹出来的
用户30xxx17 回复 02-20 12:53
以你的水平是不明白开源是啥意思了,况且你当服务器不要钱啊?看看你这脑子,chat你不花钱能用?还是你根本就没用过,光是一张嘴?
齁咸
中美这种军备竞赛,在层次上就超越美苏争霸,因为会造福人类
爱匆匆
人工智能也需要学习高效的方法论。推广效率指向方法论。
有些人好烦啊
人工智能并没有将无人化普及到民生领域,改善大众的消费体验!
TenderPoison
深度求索被马斯克的Grok 3超越没有任何悬念,英伟达的GPU加持不想领先都难。[点赞]
vivian
引蛇出洞成功!唉,小马哥的性格,不懂韬光养晦,只想遥遥领先!
悦哥
聪明和智慧是两码事,中国有句俗语:聪明翻山了!不是夸奖是贬义
Nov、Felix
马斯克和梁文锋各有所长。马斯克说最聪明是战略营销,梁文锋还有后手。
兰若寺黑山姥姥
开源的,不怕别人测试就随你吹,是驴是马拉出来蹓蹓!
汤小沫
GROK3翻译成中文“狗肉3”[捂脸哭]
kya_墨
明天deepseek概念股得暴跌了[捂脸哭]
暖冬
Deeo的伟大在于绕过cuda,性能最不最优可以不断更新产品,但是解决了中国拿不到最好的芯片,还有芯片后门的问题。
Free sparrow
我相信马斯克,人家的科技不是吹牛逼的。实实在在。
我是民政局
为什么不公布训练成本?
娜娜娜子nana
中国ai大模型一开源,美国的ai都变聪明了[呲牙笑]
米球球
我用Deep Seek問了一下....從實用的角度,如何客觀評價Grok3 引入了思维链推理技术,另與DEEP SEEK兩者比較孰優孰劣呢?DS回答的很客觀很有啟發性喔!
序.末
前面有十万张H100,二十加了二十万张H200的卡……
ζ夕颜若沐ψΩ
超越了是一回事,能便宜落地也同样重要,有便宜过deepseek吗?