大模型从Grok-0到Grok-3马斯克旗下xAI仅用了18个月

替迟科技 2025-02-21 02:52:32

【TechWeb】2月18日消息，据外媒报道，马斯克领导的人工智能初创公司xAI，在今日中午发布了他们Grok系列新一代的大语言模型Grok-3。

从外媒的报道来看，xAI新发布的Grok-3大模型，预训练在今年1月初就已完成，仍在持续改进中。

就xAI在发布中公布的消息来看，Grok-3有Grok-3和Grok-3 mini两个版本，在数学、科学、编码等测试中，都强于此前已发布的其他主流大模型，包括OpenAI o3 mini、OpenAI o1、DeepSeek R1、谷歌Gemini-2。

Grok-3和Grok-3 mini多方面的能力超过OpenAI o3 mini、DeepSeek R1等，也同马斯克此前公布的消息一致。上周在迪拜的一次峰会上宣布Grok-3将在未来一到两周发布时，马斯克就曾透露Grok 3有非常强的推理能力，在他们内部已进行的测试中，超过了其他任何已推出的大语言模型。而在当地时间周日宣布Grok-3的发布时间时，马斯克也在社交媒体上表示Grok 3将是地球上最聪明的人工智能。

对于新发布的Grok-3，外媒在报道中还提到是在超过10万块英伟达H100上训练的，xAI也已开始部署英伟达更先进的B100，性能是H100的4倍。

随着Grok-3的发布，xAI的Grok系列大模型也就来到了第四代。

xAI是在2023年的7月12日宣布成立的，在成立次月的18日，他们就在官网宣布完成了首个旗舰大模型Grok-0的训练，有330亿参数；同年11月3日，他们宣布了Grok-1模型；在去年8月13日，他们推出了推理能力更强的Grok-2，更小但能力不俗的Grok-2 mini也在当天一并推出。

从2023年8月18日宣布完成Grok-0，到今日发布Grok-3，中间仅间隔18个月，距他们宣布成立也不到20个月。

而除了Grok-0、Grok-1、Grok-2和Grok-3，xAI在去年3月28日和4月12日还曾分别推出Grok-1.5、Grok-1.5V，前者增加了长文本能力，后者则是增加了视觉能力，可以根据交错的自然语言和图像进行推理。

随着Grok-3的推出和更多算力芯片的到位，xAI在大模型的研发上也就有了更强的能力，他们后续也还将推出更多能力更强的大模型。（海蓝）

0 阅读：0