【TechWeb】2月18日消息,据外媒报道,马斯克领导的人工智能初创公司xAI,在今日中午发布了他们Grok系列新一代的大语言模型Grok-3。

从外媒的报道来看,xAI新发布的Grok-3大模型,预训练在今年1月初就已完成,仍在持续改进中。
就xAI在发布中公布的消息来看,Grok-3有Grok-3和Grok-3 mini两个版本,在数学、科学、编码等测试中,都强于此前已发布的其他主流大模型,包括OpenAI o3 mini、OpenAI o1、DeepSeek R1、谷歌Gemini-2。
Grok-3和Grok-3 mini多方面的能力超过OpenAI o3 mini、DeepSeek R1等,也同马斯克此前公布的消息一致。上周在迪拜的一次峰会上宣布Grok-3将在未来一到两周发布时,马斯克就曾透露Grok 3有非常强的推理能力,在他们内部已进行的测试中,超过了其他任何已推出的大语言模型。而在当地时间周日宣布Grok-3的发布时间时,马斯克也在社交媒体上表示Grok 3将是地球上最聪明的人工智能。
对于新发布的Grok-3,外媒在报道中还提到是在超过10万块英伟达H100上训练的,xAI也已开始部署英伟达更先进的B100,性能是H100的4倍。
随着Grok-3的发布,xAI的Grok系列大模型也就来到了第四代。

xAI是在2023年的7月12日宣布成立的,在成立次月的18日,他们就在官网宣布完成了首个旗舰大模型Grok-0的训练,有330亿参数;同年11月3日,他们宣布了Grok-1模型;在去年8月13日,他们推出了推理能力更强的Grok-2,更小但能力不俗的Grok-2 mini也在当天一并推出。
从2023年8月18日宣布完成Grok-0,到今日发布Grok-3,中间仅间隔18个月,距他们宣布成立也不到20个月。
而除了Grok-0、Grok-1、Grok-2和Grok-3,xAI在去年3月28日和4月12日还曾分别推出Grok-1.5、Grok-1.5V,前者增加了长文本能力,后者则是增加了视觉能力,可以根据交错的自然语言和图像进行推理。
随着Grok-3的推出和更多算力芯片的到位,xAI在大模型的研发上也就有了更强的能力,他们后续也还将推出更多能力更强的大模型。(海蓝)