马斯克发布疯狂进化的AI模型：Grok3

“马斯克发布疯狂进化的AI模型：Grok 3”

xAI发布Grok 3模型

最近，马斯克的人工智能公司xAI公布了其大型语言模型聊天机器人的全新升级版-Grok 3，马斯克将其称为地球上最智能的人工智能。

在Colossus数据中心训练，拥有20万块H100

Grok 3在田纳西州孟菲斯的Colossus数据中心进行训练。马斯克透露，该中心目前总共运行在20万块英伟达H100 GPU芯片上，是2024年夏天Colossus推出时 GPU 数量的两倍，马斯克仅用 92 天就完成了扩展。Grok 3的训练计算能力比其前身Grok 2高出大约10倍。

仅训练19天就上线，性能领先其他模型

利用Colossus基础设施，xAI仅用19天就让Grok 3上线，而这一过程在其他公司需要4到6个月的训练时间。马斯克强调，Grok 3仍处于开发阶段，训练过程仍在进行中，目前发布的只是Beta版本。Grok 3每天都会改进，大约需要一周时间才能对其真实表现做出适当的判断。但即使是现在，Grok 3也领先于其他所有AI模型。

聊天机器人竞技排名第一

Grok 3不仅在综合基准测试得分上领先业界，还在聊天机器人竞技场中名列前茅。这是人类用户仅根据其原始输出对不同语言模型的性能进行的排名。xAI以化名Chocolate 将 Grok 3 添加到聊天机器人竞技场中，因此早期的测试者都不知道这个模型是什么或是谁制作的，但他们确实将Grok 3评为聊天机器人竞技场中每个类别中表现最高的，紧随其后的是谷歌的 Gemini，OpenAI ChatGPT 位居第三。

增加Deep Search功能，当前性能低于ChatGpt

除了传统的聊天机器人功能外，Grok 3还引入了两个新功能DeepSearch和Think。深度研究是人工智能领域的新事物，OpenAI和Perplexity都发布了此功能，它是新的代理人工智能的一种。与传统的大语言模型不同，深度搜索将执行多次网络搜索，汇总数十个来源，然后生成带有引文的详细报告。使用ChatGPT上的深度研究功能最多需要30分钟，AI将提供一份长达1万字的报告。Grok 3在这个特定类别中尚未达到这个水平，但这可能是xAI仍在努力的事情之一。

增加Think功能，展示推理过程

Grok 3中的Think功能解锁了一个推理模型，这是当前人工智能系统的另一大趋势。这迫使聊天机器人以与人类相同的方式思考其响应。它会考虑多种可能性，它会对潜在答案进行事实核查，并在提供最佳响应的过程中验证信息。人工智能还会展示它在确定答案的过程中所做的步骤和计算，以便用户可以查看和验证得出该答案所需的推理路线。

当前使用成本较高

这两项新功能对于打造可靠、真实的人工智能而言都是一大进步。马斯克表示，这仍然是Grok的首要任务。他在直播中表示，Grok会最大限度地寻求真相，即使这种真相并不符合政治正确。新版本Grok唯一的缺点是成本相对较高，目前只有X上的 Premium Plus订阅用户可以体验，而订阅价格已上涨至每月 40 美元。

Grok 3仍在疯狂进化中

Grok 3仍在疯狂进化，更多功能即将推出。几天之内Grok 3应该能够理解八种语言的语音提示；大约一个月后新的API将可供开发人员在Grok 3模型上构建应用程序；今年第三季度 Grok将拥有多智能体协作功能，这意味着Grok 3可以成为个人数字助理，并同时自主地执行各种各样的任务。