“马斯克发布疯狂进化的AI模型:Grok 3”
xAI发布Grok 3模型

最近,马斯克的人工智能公司xAI公布了其大型语言模型聊天机器人的全新升级版-Grok 3,马斯克将其称为地球上最智能的人工智能。
在Colossus数据中心训练,拥有20万块H100

Grok 3在田纳西州孟菲斯的Colossus数据中心进行训练。马斯克透露,该中心目前总共运行在20万块英伟达H100 GPU芯片上,是2024年夏天Colossus推出时 GPU 数量的两倍,马斯克仅用 92 天就完成了扩展。Grok 3的训练计算能力比其前身Grok 2高出大约10倍。
仅训练19天就上线,性能领先其他模型

利用Colossus基础设施,xAI仅用19天就让Grok 3上线,而这一过程在其他公司需要4到6个月的训练时间。马斯克强调,Grok 3仍处于开发阶段,训练过程仍在进行中,目前发布的只是Beta版本。Grok 3每天都会改进,大约需要一周时间才能对其真实表现做出适当的判断。但即使是现在,Grok 3也领先于其他所有AI模型。
聊天机器人竞技排名第一

Grok 3不仅在综合基准测试得分上领先业界,还在聊天机器人竞技场中名列前茅。这是人类用户仅根据其原始输出对不同语言模型的性能进行的排名。xAI以化名Chocolate 将 Grok 3 添加到聊天机器人竞技场中,因此早期的测试者都不知道这个模型是什么或是谁制作的,但他们确实将Grok 3评为聊天机器人竞技场中每个类别中表现最高的,紧随其后的是谷歌的 Gemini,OpenAI ChatGPT 位居第三。
增加Deep Search功能,当前性能低于ChatGpt

除了传统的聊天机器人功能外,Grok 3还引入了两个新功能DeepSearch和Think。深度研究是人工智能领域的新事物,OpenAI和Perplexity都发布了此功能,它是新的代理人工智能的一种。与传统的大语言模型不同,深度搜索将执行多次网络搜索,汇总数十个来源,然后生成带有引文的详细报告。使用ChatGPT上的深度研究功能最多需要30分钟,AI将提供一份长达1万字的报告。Grok 3在这个特定类别中尚未达到这个水平,但这可能是xAI仍在努力的事情之一。
增加Think功能,展示推理过程

Grok 3中的Think功能解锁了一个推理模型,这是当前人工智能系统的另一大趋势。这迫使聊天机器人以与人类相同的方式思考其响应。它会考虑多种可能性,它会对潜在答案进行事实核查,并在提供最佳响应的过程中验证信息。人工智能还会展示它在确定答案的过程中所做的步骤和计算,以便用户可以查看和验证得出该答案所需的推理路线。
当前使用成本较高

这两项新功能对于打造可靠、真实的人工智能而言都是一大进步。马斯克表示,这仍然是Grok的首要任务。他在直播中表示,Grok会最大限度地寻求真相,即使这种真相并不符合政治正确。新版本Grok唯一的缺点是成本相对较高,目前只有X上的 Premium Plus订阅用户可以体验,而订阅价格已上涨至每月 40 美元。
Grok 3仍在疯狂进化中

Grok 3仍在疯狂进化,更多功能即将推出。几天之内Grok 3应该能够理解八种语言的语音提示;大约一个月后新的API将可供开发人员在Grok 3模型上构建应用程序;今年第三季度 Grok将拥有多智能体协作功能,这意味着Grok 3可以成为个人数字助理,并同时自主地执行各种各样的任务。