北京时间今日中午 12 时,科技界的目光再次聚焦于埃隆・马斯克旗下的人工智能公司 xAI。在这一时刻,xAI 正式发布了其最新一代大模型 ——Grok 3,引发了广泛的关注与讨论。
马斯克对 Grok 3 给予了极高的评价,他宣称 Grok 3 的能力相较于前代产品 Grok 2 实现了 “数量级” 的飞跃。同时,马斯克强调 Grok 3 是一款执着于 “追求极致真实” 的人工智能,即便这种对真实的追求有时会与所谓的 “政治正确” 产生冲突。
在关键的性能表现方面,Grok 3 展现出了令人瞩目的实力。在数学推理、科学逻辑推理以及代码写作等多个重要领域,通过一系列严格的 benchmark 测试,Grok 3 的成绩均超越了 DeepSeek-v3、GPT-4o、Gemini-2 pro 等强劲对手。尤其是在 AIME(用于评估模型在数学问题上的表现)和 GPQA(对模型在博士级别物理、生物和化学问题上的能力进行测试)等专业测试中,Grok 3 的表现尤为突出,成功超越了 GPT-4o。此外,Grok 3 的早期版本在 Chatbot Arena 这个独特的众包测试平台上也有出色的发挥。在该平台上,不同的 AI 模型相互竞争,由用户投票选出更优的回答,Grok 3 早期版本凭借出色的表现脱颖而出。
值得一提的是,Grok 3 并非单一的模型,而是一个庞大的模型家族。其中,较小版本的 Grok 3 mini 具有独特的优势,它能够在适当牺牲一定准确性的前提下,实现更快的问题回答速度,满足用户在不同场景下的需求。目前,Grok 3 模型家族中的部分版本尚未正式上线,这也引发了外界对于其后续表现的更多期待。
Grok 3 的成功研发离不开强大的硬件支持。据介绍,xAI 借助强大的 Colossus 超级计算机,大幅缩短了 Grok 3 的开发周期。Colossus 超级计算机仅用了八个月的时间便完成建设,其强大的计算能力为 Grok 3 的开发提供了坚实的基础。在开发过程中,Grok 3 使用了 10 万个英伟达 H100 GPU,随后更是扩展到了 20 万个,累计训练时长达到了惊人的 2 亿 GPU 小时,这一规模是前代产品 Grok 2 的十倍之多。如此大规模的计算能力投入,使得 Grok 3 不仅能够在更短的时间内处理海量的数据集,还显著提升了模型的准确性。
除了硬件上的巨大投入,xAI 团队在软件层面也进行了深度优化。通过对训练流程的改进,引入合成数据集、自我纠错以及强化学习等先进技术,Grok 3 的性能得到了进一步提升。这些技术的综合应用,使得 Grok 3 在处理复杂任务时更加得心应手,表现更为出色。
Grok 3 的两个变体版本 ——Grok 3 Reasoning 和 Grok 3 mini Reasoning,具备了类似 OpenAI 的 o3-mini 和 DeepSeek 的 R1 等 “推理” 模型的能力,能够在回答问题前进行深入的 “思考”,并对事实进行彻底核查,从而有效避免了一些常见的错误,这使得 Grok 3 在处理复杂问题时更加可靠。xAI 公司还特别指出,Grok 3 Reasoning 在多个流行基准测试中超越了 o3-mini 的最佳版本 o3-mini high,包括全新的 AIME 2025 数学基准测试。用户可以通过 Grok 应用访问推理模型,并且在遇到较难问题时,还可以使用 “Big Brain” 模式进行更深入、更谨慎的推理,这一模式在处理数学、科学和编程相关问题时表现尤为出色。
然而,xAI 也坦诚地表示,Grok 3 的推理模型目前仍处于测试阶段(Beta 版),并且还在持续训练中。此外,Grok 3 还引入了一项名为 “DeepSearch” 的创新功能,这是一种新型的搜索引擎,能够扫描互联网和 X 平台上的海量信息,并以简洁的摘要形式回应用户的查询,为用户提供更加便捷、高效的信息获取方式。
马斯克此前发布的一段视频,阐述了 xAI 和 Grok 的使命 —— 理解宇宙的本质。然而,在此次发布中,原计划推出的语音模式并未如期上线。马斯克在 X 平台上确认了这一情况,并解释称:“语音模式目前还存在一些问题,预计将在大约一周后推出,但它非常出色。”
在产品的体验与服务方面,X 平台的 Premium + 订阅用户将率先体验到 Grok 3 的强大功能。而其他一些高级功能则被整合到 xAI 推出的名为 SuperGrok 的订阅服务中。SuperGrok 的订阅价格为每月 30 美元或每年 300 美元,用户订阅后可获得额外的推理和 DeepSearch 查询权限,以及无限量的图像生成功能,为用户提供更加丰富、个性化的使用体验。
马斯克还透露,Grok 将在未来一周内推出备受期待的 “语音模式”,并且在几周后,Grok 3 模型和 DeepSearch 功能将被整合到 xAI 的企业 API 中,进一步拓展 Grok 3 的应用场景和商业价值。
此外,xAI 还公布了一项重要的开源计划。马斯克表示:“我们的总体策略是,在下一个版本完全推出后,开源上一个版本。当 Grok 3 成熟稳定后,大概在未来几个月内,我们将开源 Grok 2。” 这一计划不仅展示了 xAI 对自身技术的信心,也有望为人工智能领域的发展做出更大的贡献。
此次 Grok 3 的发布正值马斯克与 OpenAI 之间的竞争不断升级之际。双方之间的矛盾不仅体现在法律诉讼和激烈的口水战上,最近马斯克更是对 OpenAI 发起了无邀约的 974 亿美元收购提案,这一系列事件使得科技界对于人工智能领域的竞争态势更加关注。Grok 3 的发布无疑将为这场竞争增添新的变数,也让人们对未来人工智能的发展充满了期待。