马斯克旗下xAI发布Grok-2,性能超越Claude3.5Son...

智能也得细细瞧 2024-08-17 15:01:35

Grok-2 是xAI发布具有最先进推理能力的前沿语言模型。此版本包括 Grok 系列的两个版本:Grok-2 和 Grok-2 mini。这两种模型现在都已在 平台上向 Grok 用户发布。

xAI发布 Grok-2 的早期预览版,这是 Grok-1.5 版本的更新模型,具有聊天、编码、文生图和推理方面的前沿功能。同时,推出的 Grok-2 mini,它是 Grok-2 的一款体型虽小但功能强大的兄弟产品。Grok-2 的早期版本已在 LMSYS 排行榜上以“sus-column-r”的名称进行了测试。其表现超过了 Claude 3.5 Sonnet 和 GPT-4-Turbo。

Grok-2 和 Grok-2 mini 目前在 平台上处于测试阶段, Premium 和 Premium+ 用户可以同时使用两种模型:Grok-2 和 Grok-2 mini。通过一系列学术基准对 Grok-2 模型进行了评估,这些基准包括推理、阅读理解、数学、科学和编码。

Grok-2 和 Grok-2 mini 都比之前的 Grok-1.5 模型有显著改进。它们在研究生水平的科学知识 (GPQA)、常识 (MMLU、MMLU-Pro) 和数学竞赛问题 (MATH) 等领域的表现可与其他前沿模型相媲美。此外,Grok-2 在基于视觉的任务方面表现出色,在视觉数学推理 (MathVista) 和基于文档的问答 (DocVQA) 方面表现出色。

Grok-2 是xAI最先进的 AI 助手,具有文本和视觉理解方面的高级功能,集成了来自 平台的实时信息,可通过 应用程序中的 Grok 选项卡访问。

Grok-2 mini 是小巧但功能强大的型号,在速度和答案质量之间取得了平衡。与其前代产品相比,Grok-2 更直观、可操作且功能多样,可执行各种任务,无论是在寻找答案、协作写作还是解决编码任务,Grok-2都能够完美解决。通过与Black Forest Labs合作,xAI正在试验他们的FLUX.1模型(文生图大模型),以扩展 Grok 2在 上的功能。

Grok-2 和 Grok-2 mini 正在 上推出。自 2023 年 11 月宣布 Grok-1 以来,xAI 一直以惊人的速度发展,由一支拥有最高人才密度的小团队推动。现在推出了 Grok-2,使xAI处于 AI 开发的前沿。

0 阅读:0

智能也得细细瞧

简介:感谢大家的关注