英伟达推出全新AI模型，性能表现优于GPT-4

🤖 由文心大模型生成的文章摘要

前文介绍了英伟达发布一款名为Llam

英伟达悄然发布了一款全新人工智能模型，其性能表现优于OpenAI和Anthropic的产品，标志着该公司人工智能战略的重大转变，并可能重塑该领域的竞争格局。

该模型名为“Llama-3.1-Nemotron-70B-Instruct”，低调亮相于热门人工智能平台Hugging Face，并因其在多项基准测试中的出色表现而迅速引起人们的关注。

英伟达称，新产品在关键评估中取得了最高分，包括Arena Hard基准测试85.0分、AlpacaEval 2 LC 57.6分和GPT-4-Turbo MT-Bench 8.98分。

这些分数超过了GPT-4o和Claude 3.5 Sonnet等备受推崇的模型，使英伟达跃居AI语言理解和生成的前沿。

此次发布对英伟达来说是一个关键时刻。该公司主要以图形处理单元主导地位而闻名，GPU为AI系统提供支持，现在该公司展示了其开发复杂AI软件的能力。此举标志着一项战略扩张，可能会改变AI行业的动态，挑战以软件为中心的公司在大型语言模型开发领域的传统主导地位。

英伟达创建Llama-3.1-Nemotron-70B-Instruct的方法包括使用先进的训练技术（包括从人类反馈中进行强化学习来改进Meta开源Llama 3.1模型。这种方法允许人工智能从人类偏好中学习，从而可能带来更自然、更符合情境的响应。

凭借其卓越的性能，该型号有可能为企业提供比市场上一些最先进型号更强大、更具成本效益的替代方案。

该模型无需额外提示或专门的标记即可处理复杂查询，这是它与众不同之处。在演示中，该模型正确回答了“Strawberry中有多少个r？”这个问题，并给出了详细而准确的回答，展示了对语言的细致理解和提供清晰解释的能力。

这些结果之所以特别重要，是因为我们强调“一致性”，这是人工智能研究中的一个术语，指的是模型的输出与用户的需求和偏好的匹配程度。对于企业来说，这意味着更少的错误、更多有用的响应，以及最终更高的客户满意度。

世良情感网