根据英伟达方面的数据,Llama 3.1多语种大语言模型(LLM)集合是一个具有8B、70B和405B三种参数规模的生成式AI模型集合。当与适用于Llama 3.1 405B的NVIDIA NIM推理微服务结合使用时,NeMo Retriever NIM微服务可以为RAG工作流中的开放和商业文本问答带来极高的检索准确性。NVIDIA AI Foundry能提供一种可用于快速构建自定义超级模型的端到端服务。根据英伟达的说法,借助NVIDIA AI Foundry,企业能使用Llama 3.1模型和NVIDIA NeMo平台(包含在Hugging Face RewardBench上排名第一的NVIDIA Nemotron-4 340B Reward模型)创建自定义模型;还可以使用自有数据以及由Llama 3.1 405B和NVIDIA Nemotron Reward模型生成的合成数据,来训练这些超级模型。创建自定义模型后,企业可构建NVIDIA NIM推理微服务,以便在其首选的云平台和全球服务器制造商提供的NVIDIA认证系统上,使用自己选择的最佳机器学习运维(MLOps)和人工智能运维(AIOps)平台在生产中运行这些模型。英伟达创始人兼首席执行官黄仁勋提出,Llama 3.1开源模型标志着全球企业采用生成式AI的关键时刻已经到来,Llama 3.1将掀起各个企业与行业创建先进生成式AI应用的浪潮。
![](http://image.uc.cn/s/wemedia/s/upload/2024/eacdc96352a418fdbc9824337cf4f892.jpg)