7 月 29 日,NVIDIA宣布为全球领先的机器人制造商、AI模型开发者和软件制造商提供一套服务、模型以及计算平台,以开发、训练和构建下一代人形机器人。
整套产品包括用于机器人仿真和学习的全新NVIDIA NIM微服务和框架、用于运行多阶段机器人工作负载的NVIDIA OSMO编排服务,以及支持AI和仿真的远程操作工作流,该工作流允许开发者使用少量人类演示数据来训练机器人。
NVIDIA创始人兼首席执行官黄仁勋表示:“AI 的下一波浪潮是机器人,其中最令人兴奋的发展之一是人形机器人。我们正在推进整个NVIDIA机器人堆栈的发展,面向全球人形机器人开发者和公司开放访问,让他们能够使用最符合其需求的平台、加速库和AI模型。”
借助 NVIDIA NIM 和 OSMO 加速开发
NIM微服务提供了由 NVIDIA 推理软件提供支持的预构建容器,使开发者能够将部署时间从数周缩短到几分钟。机器人专家将能够通过两项新的AI微服务,在NVIDIA Isaac Sim(基于 NVIDIA Omniverse平台构建的机器人仿真参考应用)中增强生成式物理AI仿真工作流。
MimicGen NIM微服务可根据Apple Vision Pro等空间计算设备记录的远程操作数据,生成合成运动数据。Robocasa NIM微服务可在OpenUSD(一个用于在 3D 世界中进行开发和协作的通用框架)中生成机器人任务和仿真就绪环境。
现已推出的NVIDIA OSMO是一项云原生托管服务,允许用户跨分布式计算资源来协调和扩展复杂的机器人开发工作流,无论是在本地还是在云端。
OSMO大大简化了机器人训练和仿真工作流,将部署和开发周期从数月缩短到一周内。用户可以对各种任务进行可视化管理,包括合成数据生成、模型训练、强化学习以及大规模的人形机器人、自主移动机器人和工业机械臂软件在环测试。
为人形机器人开发者提供先进的数据捕获工作流
训练人形机器人的基础模型需要大量的数据。远程操作是获取人类演示数据的方法之一,但这个过程正变得越来越昂贵和漫长。
通过在SIGGRAPH计算机图形大会上展示的NVIDIA AI和Omniverse远程操作参考工作流,研究者和 AI 开发者能够从极少量远程捕捉的人类演示中生成大量合成运动和感知数据。
首先,开发者使用Apple Vision Pro捕获少量远程操作演示,随后在NVIDIA Isaac Sim 中仿真这些录像,并使用MimicGen NIM微服务基于录像生成合成数据集。
开发者可以使用真实数据和合成数据对Project GR00T人形机器人基础模型进行训练,以节省时间和降低成本。然后,他们可以使用Isaac Lab中的Robocasa NIM微服务(一个机器人学习框架)来生成经验并重新训练机器人模型。在整个工作流中,NVIDIA OSMO 将计算任务无缝地分配给不同的资源,为开发者减少了数周的管理工作量。
通用机器人平台公司傅利叶看到了使用仿真技术综合生成训练数据的优势。傅利叶首席执行官Alex Gu表示:“人形机器人的开发极其复杂,这项工作需要从现实世界中繁琐地获取大量真实数据。NVIDIA 的全新仿真和生成式 AI 开发者工具将有助于引导和加速我们的模型开发工作流。”
扩大 NVIDIA 人形机器人开发者技术的访问渠道
NVIDIA 提供了三个计算平台来简化人形机器人的开发,分别是:用于训练模型的NVIDIA AI超级计算机;基于Omniverse构建的NVIDIA Isaac Sim,使机器人可以在仿真世界中学习和完善技能;以及用于运行模型的NVIDIA Jetson Thor人形机器人计算机。开发者可以根据具体需求来访问和使用全部平台或其中的任何部分。
通过新的NVIDIA人形机器人开发者计划,开发者可以提前获取这些新产品以及最新版本的NVIDIA Isaac Sim、NVIDIA Isaac Lab、Jetson Thor和Project GR00T通用人形机器人基础模型。
首批加入早期访问计划的企业有1x、波士顿动力公司、字节跳动ByteDance Research、Field AI、Figure、傅利叶、银河通用、逐际动力、Mentee、Neura Robotics、星动纪元和Skild AI。
波士顿动力公司首席技术官Aaron Saunders表示:“波士顿动力公司与 NVIDIA 在推动机器人技术发展方面有着悠久的密切合作历史。我们非常高兴看到这项工作的成果正在加速整个行业的发展。而要想获得最先进的技术,早期访问计划无疑是最佳的途径。”