在机器人领域,运动技能一直是衡量机器人能力的重要试金石。
近日,谷歌 DeepMind 研究团队在乒乓球运动中取得了新进展,他们开发出了一个人工智能(AI)驱动的机械臂,能够与业余人类乒乓球选手打得有来有回。
这项研究成果的相关论文已经以预印本的形式发表。研究团队称,“这是第一个能够在人类水平上与人类进行体育运动的机器人智能体,代表了机器人学习和控制领域的一个里程碑。”
(来源:DeepMind)
DeepMind 的这个系统结合了 ABB 公司的 IRB 1100 工业机器人(手臂)和定制的 AI 软件。
这套系统的物理设置包括一个 6 自由度的机械手臂,安装在两条线性轨道上,使其能够自由地水平移动。还用到了高速摄像机,以用于追踪球的位置,而动作捕捉系统则能监测人类对手的球拍动作。
为了创造驱动机器人手臂的“大脑”,DeepMind 研究人员开发了一种“双层级”方法,使机器人能够打出特定的乒乓球技术,同时实时调整策略以适应每个对手的打法风格。
这种方法使得机器人无需针对每个特定玩家进行训练,就能与任何业余人类选手进行比赛。
该系统的架构结合了低级技能控制器(经过训练可执行特定乒乓球技术的神经网络策略,如正手击球、反手回球或发球回应)和高级战略决策者(一个更复杂的 AI 系统,用于分析对局状态,适应对手的风格,并选择为每个来球激活哪个低级技能策略)。
研究人员采用了一种混合方法来训练 AI 模型,在模拟物理环境中使用强化学习,同时将训练数据建立在真实世界的例子基础上。这种技术使机器人能够从大约 17500 个真实世界的乒乓球轨迹中学习。
不过,对于如此复杂的任务来说,这只是一个相对较小的数据集。
研究团队使用了一个迭代过程来完善机器人的技能。他们首先从一个小型的人类对人类的游戏数据集开始,然后让 AI 与真实对手对抗。
每场比赛都会产生关于乒乓球轨迹和人类策略的新数据,研究团队将这些数据反馈到模拟中进行进一步训练。这个过程重复了七个周期,使机器人能够不断适应水平越来越高的对手和多样化的打法风格。
到最后一轮,AI 已经从超过 14000 个回合球和 3000 个发球中学习,创建了一个乒乓球知识体系,帮助它缩小模拟和现实之间的差距。
(来源:DeepMind)
值得注意的是,英伟达也在进行类似的模拟物理系统实验,比如该公司的 AI 智能体 Eureka,允许 AI 模型在模拟空间而不是现实世界中快速学习控制机器人手臂。
这种方法可能会在未来大大减少训练机器人进行复杂交互所需的时间和资源。
在一项涉及 29 名参与者的研究中,这个 AI 驱动的机器人赢得了 45% 的比赛,展示了不错的业余水平实力。
值得注意的是,它对初学者取得了 100% 的胜率,对中等选手取得了 55% 的胜率,只是在面对资深对手时表现不佳。
有趣的是,即使输给机器人的玩家也表示自己很享受这种体验。研究人员指出:“在所有技能组和胜率中,玩家都认同与机器人对打是有趣的和吸引人的。” 这种积极的反应表明 AI 在体育训练和娱乐方面有着广泛的应用前景。
该系统并非没有局限性。它难以处理极快的球或高球,难以识别强烈的旋转,并且在反手球方面表现薄弱。谷歌 DeepMind 分享了一段视频,展示了机器人因难以应对快速击球而输掉一分。
研究人员指出:“为了解决阻碍机器人对快球反应时间的延迟限制,我们建议研究先进的控制算法和硬件优化。这可能包括探索预测模型来预测球的轨迹,或者在机器人的传感器和执行器之间采用更快的通信协议。”
除了打乒乓球,为这个项目开发的技术可以应用于更广泛的机器人任务,这些任务需要快速反应和适应不可预测的人类行为。从制造业到医疗保健,潜在的应用似乎很广泛。
谷歌 DeepMind 团队强调,通过进一步完善,他们相信该系统未来可能有潜力与资深乒乓球选手竞争。
DeepMind 在创造能够击败人类游戏玩家的 AI 模型方面并不陌生,包括 AlphaZero 和 AlphaGo。有了这个最新的机器人智能体,看来这家研究公司正在从游戏转向真正的运动。
围棋、国际象棋和许多电子游戏的顶尖选手已经败给了 AI,也许乒乓球将是下一个。
参考资料:
https://arstechnica.com/information-technology/2024/08/man-vs-machine-deepminds-new-robot-serves-up-a-table-tennis-triumph/
https://techcrunch.com/2024/08/08/google-deepmind-develops-a-solidly-amateur-table-tennis-robot/
运营/排版:何晨龙
klaock
这种机器人有空间死角,朝死角大力猛抽