具身智能需要什么?一场学术年会的讨论给出了一些思考

极客公园 2025-01-03 12:21:23

作者 | Li Yuan

编辑 | 郑玄

最近几个月,中国机器人的进展引起了全世界的关注。

先是 11 月的珠海航展,无人机、无人车、机器狼引起了全球「极客」的讨论,就连马斯克都忍不住转发无人机蜂群表演并评论载人装备已经过时;最近几天,他又点赞了宇树科技新发布的 B2-W 机器狗,火遍全网的视频中,这只中国机器狗各种体操动作、上下坡飞跃不在话下,人们纷纷惊叹这家成立刚满八年的中国公司已经超越了波士顿动力。

从「靠开源吃饭」到「遥遥领先」,技术的不断迭代,让市场有了态度鲜明的转变,这似乎也让我们窥视到了中国机器人赛道弯道超车的可能。

不过,在最近在参加一些专业活动和业界学界进行交流时,笔者总能听到一些新的共识:机器人的未来,技术决定产业的下限,「场景+需求」是未来的上限。

01

一场挑战赛看到未来人的期待:

极限犹可突破,至真亦不可止

上周五,美团机器人研究院在深圳举办了学术年会。

会上,一个细节让笔者印象深刻:一支叫做「参与就很棒」的队伍获得了一项专业奖。颁奖嘉宾调侃道:「队伍的名字还是要好好起,说不定获奖了就要『社死』。」不过,这个名字或许比在场的许多其他队伍的名字,更贴近比赛的本质。

低空经济是当前机器人应用的重要领域之一,也是国家重点发展的领域,潜力毋庸置疑。对于无人机的学术研究,尤其是对于有想法的在校生而言,能够在落地场景验证想法十分重要,但多数的现实是技术找不到场景去验证。

通过美团的低空经济智能飞行管理挑战赛,学生们获得了难得将想法在大范围场景验证的尝试机会——大赛提供美团研发的仿真环境,可模拟多架无人机在城市及无人机机场环境中同步运行。

模拟的基础,同时也是这家公司搞挑战赛的底气,就是近年来的海量投入和应用:比如无人机应用,一个典型的场景来自「低空之城」深圳:今年在深圳,官方统计数据是 1-11 月市内低空无人机载货飞行 62.6 万架次,同期美团无人机的数字是送了近 20 万订单,飞行架次接近 40 万架次。不难计算,在深圳的天空,每 3 次送货飞行,大约会有 2 次需要美团无人机完成,这家公司的飞行总量是其他公司总和的两倍。

订单背后意味着数据,在数据获取难度远超其他的当下,吸引力不言自明:一场挑战赛,其实是一次真正的「参与」就很棒的机会。

此次低空经济挑战赛议程设置,也十分有趣。整个比赛分成性能赛和创意赛两大部分:性能赛中参赛队面对确定地图环境下的配送场景,物流订单需求会在地图上随机产生。选手开发并提交规划算法,高效、安全完成机场地面调度、起降、城市配送任务,并避免碰撞等极端情况。创意赛则鼓励参赛者设计创新型无人机应用及飞行管理方案,激发技术在前沿场景中的潜力。

王健丞所在的 nROS 团队是性能赛的获胜冠军。

为了获得性能赛的胜利,nROS 团队设计出了一张「蒙娜丽莎」拓扑图。

「我们选用了拓扑图作为我们的高效的地图表征方式,并添加了许多功能节点作为交通管理的模块。通过周期推演来计算出了最优的拓扑地图的降落点的位置。」王健丞介绍道。「为了获得更高的分数,我们最后的送餐航线是选择最短路径,而返航航线选择的则是较为安全的航线。」

图片来源:网络

在一次次的算法优化中,nROS 团队学到了在课本上学不到的许多知识:例如,他们发现无人机进出工作台时,如果路线垂直,协同作业的 AGV 小车会延迟约 4 秒才能进入工作台。基于这一观察,他们调整了装货方式,提高了效率。

「当我们拿到 1 万分的时候,我们曾以为这就不错了;后来拿到 13,000 分,我们觉得这可能是极限;再到 15,000 分时,我们几乎不敢想还能再往前走 。但最终,我们没有停下脚步,突破了 17,000 分。」 王健丞认为这是他们队训「极限犹可突破,至真亦不可止」最好的诠释。

创意赛的表现同样精彩,SkyMinds 天马行空队 凭借一套面向全流程无人配送场景的系统设计夺冠。

在无人机配送的最后 100 米的难点配送环节,SkyMinds 天马行空队使用了团队自己的双臂机器人,使用视觉传感的方法自主导航到用户的指定地点,使用端到端模仿学习的算法实现复杂场景的打包操作,并对弱光环境进行了优化。这种成熟的方案令人难以相信是由在校生完成的。

「你们为什么不把线上系统多开三个月?」比赛结束后,这几乎成为参赛者们的统一呼声。3 个月的时间让他们意犹未尽,许多团队希望能够有更多机会深入优化和测试自己的方案,庞大的真实场景需求,第一次让技术从生活中来,到生活中去。

为了留住人才,美团机器人研究院自然响应呼声,从明年的比赛开始,系统开放时间延长至 6 个月。同时,表现优异的队伍还将获得参与线下实际飞行操演的机会,进一步检验他们的技术在真实场景中的表现。

02

具身智能,

真正缺的是产业化的场景

当然,如果说年轻人的挑战赛,比拼的是潜力和想象力,那会上「老炮」们的讨论,可能关乎的是当下探索者们发展路径的选择。

毋庸讳言,2024 年,机器人领域细分出的具身智能,已经成为当前科技领域的一个大热词。无论是从学术的快速发展,到产业的融资落地,具身智能都开始表现出极大的潜力。

会上,银河通用创始人王鹤、星海图首席科学家赵行、清华大学交叉信息研究院助理教授吴翼等正在学术和产业交叉领域进行探索的前沿专家,进行了观点的碰撞。

在一年的产业狂奔后,被问到机器人行业目前最大的卡点是什么,各位的答案出乎意料地一致:不是机器人本体,不是智能算法,而是商业落地,是需求和场景。

正如前文所述,商业落地会带来真实世界的数据。在人工智能的赛道上,有真实世界的数据,才能让算法更好地迭代,获得进一步的智能。

王鹤用了一个很好的对比:「自动驾驶和具身智能在技术上很接近,但是在商业上,则完全不同。自动驾驶是一个典型的热启动。你把车卖出去以后,有用户替你开。每一个能卖出去车的车企,后续都能获得海量数据,进一步优化自动驾驶算法。机器人,则完全不同。一个机器人,如果开头不够有能力,一开始就没办法卖出去,卖出去了因为能力不足,也不会有多少真实场景的数据回传,那数据和算法的相互驱动能力就会大大降低,闭环也无法建立。」

图片来源:网络

如何解决,恐怕要产业和学术界一起努力。

对于学术界而言,实现商业化本身,可能有两点比较重要:首先是让机器人先达到一定的可用能力。银河通用目前正在聚焦于使用合成数据,先让机器人获得一定的基础抓取能力,再进入产业界。星海图则正在聚焦少样本的预训练——做更大规模的预训练,让机器人在学习新任务的时候通过三五个样例,就能获取新的技能。

第二点,是安全问题。让机器人部署到人类环境中,与人类共同进步而不产生危害,也是商业化的一个关键重点。

「在装修房子的时候,我们现在都会说给洗碗机留一个空间。什么时候,我们意识到这个地方需要有个电源留给机器人,大家愿意为它留一个改造的空间,人机共生的时代可能才会真正开始。」星海图首席科学家赵行表示。

产业界的推动也同样重要。什么样的场景,才是机器人能快速落地的场景?

或许是更简单的场景。吴翼举了一个我们日常生活中常见的场景——在家找不到东西,给妈妈打电话确认物品位置,最后找到。「这是一个大家看起来稀松平常的事,但是如果机器人要完成的话,首先需要理解比如『东西在白色箱子后面』这个语言在现实世界中意味着什么。同时它要能够做到视觉上的空间理解,做到现实中的定位和导航。涉及到人机交互还需要记忆、交互能力、理解、推理,需要自主地知道问出怎样的问题。」

图片来源:网络

这并不简单。

王鹤则直接指出:「现在不用看需求,直接看什么能做就可以。我认为最快能落地的,就是做粗活。」所谓的做粗活,就是指在环境中导航、移动,抓取、放置。

「这些粗活的场景本身对成功率要求不会极为苛刻——比如自动驾驶目前仍然不能很好地应用,其中一个重要问题是,自动驾驶失败了,是会撞死人的,但简单的粗活,则不存在这样的问题。」王鹤表示。

这样的场景,刚好在我们的日常生活中就很常见。

「比如很多 24 小时业态的前置仓零售店,需求很大。它的活又很简单,就是把一个东西从架子上抓下来,然后放在桌子上给快递员。」王鹤表示,「这就是一个很好的场景。」

王鹤表示,银河通用已经与一些平台达成合作,明年将在更多场景中,启动机器人的规模化场景落地。「具身智能现在的状态就像 2013 年的新能源汽车。我们的目标是,在五年内实现 1 万台人形机器人能够自主在实际场景中工作。」

03

在学术与场景的双向反哺中,

平台要做桥梁

一场年会,笔者看到了学术获益于场景的同时,也在反哺场景。这或许就是机器人未来发展的路径指引。

作为大会的东道主,每年办一届学术年会,美团或许也是看到了相同的未来。

据美团机器人研究院秘书长刘硕介绍,美团有很多产业界的同行,也有很多在学术界的合作伙伴。之所以成立机器人研究院,正是希望成为产业界和学术界的桥梁,为机器人科技创新与落地应用提供土壤。

「这其中有两个意义。第一是产业界有应用场景,可以牵引学术界的定向研发;第二在于通过给学术界提供经费、场景、工程资源,让学术成果尽快形成产业转化。」她说。

她还分享了一个来自美团的感悟:美团无人机目前运送了超过 40 万单的真实客户订单,飞行架次接近 100 万次,已经达到了非常密集的高频次的飞行。

这样的成绩背后,一部分原因就是「产学研用」合作,推动无人机自主避障的发展。「百万架次的时候,挑战场景其实在平常想都想不到的,我们见过风筝、气球,高楼擦窗的安全绳,我们甚至见过很多好奇的游客的消费无人机,试图在拍摄我们自己的无人机等等。如何发现并解决这些边缘案例?」

除了收集真实场景的数据,美团机器人研究院也在不断发展仿真技术,并和学术界合作解决问题。

例如,在和清华大学深圳国际研究生院的丁文伯团队的合作中,双方就使用了一个 Multi-Game Decision Transformer 的架构,用人工智能找到无人机飞行的边缘案例。

「以我们现在的技术能力,一个专业测试团队,需要用好几个月的时间,才能找到难倒我们规划调度系统的两个难题。但通过人工智能,找边缘案例的速度提升了九倍。」刘硕介绍道,「这让我们能更快地解决一些边缘案例和疑难场景,更好地保障无人机的飞行。」

在自主智能的提升下,美团无人机的技术,今年也在国际上得到了认可,首次在海外拿到了第一张在城市场景的无人机送货的许可证。

图片来源:网络

以管窥豹,在具身智能赛道,需求与场景并存的美团,同样有希望成为学术和场景双向反哺的桥梁。

毕竟在很多与会者看来,过往观念里,机器人的潜力更多被放在工业领域中,视作工厂自动化的主力军。但在人口红利逐渐消失的背景下,人们开始希望通过它从事那些危险、重复、高强度的工作。而随着具身智能技术的进展,新的场景会更多出现在美团擅长的本地生活、即时配送等领域中。这些有趣有价值的应用,会让大家的生活品质得到改善和提升,成为真实的市场需求。

「现在的市场,总在担心机器人的安全和价格,担心人类失去工作,担心机器人的伦理道德……但有一天大家在生活当中真的用到了好产品、好服务,可能剩下的只会是一句,『真香』。」一位参会者道出了别样的「真相」。

*头图来 源:视觉中国

0 阅读:10
极客公园

极客公园

极客公园是一个关注互联网创新的社区。