人类能“驾驶”的人形机器人,应该长什么样?

机器人讲堂开课了 2024-09-21 18:44:36

在外媒New Scientist的一篇对于NASA 的Valkyrie 机器人报道中,罕见地应用了“control”这个词,提到记者“试驾”了Valkyrie机器人,整个内容的表述让人耳目一新。

如果将人形机器人比作新时代的汽车,那么“驾驶体验感”确实已经成为一个厂商非常值得关注的方向。

▍人形机器人需要考虑什么?

如今在具身智能的语境下,自动驾驶大模型和机器人大模型其实有着一定类似点。例如特斯拉的汽车,所采取Tesla FSD实施视觉信号,然后控制方向盘、油门、刹车,而在擎天柱人形机器人上,同样是通过实施视觉信号、语言,实现下肢的移动,手臂/灵巧手的操作,通过命令指令到实际执行的逻辑如出一辙。

2024 年All-In 峰会上,马斯克刚刚重申了去年在英国布莱切利公园举行的人工智能安全峰会炉边谈话中发表的评论:已经预见到未来人类劳动力将成为过去。马斯克表示,自动驾驶汽车和人形机器人的发展将有助于这种转变,从而可以无限地提高经济增长和生产力。他还回应了发展人形机器人可能对就业带来的影响:“如果你拥有人形机器人,而且当人形机器人的数量没有实际限制时,并且它们可以非常智能地操作,那么它对经济就没有实际影响。”

马斯克不认为仿人化就是人形机器人的终点,他提到,特斯拉通过开发擎天柱机器人,已经了解很多有关人体如何运作以及人体为何会形成这种形状的知识。人类手部大约有 25 个自由度,但如果用人手这种能力要求机器人,其实限制了机器人的强度。正如汽车,作为人类的生产力工具,为什么一定要去类比最原始的人类步行速度或者充当马车。

正如我们前面几篇观点文章中所提到,机器人本身通过多个零件组合实现,或许这就代表着人形机器人可以更快实现超人化,而人类可以作为这些巨大人形机器人的操纵者,正如环太平洋等影视作品中所展现的,机器人会首先成为非常适合人类的具身载体,其次才可能是借助AI等新技术实现更高级的智能化和自主化,正如当下汽车正由人类控制开始走向智能驾驶。

人类、机器人和汽车既有相似之处,又有许多不同之处,特别是在结构、功能和用途方面。例如在零部件和运动方式上,人类、机器人和汽车都有一套运动控制系统。人类有肌肉,机器人有马达和执行器,汽车有发动机或马达来推进。同时,三者都由能量来推动运作,人类需要食物和氧气,机器人需要电力或其他动力源,汽车需要汽油、柴油或电力等燃料。除了运动驱动执行,还需要一套控制系统,人类有控制身体的大脑,机器人有编程计算机或人工智能,汽车,尤其是自动驾驶汽车,有车载计算机和控制系统。

当然,人形机器人与汽车的差异客观存在,就当下的技术成熟度和未来技术实现难度而言,虽然汽车已经拥有有限的人工智能,但主要用作交通工具,其主要目的是将人或货物从一个地方运送到另一个地方,因此还局限于以执行特定道路任务,依赖于算法、传感器和地图。在执行除移动和导航之外的任务方面,它们不像机器人那样复杂,虽然先进的汽车可以在一定程度上学习和适应,但它们不需要复杂的决策能力,也不需要意识或情感。

而机器人目前正从原先为实现特定功能而创建,例如制造、清洁或娱乐,转向以全栈式任务为导向,目标是像人类一样完全自主,能够独立思考、决策和移动。因此其不仅仅取决于编程和人工智能能力,人类希望机器人能在生活中扮演着各种角色,有各种目的,这带来了全新的机遇和方式。

▍具身机器人带来新方向

目前大多数人形机器人的控制,依然采取智能手机或者游戏手柄式控制器操作。机械式的遥操方式往往依赖于复杂的操作界面和指令集,这要求操作者必须具备一定的专业知识和操作技能。对于非专业用户或初学者来说,这种操作方式的学习成本较高,难以快速上手并熟练掌握。这违背了人机交互自然法则中“降低甚至无须学习成本”的原则。

借助具身操作系统,本质上让人形机器人的落地简单了非常多,让人类能够有机会借助语言和手势,操作具有与汽车类似的自主性和功能性的人形机器人。最近,特斯拉发布了一则新招聘信息,招聘身高在 5 英尺 7 英寸到 5 英尺 11 英寸之间的人,穿着动作捕捉服和虚拟现实耳机来训练特斯拉的人形机器人。据Business Insider 报道,他们需要穿着这些装备“并根据项目要求执行指定的动作和操作”。

但是如果人类想以与控制汽车相同的方式控制人形机器人,借助VR、视觉等设备实现的具身控制,需要考虑人机界面等方面的新问题,也需要兼顾机器人的驾驶体验感。但机械式的遥操方式显然不太适用于人形机器人,因为其在信息的呈现和交互表达上往往不够直观和自然。传统的键盘、鼠标等输入设备更是在遥操作场景中可能无法准确反映操作者的意图和动作,导致操作过程中的不流畅和误解。

机械式的遥操方式在操作过程中可能需要操作者保持高度的集中和注意力,以确保指令的准确传达和执行。这种高强度的操作负担不仅容易导致操作者的疲劳和误操作,还可能影响工作效率和任务完成的质量。在特斯拉的招聘中就指出,使用 VR 耳机或在虚拟环境中工作可能会让某些人感到迷失方向和不舒服,从而导致 VR 晕动症症状。

因此特斯拉等厂商已经在考虑如何让这个过程更舒服点,致力于提高机器人的感知能力、决策能力和自适应能力,使其能够在一定程度上自主调整动作和策略,减少对操作者指令的依赖。例如在用户输入和控制方面,人类如何可以轻松地同频操作机器人,使操作者能够以更加自然和直观的方式与机器人进行交互。或者人形机器人能否做成类似于汽车的仪表盘或信息娱乐系统,通过其他界面供用户发出命令,人们可以更直观感觉到机器人参数性能。

▍具身人形研究如何细化

具体而言,在汽车中,人类最基础的是通常使用方向盘、加速和制动踏板以及换挡,但在人形机器人设计中,类似的控制界面如何设计目前是一个很大的问题。轮式机器人的控制方式与汽车类似,可以使用简单的转向系统控制前进/后退运动和转弯。但双足机器人更复杂则需要复杂的算法来处理平衡和平稳运动,目前能见到的许多人形机器人遥控器操作方式其实都有相当大的缺陷。

这种加减速和转向驱动机制,一般而言需要考虑为机器人的方向创建操纵杆或基于轮足的控件,或者为移动速度创建踏板/按钮,但目前都处于研究空白。如果有人能做一个控制系统,用户可指定大致方向和速度,机器人的机载系统可根据用户输入调节机器人的移动速度,处理复杂的行走和平衡,那么这套系统必然可以帮助人形机器人应用再上一个台阶。

当前的动捕和遥操作系统其实提供了一种新的思路,也就是人类可以外骨骼、或者视觉捕捉来远处操纵人形机器人,甚至是基于 VR 的控制界面,人们可以通过摄像头来控制机器人的运动,借助语音识别和手动的手势控制,加上各类传感器,如果未来能配合视觉提示(如灯光)和听觉信号(扬声器)提供高级选项,通过反馈系统为机器人添加一种传达其状态的方式,能够在体验感上将人形机器人再提个新台阶。

但是传统的机械具身控制,往往忽视了交互情境的重要性。在实际应用中,交互情境反映了交互的客观环境,包括物理环境、接口资源和交互设备等。为了提高交互的自然性和效率,人机交互系统需要能够感知并适应不同的交互情境。然而,机械式的遥操方式往往缺乏这种情境感知和适应能力,导致在不同情境下的交互效果不尽如人意。因此远程控制界面目前还有待完善。

例如我们认为机器人的控制界面上应该有正面和背面摄像头切换和平视显示器的确切信息,显示周围的情况,从而帮助操作者近距离和障碍物检测。又例如摄像头或激光雷达的传感器需要更加直观化和参数化,让操作员可以“看到”机器人所看到的内容,从而实现安全操作。与汽车中的停车传感器或自适应巡航控制类似,最好机器人还能够安装近距离传感器来检测附近的物体,当附近有障碍物时,可以配备振动反馈系统或听觉警报,就像汽车中的警告声一样。

或者还需要一个显示关键信息的仪表板,如对象信息、当前移动速度、电池电量、电机温度和传感器状态,记录性能数据,电源管理系统能提醒机器人工作的时间,类似于汽车中的燃油表,当电量不足时,它会自动返回充电站为电池充电。

未来在人类具身操作的基础上,人形机器人会逐步实现在环境中自主移动、作业,就像汽车中的自动驾驶模式一样,由之前的人类控制和数据积累,人形机器人才会逐渐变得像操作汽车一样直观和实用。这个步骤可能需要3-5年的换时间积累和努力。

基于全新产品理念,也会有全新的生态。例如人形机器人创新中心就提供了类似车辆测试中心这种比较新颖的现场测试和研发模式,也就是为人形机器人企业提供了一个测试和迭代的场地,人形机器人企业借此能够更快找到零部件进行原型设计,快速构建原型以测试基本功能、运动和传感器系统,同时根据性能和反馈迭代,一旦机器人可以执行其基本功能,就在现实环境中对其进行测试,类似于在道路上测试自动驾驶汽车的方式,这种模式就能够进一步提速人形机器人的研发。

▍人形机器人的目的性

除了操作系统,在硬件上以汽车研发的思路来看人形机器人,从明确的目标开始,也很容易决定了人形机器人“将要用来做什么”的大命题。它是只行走、携带负载、协助人类还是执行专门的任务?还是需要像人一样行走,还是像汽车一样使用轮子以实现更高效的移动,是需要固定任务执行,还是需要在移动性和可用性方面提升,最终具有功能性和自主性。

不同的需求应该决定人形机器人不同的机械设计和结构系统。例如骨架和机电系统,如果以灵活性为需求,那么就应该选择灵活性的物理结构框架,选择轻质但坚固的材料,如碳纤维或铝,尝试重点融入3D打印等技术,将电机和执行器(用于移动)应放置在关节中。同时用轮子实现像汽车一样的移动就未尝不可,因为轮子在机械上更简单,长距离、长时间行驶效率更高,而且在效率上,轮子比腿更实用。但轮式需要考虑像在汽车中一样添加减震器或稳定器,做到高的加速度、减速和抱闸,这类技术在市面上见不到一家人形厂商能完成。

如果人形机器人进入家庭环境或者工厂,可能还需要考虑电源的问题,因为人形机器人为了实现类似汽车的自主性,必然需要一个类似于电动汽车的高效可充电电池系统,它需要快速为运动和机载系统(传感器、AI 等)供电,需要考虑采取何种节能设计以延长电池寿命、保持更高机器人移动状态,也能在电池电量不足时像扫地机器人一样自行停靠。目前市场上的大多数人形机器人demo都没有展示机器人如何充电,有效工时和真正的寿命问题。

安全系统问题也是新的研究方向。因为人形机器人与人类或者环境物体的碰撞检测,必须有可靠性验证机制,包括安全系统能否检测潜在的碰撞,类似于汽车中的安全机制(如自动刹车),这可确保机器人不会对人或自身造成伤害,紧急关闭系统还能实施紧急停止机制,允许用户在发生故障时立即停止机器人。另外这也延伸出在公共场所使用机器人的安全法律限制或道德影响问题。

如果需要人形机器人模仿人类关节的骨架框架来适应某些工种,那么除了思考材料选择,还应该考虑设计具有平衡算法的高效双足系统帮助机器人更好步行,内部的陀螺仪和加速度计等传感器部件有没有可能更好规划部署以提升平衡和导航能力,环境感知传感器还有没有更进一步的空间,能实现更加优秀的物体检测、距离测量和避障。

但在这些能力上,寿命和可维护性如何依然保持是难题。涉及机器人时能否应使其易于维修和维护,类似于汽车的维修方式,通过替换成熟的模块化部件,就能快速维修,或许是人类能够在家庭中愿意为其买单的关键。

基于这些,厂商在功能部件上,除了考虑实现定位、导航、控制系统、自主决策等各方面细节,就像汽车的车载计算机处理传感器输入以进行驾驶一样,可能还需要一个能够处理信息、做出决策并自主执行任务的人工智能系统,该系统采取边缘还是云端来实现,机器人的人工智能算法,如何对新环境做出反应、从经验中学习并提高性能,就像自动驾驶汽车如何适应交通和道路状况一样。但人形机器人开发的难点在于,还需要兼顾开发允许机器人平稳地从 A 点移动到 B 点的算法,这包括避障、寻路以及步行或驾驶策略,因此难度相较结构化的道路问题更多。当然,我们相信,这些诸多细节问题随着厂商的研发,将会不断被解决和完善。

▍结语与未来

“我认为机器人的数量将大大超过人类的数量,”他说。“因为每个人都想要一个机器人伙伴。”在最新的一次公开圆桌对话中,马斯克对于人形机器人的未来依然乐观。

由于特斯拉依然正致力于开发用于家庭和商业的人工智能人形机器人,马斯克表示,他预计有一天它们的数量将达到人类的两倍。

但马斯克也认为,图灵测试曾经是衡量计算机模拟人类对话能力的基准,但现在已不再具有意义。得益于人工智能和机器人技术的进步,未来人类将必须找到新的方式来赋予他们的生活意义。

“我认为实际最有可能的社会问题是,我们在一个人工智能可以做我们能做的一切,甚至比我们做得更好的世界中如何找到意义?这也许是更大的挑战,”马斯克说。

0 阅读:17
机器人讲堂开课了

机器人讲堂开课了

感谢大家的关注