特斯拉Optimus还在发布会上走秀的时候,Figure 02已进厂实习。
01
地表最强人形机器人
当地时间8月6日,第二代人形机器人Figure 02发布,距离向工业用户销售量产人形机器人的目标又近了一步,一上市便被誉为“地球上最先进的AI硬件”。该机器人在硬件和软件方面进行了彻底的重新设计,包括对人工智能系统、计算机视觉、电池组、电子设备、传感器和执行器等关键技术的升级。
从外观上看,Figure 02采用了全新的外骨骼结构,不仅提高了机器人的负载能力和可靠性,还使整体设计更加时尚和一体化。此外,它配备了具有16个自由度的灵巧手,能够进行类似人类的手部操作,并且具备与人类相当的力量。
在性能上,Figure 02的整体性能提升了三倍,具备先进的视觉系统和处理能力。它的电池组容量提高了50%,达到了2.25KWh,这使得机器人能够实现每天超过20小时的实际有效工作时间。
此外,Figure 02还内置了由OpenAI定制的推理模型(VLM),搭配六个摄像头工作,能够进行语义基础和快速常识性的视觉推理。
Figure 02之所以能赢得如此多目光,同其身后的一众机构大佬有一定关系。
02
争投“具身智能”的科技大佬
2022年5月,作为连续创业者的阿德考克成立人形机器人公司Figure Al,致力于“解决严重的劳动力短缺问题,并减少从事危险工作的工人数量”。在阿德考克的设想中,人形机器人的首批应用场景,将会是制造业、航运和物流、仓储和零售业等劳动力短缺最为严重的行业。
随着特斯拉在2022年发布第一代人形机器人“擎天柱”((Optimus),以及2022年末以来的大模型浪潮,“具身智能”概念的热度高涨,人形机器人初创公司成为资本新宠。
今年2月末,Figure Al筹集到一笔高达6.75亿美元的融资,吸引了包括英伟达、微软、OpenAl.贝索斯等在内的明星机构和投资人。这笔融资使Figure Al估值攀升至26亿美元。Figure Al还宣布与OpenAl合作,为人形机器人开发下一代人工智能模型。
Figure Al真正“出圈”,源自今年3月在社交媒体展示的一段人机交互视频。与OpenAI合作13天后,Figure 01能在OpenAl的视觉语言模型加持下,和人类进行语言交互,并自主完成指令动作。整个过程中,OpenAl的大模型负责视觉推理和语言理解,而Figure Al的神经网络处理快速灵巧的机器人动作。
Figure Al当时被看做是“具身智能”的落地,具身智能人形机器人核心在于将人工智能与物理世界的直接交互结合起来。这种机器人不仅拥有高度仿真的身体结构,还具备强大的感知、决策和运动能力,能够执行各种复杂任务。
从技术层面来看,具身智能人形机器人的发展依赖于多个关键技术模块的融合,包括运动控制、传感技术和人工智能算法。例如,OmniH2O通过运动学姿态作为通用控制界面,实现了多种人类控制全尺寸灵巧手人形机器人的方式,包括通过VR头戴设备进行实时远程操作、语音指令和RGB摄像头。
此外,特斯拉的Optimus人形机器人也在不断迭代中展示了力控的能力,并在2023年发布了Gen1版本。
这一次,Figure 02的出现又强在哪里呢?
03
Figure 02强大在何处?
相较于2023年发布的首代产品,Figure 02对硬件和软件均进行了革新。其中,最吸睛的技术点当属Figure 02灵活自如的手部操作以及有较大提升的对话视觉能力,板载计算和AI推理能力也较前代产品提高了3倍。
据官方介绍,Figure 02由电机驱动,身高5英尺6英寸,体重70公斤,专为在人类环境中工作而设计。电池容量较前代产品增加了50%,一次充电可运行5小时,移动速度达1.2米/秒。
续航问题是人形机器人面临的技术难点之一,目前市面上的人形机器人大多只能续航1至2小时。而Figure的创始人兼首席执行官布雷特·爱德考克(Brett Adcock)表示,他希望Figure 02每天能够有效工作20小时以上。
具体性能上,在AI大模型的加持下,Figure 02可以通过内置的麦克风和扬声器,与人类展开语音交互。Figure 02的头部和躯体前后还嵌入了6台RGB摄像头,用来感知和理解物理世界。借助内嵌的视觉语言模型(VLM),Figure 02搭载的摄像头能快速进行常识性的视觉推理。与上一代相比,Figure 02的计算推理能力提高了3倍。
Figure 02其他方面也有一些别样的特色。比如,完全采用外骨骼结构,机器人的电源和算力布线集成在机体内部,从而提高了机器人的可靠性,也使得封装更加紧实。
此外,第四代手部装置最新设计具有16个自由度(DoF)和可与人类媲美的力量,可承载高达25公斤的重量,并灵活执行各种类似人类的任务;而每根手指都由一个传感器和电机集成的单元驱动,手腕是另一种新颖的设计,它提供与人类手腕类似的运动范围,同时将所有电源和传感器信号线包裹并布线到手和手指。
除Figure02应用于宝马工厂外,我们关注到Agility Robotics的Digit、Apptronik的Apollo、特斯拉的Optimus和波士顿动力的Atlas等机器人都计划或者已经在物流、汽车制造等场景测试和部署,这说明人形机器人的实用性正在被越来越多的行业所认可。
展望未来,以Figure AI为代表的机器人厂商有望继续打磨自身硬件实力,同时进一步加强与OpenAI在内的大模型厂商的合作,推动机器人技术的革命性发展。
事实上,除了本身性能的迭代外,Figure 02引人注目的原因还在于其已经开始进厂“打工”。
04
已在宝马工厂实习
在大模型还无法让人形机器人达到足够智能的情况下,在工厂场景而非人员密集的消费场景率先落地,成为多家人形机器人公司的共同选择。
今年1月,Figure AI宣布与宝马合作,第一阶段确定人形机器人在汽车生产中的初始用例,随后将在宝马斯帕坦堡工厂进行分阶段部署。
此次Figure 02发布前,7月2日官方释出的一段画面中,正在宝马车间“培训”的Figure 01,学会抓取汽车结构框架部再将其安装在夹具上,并且具备自主纠错的能力。由于操作速度较慢,以至于不少声音觉得“看件,起来很糟糕”。
Figure 02的“首秀”视频中,出现了5台机器人在宝马车间“实训”的画面,不过动作依旧较为迟缓。官方称主要借此开展训练数据收集和具体任务的培训。
05
陆续进入工厂的人形机器人
Figure 02并非唯一进入工厂的人形机器人,毫无疑问,Figure Al是当下炙手可热的“硅谷新贵”。然而,在人形机器人的赛道,Figure Al还要与特斯拉、谷歌、波士顿动力、Apptronik、Agility Robotics等强敌竞争。
据悉,Agility Robotics的Digit和Apptronik的Apollo已被部署在物流供应商GXOLogistics公司内执行相对简单的任务。Digit、Apollo也分别在亚马逊和梅赛德斯-奔驰进行了测试。
更让人玩味的是,作为科技界两大备受关注的具身智能项目,Figure常被外界拿来与特斯拉的Optimus进行对比。当Figure Al宣称Figure 02具备“世界最先进的AI硬件”时,有网友质疑道,这些Figure 02改进的部分,特斯拉7个月前就在做了,Figure 02很难称为是“最先进的”。
而我国人形机器人代表企业优必选在8月5日的时候刚宣布与吉利、天奇股份达成战略合作。优必选将协助吉利的电动化和智能化转型升级;吉利将为优必选工业版人形机器人Walker S系列及解决方案提供应用场景;天奇股份将参与为人形机器人应用训练提供产线数据采集、工艺模型研发以及场景改进设计等。
7月初,优必选WalkerSLite开始了在吉利控股集团旗下极氪5G智慧工厂的“实训”,其主要负责的工作为在CTU入库上料工位协同员工执行搬运。WalkerS Lite为优必选面向智能制造和智慧物流等领域推出的轻量化快速部署的新产品。优必选表示,这是国内首次全流程执行和对外展示料箱搬运任务的人形机器人,其作业完成度和执行难度属于业内前列。
截至目前,优必选已与蔚来、东风柳汽、一汽大众等车企签署合作协议。
从技术层面来看,人形机器人在制造业中的典型应用包括物品搬运、拾取和放置、质量检测、贴标、装配、智慧巡检以及高危作业等。这些应用场景的多样化进一步证明了人形机器人在工业制造中的广泛适用性和潜力。
未来,随着技术的不断进步和政策的支持,人形机器人有望在更多工业场景中得到广泛应用,推动智能制造的发展。