机器之能报道
编辑:吴昕
争夺大脑控制权的战争越来越激烈了。又是一家要做机器人“大脑”的公司,虽然官网都没做好,但已拿到7000万美元投资,包括OpenAI的钱。
“字数越少,事情越大” 用来形容这家机器人 AI 公司的初次亮相再合适不过。
新公司名叫 Physical Intelligence(简称 PI,同 π ),打开官网的一瞬还以为自己误入某位程序员的个人博客:
目前公司官网主页的内容,有些寒酸啊
寥寥数句, 雄心立现。“...... 一家将通用 AI 带入物理世界的新公司,......开发基础模型和学习算法,为今天的机器人以及未来的物理设备提供动力。”
又是一家要做机器人 “大脑”的公司。理由也差不多,大家不甘心 AI 的巨大进步仅停留在比特世界,物理世界也要“共同富裕”。为此,他们选择解决其中最难、也最有影响力的问题——智能。也就是说,为物理世界打造一个“基础模型( LLMs )”、“大脑”,但用于控制机器人,教会任何机器人完成各种任务(甚至包括现在还不存在的任务)。
换做别人,如此宏大的愿景可能会被嗤笑,但他们不会。看完接下来的团队成员名单,很多人会认为他们的实力配得上野心。最后一段致谢名单也佐证了这一点。彭博社援引一位熟悉这家公司投资人人士的消息,PI 已经从 Thrive Capital 、Open AI、红杉资本 、Greenoaks Capital Parners 、Lux Captital 和 Khosla Ventures (绝大多数都出现在了致谢名单中)那里筹集了 7000 万美元。
这是一支集合了 Google Brain、Google DeepMind 研究人员的明星队伍,连谷歌首席科学家 Jeff Dean 也发来贺电。
公司联合创始人兼 CEO Karol Hausman 曾是 Google DeepMind 资深研究科学家,也是斯坦福大学兼职教授。不在谷歌调试机器人时,他会在斯坦福大学教授深度强化学习课程。
联合创始人兼 CEO Karol Hausman
Hausman 主要研究兴趣是帮助机器人在现实环境中获得通用技能,最近这方面的著名研究成果 RT-X、RT-2 背后都可以看到他的身影。Hausman 将自己的研究分为三个部分:深度机器人学习、交互式和主动感知,现在完全专注于第一个。最近,他非常热衷于研究机器人决策的基础模型。
另一位联合创始人 Sergey Levine 是加州大学伯克利分校电气工程和计算机科学系副教授,斯坦福计算机科学博士。Sergey Levine 曾在谷歌工作,期间见证了 AlphaGo 击败中国顶尖围棋选手柯洁。他的研究兴趣集中在教导机器人“自学成才”,研发算法帮助智能体通过学习不断掌握更为复杂的行为技能,特别是找到一种通用的方法。
联合创始人 Sergey Levine
过去几年,Sergey Levine 和 Hausman 完成了一些开创性的机器人研究工作。Sergey Levine 说,他们的目标是构建通用机器人模型:就像NLP一样LLMs,但用于机器人控制。这并不容易,为此,他们需要以前所未有的规模收集机器人数据、进行算法改进、训练非常大的模型,并为从机器人控制到大规模 VLM 训练找到创造性的解决方案。
对于来自特斯拉 Optimus、Figure AI 等人形机器人公司,以及其他开发通用机器人软件公司的挑战(比如 Covariant、谷歌),Sergey Levine 在接受彭博社采访时表示,“多年来,我们一直致力于解决机器人 AI 的挑战,并开发出了解决问题的新办法,这些方法已经将对手抛在了身后。”
第三位联合创始人 Chelsea Finn 是斯坦福大学计算机科学和电气工程系的助理教授,也曾是 Google Brain 团队的一员,研究兴趣集中在机器人和其他智能体如何通过学习变得更聪明。
联合创始人 Chelsea Finn
第四位联合创始人 Brian Ichter 也曾是 Google Brain 的研究科学家,在机器人团队工作,斯坦福大学博士。研究兴趣是帮助移动机器人通过学习增强现实环境中的任务执行能力。
联合创始人 Brian Ichter
知名投资人 Lachy Groom 也是该公司联合创始人之一。他曾是 Stripe 的早期员工。“我认为,人们用人形机器人构建的东西真的很酷,”他在接受彭博社采访时谈到,“但从根本上让人类有趣的是大脑,不是硬件。我们造的是终极通才。”
投资人 Lachy Groom 也是该公司联合创始人之一
其他两名公开的团队成员还有斯坦福大学博士 Suraj Nair 以及目前是加州大学圣地亚哥分校四年级博士生的 Quan Vuong。
Suraj Nair 曾在丰田研究院、Facebook AI Research、Google Brain 和 GE 工作过,兴趣是为机器人构建大脑。公司联合创始人 Chelsea Finn 也是他的博士论文指导教授之一。
Suraj Nair
Quan Vuong 的研究领域包括深度强化学习、计算机视觉、机器人技术。攻读博士学位期间也在 Google Brain 的机器人团队实习过。
Quan Vuong
过去几年里,研究人员发表了一系列论文展示了机器人如何从语言和图像 AI 模型中获得新的智力水平。比如,要求机械臂系鞋带,它可以先试着搞清楚鞋子和鞋带是什么,以及系好鞋带的必要信息。这是一个好的开始,但硬件部分还需要一段时间的训练才能真将鞋带系好。这也一直是个挑战 —— 完成任务时间越长,意味着时间和金钱成本越高。
PI 并没有透露如何克服这个问题。该公司联合创始人表示,他们不会制造自己的硬件,而是购买各种不同机器人,并在这些硬件上面训练他们的基础模型。该公司也表示,目标是创建迄今为止最大的机器人数据集。
“现实地说,实现目标需要长期、认真地研究。” Levine 说,“ 但有足够迹象表明,在现实世界中使用机器人的最大障碍是可以被解决掉的。”
参考链接
https://physicalintelligence.company/
https://www.bloomberg.com/news/articles/2024-03-12/physical-intelligence-is-building-ai-for-robots-backed-by-openai?accessToken=eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJzb3VyY2UiOiJTdWJzY3JpYmVyR2lmdGVkQXJ0aWNsZSIsImlhdCI6MTcxMDI3MTYzNywiZXhwIjoxNzEwODc2NDM3LCJhcnRpY2xlSWQiOiJTQTkyMDhUMVVNMFcwMCIsImJjb25uZWN0SWQiOiI5MTM4NzMzNDcyQkY0QjlGQTg0OTI3QTVBRjY1QzBCRiJ9.bJiHdqmbYPTdm-l14qjO66dwNAMQxrzgdItg2sZDBsA