“能给我一些吃的吗?”工作人员向Figure机器人问道。
“当然。”(*机器人将苹果递给了工作人员)
“你能解释一下刚刚的行为吗?”工作人员继续提问。
“我给了你苹果,因为苹果是桌面上唯一可以食用的。”Figure机器人边回答边收拾桌面上的垃圾。
如此智能又贴心,这就是 “硅谷新贵”Figure AI公司发布的新一代人形机器人。今天Figure 02正式上新。
画面中展示的就是Figure机器人引以为傲的语音到语音推理功能。而这一功能在Figure 02身上得到全面升级。
Figure 02搭载了麦克风和扬声器,借助OpenAI的力量,实现了语音对话和推理。
在创始人Brett Adcock发布的技术文章中,介绍了Figure 02是如何将ChatGPT变成一个机器人的过程:
用户输入语音,Figure 02将语音转化为文本信息,同时新增的6个RGB摄像头让机器人拥有超人视觉,能够接收图像信息。两种信息交予ChatGPT处理。
AI处理后的信息以语音的形式反馈给用户,并且指导机器人作出响应行动。
Figure 02语音到语音的推理过程
光能反馈还不行,具体执行的时候,还需要与视觉模型配合。否则就会出现机器人炒菜把锅里的菜全洒在地上的翻车场面。Figure 02没少在这上面下功夫。
Adcock介绍,Figure 02内设视觉语言模型(VLM),搭配6个摄像头工作,机器人能够进行语义基础和快速常识性的视觉推理。
这个功能在与宝马的合作中,体现得淋漓尽致。
在今年1月,Figure AI宣布和BMW Manufacturing Co., LLC 签署商业协议,在汽车中部署通用机器人参与制造流程。在Figure 02的宣传片中,也花了不少篇幅展现Figure 02在宝马工厂中如何利用视觉语言模型进行配件组装类的精细工作。
并且,与上一代相比,AI推理能力提高了3倍。在宣传片中,Figure 02看到没有安好的配件还会再补上一下。
Figure 02宣传片截图
除了这些,大家最关心的莫过于机器人「手」的改进。
我们的双手可以轻易地从数字1比到数字10.但如此简单的手势对于机器人来说,难于登天。在放出预告片时,大家的注意力就被第四代手吸引了。
这次Figure 02的第四代手配备了16个自由度。
「16」这个数字的意思是5根手指,每根手指上有3个关节,一共15个关节,再加上1个手腕关节,一共16个关节都是可以自由活动的。这个技术距离人类22个自由度的手部又近了一大步。
并且,Figure 02的手部还配备了与人类相当的力量,可以承重25公斤,更加适用于实用场景。有网友放出01和02之间的对比,有了自由度的提升,手部的动作看上去精细不少。
手部特写(左侧为Figure 01.右侧Figure 02)
还有一些其它的更新,例如电池的容量比上一代提升了50%,现在Figure 02每天能完成20小时的工作。
布线也重新设计了,用于电源和计算的集成布线现在使用的是隐秘式电线,具有更紧密的包装和更高的可靠性。
重新设计了机体的外骨骼结构,平衡了结构的刚度和防止碰撞载荷。当然,这些改变也使Figure 02的重量达到70公斤,比01重了10公斤。
“地表最强”机器人?
Figure 02刚发布3小时,就吸引来了50万网友的围观。
许多网友表示惊叹:“不敢想象未来20年会发生什么!”“2024年绝对的机器人年!”
英伟达高级科学家、具身智能负责人Jim Fan也第一时间送上称赞,表示:“第四代手的自由度的改进绝对是一个正确的选择”。
和Jim Fan一样,不少网友惊叹于手部动作的丝滑。
其实,第四代手的诞生是来源于创始人Adcock的坚持。
“我们选择做人形机器人是因为目前的世界是围绕人类活动建造的,所有的一切标准都适配人类的生理条件。”Adcock曾在访谈中解释为何自己坚持要做好人形的机器人。
只有一切向「人」靠拢,才能更好地服务人,帮人省去不必要的劳动。
他和大多数网友的思路一样——“AI的作用不是写诗、画画,而是替我去刷碗、洗衣服,让我有时间去写诗、画画”。
从决定好AI的思路到如今成为行业佼佼者, Adcock只用了2年。
这家AI公司是在2022年才创立的。如此迅猛的发展是依赖于Adcock的远见。
在替Figure AI集得近7亿资金之前,他还创办过软件公司和飞行器公司,前者的出售为Adcock赢来了“第一桶金”。后者也已经成功上市。
AI时代到来,Adcock像许多人一样,决定“All in AI”。但不同的是,有前两次成功的创业经验,创办Figure AI的过程顺利地像开了金手指。
作为当之无愧的“硅谷新贵”,Figure AI的背后是贝索斯(亚马逊创始人)、OpenAI、英伟达等巨头们的联合投资,当前Figure AI的估值也高达26亿美元(人民币约186亿元)。
Figure AI也不负众望,旗下产品Figure01是世界上第一个具有商业可行性的自主人形机器人。
历时18个月后,Figure 02于今天正式发布。官方称之为“世界最先进的AI硬件”。
不过,有鲜花的地方,也一定会有质疑。
有网友发出竞争对手特斯拉的Optimus演示视频,表示这些改进的东西,特斯拉7个月前就在做了,Figure 02是如何成了“最先进的”?
“宿敌”Optimus
其实,作为科技界两个最受关注的具身智能项目,Figure AI与特斯拉Optimus的争议一直贯穿始终。
早在一年前,Figure01发布预告时,就有网友开玩笑说:“特斯拉的机器人叫擎天柱(Optimus),那你的应该叫威震天。”
在这次Figure 02发布时,也有网友看热闹地表示:“已经迫不及待想看Figure 02大战Optimus Gen 2啦!”
并且,在Adcock自己的团队里就有不少特斯拉出来的员工。
Adcock没有专门去回复那条质疑的评论,他似乎也从来不在乎和Optimus的竞争。
虽然Optimus背后有特斯拉这颗“大树”,既有广泛的数据供给训练,又有丰厚的研究资金,但Figure AI本身也算得上是“不愁衣食”。
不仅手握大把资金,在商业化合作上,Figure AI也是“未来可期”。和宝马的合作目前处于第一阶段,Figure机器人将会应用在汽车生产的初始阶段。第一阶段完成后,宝马还会与其进行深度合作,共同探索人工智能、机器人控制、制造虚拟化和机器人集成等先进技术主题。
Optimus目前也已经在特斯拉工厂落地使用。两位具身智能的领先玩家都在自己的道路上狂奔。
至于谁才是“世界最先进的AI硬件”,这个问题不必纠结。名称不会消失,但会转移。在快速发展的AI行业中,下一位技术的领先者或许已经在等待登场了。