作者|向欣
编辑|白雪
特斯拉终于给人形机器人 Optimus 装上了灵活度媲美人手的灵巧手。
它的新一代灵巧手自由度高达 22 个,比人手的 21 个自由度还多。
11 月 28 日发布的视频中,装上了一只新灵巧手的 Optimus Gen2 精准接住了别人抛过来的网球两次。
要知道,即便是对于许多成年人来说,成功接住网球都不算容易。
马斯克最早在今年 5 月份就提到了特斯拉第三代灵巧手将拥有 22 个自由度。
仅仅半年,特斯拉的机器人工程师们就实现了这一目标。
虽然 Optimus 的工程师解释了视频中的演示动作是遥操的,但机器人的动作流畅性仍然令人惊叹。
人类操作者可以通过机器人提供的视觉画面成功完成动态抓取的动作。这至少说明,特斯拉的机器人硬件能力已经非常成熟。
其遥控操作技术与设备能够实现低延迟、高精度的控制输出,灵巧手的抓握、伸展动作也非常灵活,几乎与人手无异。
Optimus 副总监兼工程主管 Milan Kovac 更是称这是一次里程碑式的进步。
而从遥操走向自主,差的是大量人类动作数据与算法、模型的提升,基本上只是时间问题。
马斯克曾透露,Optimus 灵巧手的工程量可能会占到整机开发工程的一半。
灵巧手之所以如此被马斯克看重,是因为它作为机器人的末端执行器,很大程度上决定了机器人的精细操作与执行复杂、多样性任务的能力,是人形机器人替代人类工作的关键部件。
在具身智能热潮下,国内外涌现出多家机器人灵巧手制造厂商。灵巧手自由度、感知力、控制精度提高的同时,成本也在逐渐降低。
据相关研究机构预测,保守情况下,2030 年全球人形机器人灵巧手市场规模为 320.6 亿元,年复合增长率为 81.2%,乐观情况下达 879.7 亿元,年复合增长率为 109.3%。
一大批玩家们,正在这个具身智能的百亿细分赛道中展开新一轮角逐。
自由度增长 2 倍,
明年将实现自主抓取
与第二代相比,特斯拉第三代灵巧手将手掌的驱动器都移动到了前臂,和人类一样通过肌腱来操作手指。前臂在容纳了数量更多的电机的情况下,仍然很纤细。
手臂到手掌的外观集成度更高。手臂的驱动器不再暴露在外,而是被全部包裹起来。
从视频中可以很明显地看出两代灵巧手的区别。
Milan Kovac 介绍,特斯拉第三代灵巧手自由度数量是上一代的两倍。
此外,Optimus 的手腕和手臂一共有 3 个自由度。演示视频的动作是在 Optimus 实验室里通过遥操作实时完成。
星动纪元创始人陈建宇介绍,灵巧手的自由度越高,就越能地模仿人类的手部动作,执行复杂的任务。
人手从手部到肩膀一共有 27 个自由度,Optimus 手臂+手掌共有 25 个自由度,已经与人类十分接近。
图中左边为第二代灵巧手,右边为第三代灵巧手
视频中,Optimus 只装上了一只新的灵巧手。Milan Kovac 表示,他们很快会让其他的 Optimus 也装上第三代灵巧手,不过在重量、控制和触觉方面还有一些工程问题需要解决,包括:
马斯克透露,这次发布的演示视频只是在测试灵巧手的驱动和传感器系统。在下一个季度,通过将 AI 视觉与手臂驱动系统连接,特斯拉人形机器人将能够自主接住、抓取物品。
也就是说,大约明年 1~3 月期间,我们就能看到 Optimus 自己使用灵巧手接住网球了。
Tesla Bot 高级主任工程师 Julian Ibarz 称,特斯拉上一代灵巧手是无法接住一个网球的。新一代灵巧手能够做更多的任务,速度甚至比人类还快。
这次灵巧手的展示,也获得了不少业内大佬的高度评价。
特斯拉人形机器人的竞争对手,1X Technologies 的人工智能副总裁 Eric Jang 都不得不佩服:
连续两次的成功捕获证明了机器人动态遥控质量极高。机械+肌腱的小型化,低延迟遥控、相机校准、重新校准的成功都令人印象深刻。
NVIDIA 具身智能负责人、高级科学家 Jim Fan 更是称其为「科幻级别的硬件工程壮举」。
在今年 10 月份的特斯拉发布会上,特斯拉第三代灵巧手首次亮相。
,时长00:17
当时就有人根据现场的视频,分析出了 22 个自由度的组成:
大拇指有 5 个自由度,其余四指每个都有 4 个自由度,加上手掌的 1 个自由度,所以一共是 5+(4×4)+1=22 个自由度。
自由度的成倍提升,让机器人手的灵活度大大提高。
以往 Optimus 用手执行的任务大多是拿放东西。马斯克之前曾说过第三代灵巧手将能够弹钢琴、吉他。
这次安上新的灵巧手后,马斯克又会让 Optimus 做哪些更加复杂的任务?最终的答案要明年才能揭晓了。
三次迭代,
兼顾技术攻关与降低成本
机器手要像人手,只提升自由度远远不够。
过去 2 年中,特斯拉灵巧手主要在自由度、触觉、力度控制方面进行提升。这三者分别对应着灵巧手的灵活性、感知力和控制能力。
2022 年 10 月,随着 Optimus 原型机的公布,特斯拉第一代灵巧手的设计方案同步释出。
第一代灵巧手单手具备 11 个自由度,可负载 9 公斤,内置 6 个执行器,拇指分配 2 个,其余手指各 1 个,手指由金属肌腱驱动。
11 个自由度的配置下,第一代灵巧手已经能够完成很多简单的任务,比如拿水壶、积木,搬运零件、货箱。
2023 年 11 月,特斯拉发布新一代 Optimus,灵巧手也升级到第二代。
灵巧手的自由度不变,特斯拉给它增加了触觉传感器,并改进了电机扭矩控制技术,让它能够更精确地控制力度与接受外界反馈。
第二代灵巧手能够完成更加精细的操作,如拿鸡蛋、分拣电池、在遥操控制下叠衣服等。
第三代灵巧手手掌内的电机都移动到了前臂,手部空间不再受电机的限制,手部关节灵活度更高。电机都集成到了手掌之外的地方,也更加利于降低维护修理的成本。
特斯拉优化灵巧手的三个方向,正是灵巧手研发的三大技术难点。
灵巧手的灵巧度、感知力与控制能力,硬件上涉及构型、体积、关节数量、传感器数量、驱动方式,软件上涉及动作模型、控制算法等。
灵巧手的参照物是人手。手在人与环境的交互过程中占据极其重要的地位。人的上肢功能占全身功能的 60%,手指功能占上肢功能的 90%。
可是,人手又是身体最复杂的运动结构,有 27 个骨头,19 个关节,34 块肌肉和 48 条神经与成千上万个触觉传感器。
要造出与人手无异的灵巧手,意味着灵巧手在硬件上需要同时满足高系统集成度、高感知力、零件高精度、轻量化、小体积的要求,并且在软件上还要优化算法,以训练抓握能力。
这几乎相当于让工程师们挑战把机械研制成人造细胞。技术上的高壁垒,也造成了灵巧手研发的高成本。
国外灵巧手专研厂商 Shadow Robot 推出的具有 24 个关节数目的 Shadow Hand 价格就高达 220 万元。即便是关节数目大约为 10~12 个的 Bebionic 仿生灵巧手最低也要 32 万元一只。
灵巧手成本通常约占人形机器人总成本的 20%。
马斯克计划将特斯拉人形机器人的成本降到 2 万美元左右,灵巧手的成本就需要降到 4000 美元左右,也就是大约 3 万元人民币。
要使灵巧手成本降低,还需要持续积累开发技术,优化设计方案,减少零部件数量并降低零件成本,多管齐下。
所以马斯克还将眼光拓展到了医疗假肢领域。
多个业务线并行,既提高了所投入资源的利用效率,也有利于扩大产品的应用规模,实现更加良性的商业闭环。
在今年 3 月,马斯克就表明过 Optimus 的肢体未来将可以替代人类缺失的肢体。
人类将能够通过 Neuralink 的植入物来控制机械肢体。
在特斯拉公布第三代灵巧手的前两天,马斯克旗下的脑机接口公司 Neuralink 宣布启动一项新的实验:该实验将使用一种名为 N1 的植入物,让人类可以操纵机械臂。
全球范围内至少有数千万个截肢者。
在通用人形机器人之外,灵巧手在垂直的医疗领域也拥有巨大的市场潜力。
国内灵巧手极致性价比,
最低售价不到一万
灵巧手的研发最早始于 20 世纪 60 年代。
国外灵巧手研发起步较早,由日美引领,欧洲跟进。
国外目前较为知名的灵巧手制造企业有 Figure AI、Apptronik、1X Technologies、Clone Robotics、Sanctuary AI 等人形机器人本体制造厂商,以及 Shadow Robot 这类灵巧手专研厂商,自由度数量在 16~27 个,负重能力在 8~50kg 区间,价格普遍较为高昂。
国内灵巧手研发起步较晚,20 世纪末才开始研发,但近几年发展迅速,不少灵巧手企业在兼顾性能的同时,还把价格打下来了。
相比国外灵巧手动辄几十万到百万的价格,国内灵巧手价格从万元以下到十几万元不等。
国内的灵巧手研发企业主要有三类:
在科研机构与高校这一类别中,哈工大是最早引入灵巧手研发技术的。
2001 年,哈工大刘宏教授领导的课题组研制出具有 12 个自由度的仿人灵巧手。
该灵巧手有 4 根手指,每根手指有 3 个自由度,拥有 96 个多种类型的传感器,在往后的很长一段时间里,哈工大的这款灵巧手都属于十分领先的产品。
科研机构与高校研发灵巧手的特点是,相比使其落地,会更加追求极致的性能,比如极高的自由度,与极轻的重量。
比如,上海交大 2020 年研制了一款气动、多材料 3D 打印、模块化高度集成软指驱动器组装的灵巧手,具备 5 根手指 11 个自由度,整手质量仅为 138g;中国科学院自动化研究所 2023 年研发的 Casia Hand 系列灵巧手,关节自由度高达 25 个、驱动自由度达 21 个。
与科技机构和高校不同的是,另外两类灵巧手研发商更加注重商业落地,具体表现在,灵巧手不会过于追求轻量化,多数产品的自由度数量也不会过高。
可以看出,人形机器人本体制造企业的灵巧手产品自由度普遍为 10 个左右,重量集中在 1kg 以内。其中钛虎机器人灵巧手单只价格仅为 2 万元左右。
不过,在灵巧手的商业落地上,机器人本体制造商与机器人核心技术、零部件研发商也有差异。
多数机器人本体制造商都未公开售卖其灵巧手产品,灵巧手制造成本与售卖价格也对外保密。
而许多机器人核心技术、零部件研发商都有灵巧手产品售卖,在自由度和触觉感知方面也更「卷」。
机器人核心技术、零部件研发商的优势是,他们能够从源头上,通过设计优化灵巧手的核心零部件,来达到降低成本的目的。其灵巧手售价在 0.99 万元~11 万元不等。
高性价比灵巧手制造厂商包括灵心巧手、因时机器人、强脑科技等。
灵心巧手旗下产品最高拥有 42 个自由度,自由度数量超越人类,能精确模拟人类手部的精细动作。
Linker Hand SE 版售价 0.99 万元,性能更强的 Linker Hand L20 pro 具备 20 个自由度,价格仅为 4.99 万元。
因时机器人是国内最早实现灵巧手商业化量产的企业,也是第一家把灵巧手价格降到万元水平的企业。
其产品包括仿人五指灵巧手 RH56BFX、RH56DFX 和 FTP 系列,可实现亚毫米级定位精度。RH56BFX、RH56DFX 具有 6 个自由度,售价均为 10 万元。
强脑科技 BrainCo 智能仿生灵巧手具备 10 个灵巧关节,单手可承载 30kg,搭载「TS-F+多模态触觉传感器」,可识别 30 多种不同材质,并实现对柔性、易碎物品的自适应力抓取,售价为 10 万元。
这些灵巧手售价虽然相对较低,但性能并没有缩水。
除了自由度外,另一个灵巧手的重要评判标准是感知力,在这方面最「卷」的要属帕西尼感知。
帕西尼感知推出了业内首款集成多维触觉与 AI 视觉双模态灵巧手。简单来说,它的灵巧手是有「眼睛」的,在触觉之外还有视觉可以辅助感知环境。
帕西尼感知旗下多维触觉人形机器人 TORA-ONE 的灵巧手具有 13 个自由度,搭载了近 2000 颗帕西尼自主研发生产的 ITPU 高精度触觉传感器,拥有 0.01N 的精准力控能力,使其具备如人类般细腻灵敏的触觉感知能力与视觉位姿估计能力。
灵巧手感知力较强的还有激光雷达厂商速腾聚创。速腾聚创在今年 11 月发布的灵巧手拥有 8 个自由度,采用行业领先自研三维力传感器技术,可以灵活地复刻人手级别的动作和操作,比如拿起鸡蛋、捡螺丝等。
总体来说,国内灵巧手赛道玩家众多,产品性价比高,在落地上比国外企业更具备优势。
无论是机器人的手,还是人类假肢的应用,机器和技术发展的意义与千百年前一样,最终目标只有一个:让人类获得更多自由。