人形机器人:现实与未来的挑战

发表时间: 2024-08-26 22:35

本文来自微信公众号:四木相对论,作者:四木相对论,原文标题:《机器人大会落幕,人形泡沫终于要到了?》,题图来自:AI生成

一年一度的机器人春晚——世界机器人大会(WRC2024)落幕了。

这次的世界机器人大会,一共有169 家机器人领域的企业参展。和智源大会、上海世界人工智能大会类似,这里同样“人山人海”。

在展馆内熙攘的人群中,各种规格的机械臂、灵巧手在半空中挥舞,轮足、四足、人形机器人展示着各类任务。

人形机器人物品分拣失误,视频经5倍加速‍‍‍‍‍

但在喧嚣的水面下,我们在展厅内依然发现一些疑惑和争议。

“人形”,是最大的非共识。

即便展馆内人形机器人随处可见,但全球机器人行业绝对大咖——波士顿动力公司的创始人Marc在大会中直言,自己非常不看好人形机器人行业。

他认为,工业机器人已经非常成熟,能够商业化,目前人形机器人“在某种程度上是一种炫耀,而不是一种生产力”

Marc Raibert,波士顿动力创始人兼CEO 四木相对论拍摄

而展馆内的最大亮点,也莫过于参展的27家人形机器人厂商。

这一年,承载着人类终极智能化想象的它们,已经从资本市场圈走近百亿元资金。

人形主场,扑街现场?

在WRC2024,人形机器人拥有明星般的待遇。

假如你看到一群人举着手机蜂拥而过,却看不清被簇拥的核心人士,大概率是某家公司的人形机器人正在走路——身高一米六的机器人很符合人类身高,也很容易被人群淹没。

宇树的人形机器人展示 四木相对论拍摄

站在展馆的一个十字路口,银河通用、星动纪元、逐迹动力和星尘智能分列四周。不远处,还有加速进化、宇树、智元机器人、星海图、钛虎、UniX AI、开普勒等拥有人形机器人产品的公司。

人形机器人十字路口的四家公司,一年融资超10亿 四木相对论拍摄

这些人形机器人公司在这一年里疯狂“扫荡”资本圈。

仅盘踞在“十字路口”的这四家,近一年公开披露的融资金额已经超过10亿元。而它们的平均年龄,只有“一岁半”

但即便吸金无数,在直观的现场演示中,不难发现各家人形机器人的Bug。

一家今年连续完成两轮融资的人形机器人公司,目前仅能展示垂直领域的单点任务。

比如在分拣这个场景中,它只能在特定范围内抓取双面胶,不能抓取剪刀、卷尺。而且,这个机器人移动的速度非常缓慢,完成一个只需要移动20厘米的抓取动作,需要近40秒。

机器人抓取操作动作迟缓 四木相对论拍摄

还有展示炒菜机器人的乐聚,在众目睽睽下直接上演了一出将菜倒在桌上的意外戏码。

人形机器人盛菜扑街

另外,还有不少机器人存在难以站稳,分拣任务识别不清等问题。

在一个左右手分拣不同类型面包的任务里,机器人放下右手准备拾起时,发现这是应由左手操作分拣的物品,只能上演一场大型空气拉花。

人形机器人执行分拣任务时“懵逼” 四木相对论拍摄‍

手和脚的非共识

双足人形机器人到底有没有用?是展馆内出现次数最高的问题。

而现场的明星公司们,已经体现出对双足的不同追求。

比如,逐际动力在现场大秀机器人“挨踹”后迅速平稳的绝技,星动纪元展示出自家机器人爬长城的视频。一墙之隔的银河通用,则以轮式地盘代替下肢,以伸缩、吸盘、抓夹等部件完成取货、清理桌面等任务。

银河通用机器人,视频经3.5倍加速 四木相对论拍摄

在行业中,双足的拥趸认为,机器人只有具备了人形(尤其是双腿),才能实现弯腰捡东西的操作,适应人类的工业、家庭、商业活动。

另一批公司则认为,哪怕是双腿的设计也无法实现360度全场景的操作。而轮式方案,更让人形机器人更快切入细分场景,率先落地。

在产业链的上下游,灵巧手也存在技术路线之分。

手的关节灵活性要做到什么程度?该是五指的形态,还是抓夹?

一种观点是,人手在操作时,真正发力和掌握方向的只有大指和食指,其余三指更多是辅助作用。也有厂商认为,只有五指形态的灵巧手,才能满足对力敏感度要求高、材料差异大的场景需求。

主攻灵巧手和视觉方案的“伟景智能”告诉“四木相对论”,现在没有必要做到三个指节的灵活,因为仅靠食指和大拇指的捏合,就能完成大部分任务。

另一家灵巧手公司表示,自己的优势就包括多个关节的灵活,“我们的食指关节都是能动的,里面的部件比别家做得小,不会显臃肿。”

会场中的灵巧手展示 四木相对论拍摄

市面上灵巧手的售价在5万~10万左右,客户为具身公司。一些主攻通用人形机器人的公司,也开始进入灵巧手市场。比如,星动纪元近期就推出了自己的灵巧手产品。

显然,立刻拥有双足和五指健全双手的必要性,并未在机器人领域形成统一。‍‍‍‍‍‍‍‍‍‍‍

但尽快切入场景,获得真实数据的反哺,则是各家的共识。

尤其是工业场景,海外人形机器人代表,特斯拉和Figure都选择对智能化需求较高的工厂场景,作为落地第一站。

但不论是哪种场景,目前的人形机器人均处于训练特定任务的阶段,和非人形的差距并未拉开。

以汽车为例,汽车制造业分为四个工艺流程:冲压、焊接、涂装、总装。在最复杂的总装环节,自动化程度只有20%-30%。

在总装环节,工人要用手操作机器,有时还要钻到汽车里,要拧螺丝、敲敲打打,还要与其他工人配合,还要做检测。

这个需要上下肢、大小脑一起协作的场景,理论上是“完全体”的人形机器人的目标。

不过现在,全世界没有任何人形机器人能够流畅地弯腰捡东西,更别提完成这一系列操作。

资本泡沫将至,行业难度不减

面对人形的天然流量,场馆内有厂商坚定表示,自己决不会踏足人形机器人。

“我们的产品没有人形,没有腿和灵巧手,依然卖得很好。”一位创业近20年的服务机器人公司高管向“四木相对论”表示,他觉得人形机器人现在只是To VC的故事,而这个泡泡,明年下半年就会破。

事实上,决定扣下扳机的资方,已经纷纷作出选择。

有投资人告诉“四木相对论”,虽然初创公司不少,但大家对国内的人形机器人标的已经形成一定惯性,“基本上都把钱砸给银河通用和智元机器人”。

这一定程度上是因为人形机器人所需的高成本,使资本形成了聚集效应——只有获取到足够资金的公司,才能闯过接下来的关卡。

智元机器人展示 四木相对论拍摄

理想状况下,一个成熟的人形机器人产品,需要在算法、数据、传感器搭配、力学设计、电力供给、零部件、新材料等层面完成适配。

而在2024年,人形机器人风起的第二年,虽然大模型、灵巧手等技术取得突破,但数据的稀缺、动力设计的困难、电机/传感器等硬件的不匹配和价格高昂,都意味着人形机器人之路依旧漫长。

这其中的每一个环节,都需要长期的耐心和资金投入。

拿数据难题举例。获得高质量且足够便宜的数据,是目前制约机器人发展的一大瓶颈,也是各公司希望构筑的壁垒。

在大会现场,一家估值数十亿元的人形机器人,不断出现捏合不到位、抓取不到物品等Bug。这家公司的高管向“四木相对论”解释,这主要还是因为训练数据不充足。

而对于数据难关,海外巨头特斯拉和谷歌都选择“遥操”路线。这种方式,需要人带上收集设备和机器配合完成动作,好处是数据真实,缺点是采集用时长,成本高

比如,谷歌为了训练PaLM-E,用了13台机器人,收集了17个月,才拿到足够的数据量。如果是更复杂的工业场景,数据采集成本会更高。

另一种方案则是十分火热的仿真数据。这一方案的训练过程往往需要判断物体材质,比如判断是杯子,然后再设计抓取的力量。

但缺少对“摩擦”等维度的建模,让仿真数据彻底符合物理规律还存在难点。这种不够真实的数据,可能导致机器人在实操中任务失败。

银河通用的高管也向“四木相对论”表示,仿真的数据虽然生成速度快,但依旧需要了解机器人场景的专业人士介入,否则不太能满足需求。

这里的专业,不仅指对数据和机器人场景的理解,还包括实操经验的丰富度。

如果一家公司的人形机器人具备抓取、移动的能力,速度却跟不上,那可能意味着他们缺乏经验地采用了移动速度很慢的训练数据,导致训练出的机器人动作也很慢。‍

除却数据,动力硬件和材料等难题依旧明显。

比如,触觉的缺失会使机器人难以判断布料、水流等信息。但触觉传感器相比其他传感器来说成本较高,且传感器反馈的数据形态更加复杂。这些都是限制人形落地的阻力。

星动纪元的灵巧手,传感器由其他供应商提供 ‍‍‍‍‍‍‍‍

人形机器人之外,各种各样的机械臂、机器狗也充斥着会场。而且在家庭领域,一些更加垂类的智能工具已经体现出商业化潜力。

比如下棋机器人元萝卜,在展览现场吸引了大量喜欢围棋和象棋的学生。我们看到,家长也对下棋机器人充满兴趣,不断询问价格。

元萝卜展台挤满了儿童和家长,四木相对论拍摄

宇树的机器狗,也已经被一些普通用户买单,用在露营等场景。

宇树科技机器狗‍‍‍

世界上第一只机器狗诞生于1968年,距今已有56年历史。它身形巨大,有时需要人工进入机器内部操作。当时,没有人认为它能走进家庭。

对于今天的人形机器人,或许相信它的人会给予同样的耐心。

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系 hezuo@huxiu.com

正在改变与想要改变世界的人,都在 虎嗅APP