机器人与ChatGPT的结合，但离我们实际应用还有距离

发表时间: 2024-03-15 10:57

昨天，GPT-4.5 的消息在各大论坛传得是沸沸扬扬，世超以为 OpenAI 要出来反击 Claude 了。

没想到第二天凌晨， OpenAI 借着另一家机器人公司，祭出另外一个杀手锏——把 ChatGPT 装到机器人的脑子里。

看他们放出来的视频 demo ，这个大概一米七的机器人，不仅能听懂人话，做起事儿来也相当麻溜。

问站它在那里都能看到啥，还没反应几秒，就能说出答案：苹果、水杯等等，连工作人员站在一旁，手搭在桌子上的细节都能准确讲出来。

随后，问它能不能递些吃的东西过来，这次都没怎么反应，就把苹果拿给了工作人员。

这还不算最厉害的，这个机器人的手指也是相当灵活了，让它捡桌子上的纸团时，它丝毫没把纸团搞变形，力度起到好处，感觉下一步就能揉面包饺子了。。。

整理起桌面来，也是有条不紊的，不过有时候反应的时间确实有点久。

而且视频里的这些操作，全都是机器人的 “ 自主意识 ” ，没加速，远程操作也是不存在的。

照工程师的说法，它现在就跟刚会说话的幼儿差不多，能讲出看到了什么，也能做些简单的行动计划，短期内发生了啥也能记起来。。。

不知道大伙看到这个视频反应是啥样，至少差评君工作群里都是直呼 “ 牛 X ” 的程度，甚至有同事已经开始担心起智械危机了。

要知道，这距离 OpenAI 宣布和 Figure 合作，才过去两个星期。

而除了 OpenAI 之外，微软、英伟达和亚马逊创始人杰夫 · 贝佐斯也都入了 Figure 的伙。

另外，世超发现 Figure 也算是一个非典型机器人公司，包括波士顿动力在内，一般机器人公司的创始人都是学术圈大佬。

而 Figure 创始人的 Adcock ，却是个驰骋商海的富哥们儿，在办 Figure 之前，手里有个招聘公司 Vettery ，还是一家起降飞机企业 Archer Aviation 的大股东。

就在前年，他说为了造福全人类，准备一门心思搞人形机器人，就把招聘公司卖了，又退出了 Archer Aviation ，拿到的钱准备全砸在 Figure 上。

人才的话，也基本靠挖，波士顿动力、特斯拉、谷歌这些大厂都被他挖了个遍。

有了人才好办事，到第二年年初， Figure 就做出了五个机器人原型，简单走走、搬重物都不在话下。

直到今天，和 OpenAI 合作搞出了 Figure 01 一鸣惊人。

网上全都是一水儿的好评，有人说 “ AGI 即将到来 ” ，也有人拉踩了一波隔壁的波士顿动力，说他家的机器人只会跳舞。

世超看到这个视频，也很兴奋，麻溜找了找搞人形机器人的朋友聊了聊，他们的评价也出奇的一致，觉得 Figure 01 牛 x ，但大家，似乎没夸对地方。

首先， Figure 01 的出现，并没有让波士顿动力机器人跌落神坛。

因为衡量人形机器人厉不厉害有两个标准，一个是 “ 脑子 ” ，另外一个是 “ 身体 ” 。波士顿动力在 “ 身体 ” 上依旧是业内公认最强。

Figure 01 则没展示很多大幅度、高强度的动作，身体协不协调根本看不出来。

而 Figure 01 的牛当然不在于身体，而是在于它告诉大家借助大模型的魔力，人形机器人是可以自主做计划、执行任务、有记忆、听懂人话的。

要知道在此之前，人形机器人一直都是偏科的体育生，身体不错但是文化课挂科。

如果，咱是说如果脑子 + 身体都一级棒。那这段时间爆火的 “ 具身智能 ” 概念成真。

具身智能，说白了就是让人形机器人像人类一样，能够与真实的世界进行交互。学界还给它划分了五个阶段，像是计算功能智能、计算感知智能、认知智能、内生智能和自主智能。

去年的 ITF World 2023 半导体大会上，那个爱穿皮衣的男人就公开给具身智能站台，说它就是 AI 的下一个浪潮。

而现在的 Figure 01 ，则在第二阶段和第三阶段中间。

但即便如此，世超觉得距离人形机器人飞入寻常百姓家，估计也还有不少距离。

一方面无论是 “ 脑子 ” 还是 “ 身体 ” ，都还有难点没突破。

比如这 “ 脑子 ” 的训练数据，是咱们和现实世界物理交互的数据，目前已经稀缺，和 ChatGPT 的文本数据相比，真就九牛一毛了。

在身体这块儿，连完全模仿人类的五只手指都还做不到。

另一方面，人形机器人的商业化路径还没有共识。

通用机器人不是在一个成熟的技术里找产品，而是边突破技术边界边找到产品化的机会，要知道，即便火如大模型，目前最成功的产品也只是聊天机器人而已。

不过，技术不是线性发展的，如果突破点出现，后面人形机器人的发展肯定也是井喷式的。

这条路，也永远都不缺探路者，这两年，做人形机器人的企业是越来越多了，大厂里像是特斯拉的擎天柱，国内也有小米 CyberOne 、智元机器人，逐际动力等等。

所以世超的预测，也很可能被打脸。

当然世超也很希望被打脸，对了，如让人形机器人写稿的话，它应该不会拖搞吧。