昨天,GPT-4.5 的消息在各大论坛传得是沸沸扬扬,世超以为 OpenAI 要出来反击 Claude 了。
没想到第二天凌晨, OpenAI 借着另一家机器人公司,祭出另外一个杀手锏——把 ChatGPT 装到机器人的脑子里。
看他们放出来的视频 demo ,这个大概一米七的机器人,不仅能听懂人话,做起事儿来也相当麻溜。
问站它在那里都能看到啥,还没反应几秒,就能说出答案:苹果、水杯等等,连工作人员站在一旁,手搭在桌子上的细节都能准确讲出来。
随后,问它能不能递些吃的东西过来,这次都没怎么反应,就把苹果拿给了工作人员。
这还不算最厉害的,这个机器人的手指也是相当灵活了,让它捡桌子上的纸团时,它丝毫没把纸团搞变形,力度起到好处,感觉下一步就能揉面包饺子了。。。
整理起桌面来,也是有条不紊的,不过有时候反应的时间确实有点久。
而且视频里的这些操作,全都是机器人的 “ 自主意识 ” ,没加速,远程操作也是不存在的。
照工程师的说法,它现在就跟刚会说话的幼儿差不多,能讲出看到了什么,也能做些简单的行动计划,短期内发生了啥也能记起来。。。
不知道大伙看到这个视频反应是啥样,至少差评君工作群里都是直呼 “ 牛 X ” 的程度,甚至有同事已经开始担心起智械危机了。
要知道,这距离 OpenAI 宣布和 Figure 合作,才过去两个星期。
而除了 OpenAI 之外,微软、英伟达和亚马逊创始人杰夫 · 贝佐斯也都入了 Figure 的伙。
另外,世超发现 Figure 也算是一个非典型机器人公司,包括波士顿动力在内,一般机器人公司的创始人都是学术圈大佬。
而 Figure 创始人的 Adcock ,却是个驰骋商海的富哥们儿,在办 Figure 之前,手里有个招聘公司 Vettery ,还是一家起降飞机企业 Archer Aviation 的大股东。
就在前年,他说为了造福全人类,准备一门心思搞人形机器人,就把招聘公司卖了,又退出了 Archer Aviation ,拿到的钱准备全砸在 Figure 上。
人才的话,也基本靠挖,波士顿动力、特斯拉、谷歌这些大厂都被他挖了个遍。
有了人才好办事,到第二年年初, Figure 就做出了五个机器人原型,简单走走、搬重物都不在话下。
直到今天,和 OpenAI 合作搞出了 Figure 01 一鸣惊人。
网上全都是一水儿的好评,有人说 “ AGI 即将到来 ” ,也有人拉踩了一波隔壁的波士顿动力,说他家的机器人只会跳舞。
世超看到这个视频,也很兴奋,麻溜找了找搞人形机器人的朋友聊了聊,他们的评价也出奇的一致,觉得 Figure 01 牛 x ,但大家,似乎没夸对地方。
首先, Figure 01 的出现,并没有让波士顿动力机器人跌落神坛。
因为衡量人形机器人厉不厉害有两个标准,一个是 “ 脑子 ” ,另外一个是 “ 身体 ” 。波士顿动力在 “ 身体 ” 上依旧是业内公认最强。
Figure 01 则没展示很多大幅度、高强度的动作,身体协不协调根本看不出来。
而 Figure 01 的牛当然不在于身体,而是在于它告诉大家借助大模型的魔力,人形机器人是可以自主做计划、执行任务、有记忆、听懂人话的。
要知道在此之前,人形机器人一直都是偏科的体育生,身体不错但是文化课挂科。
如果,咱是说如果脑子 + 身体都一级棒。那这段时间爆火的 “ 具身智能 ” 概念成真。
具身智能,说白了就是让人形机器人像人类一样,能够与真实的世界进行交互。学界还给它划分了五个阶段,像是计算功能智能、计算感知智能、认知智能、内生智能和自主智能。
去年的 ITF World 2023 半导体大会上,那个爱穿皮衣的男人就公开给具身智能站台,说它就是 AI 的下一个浪潮。
而现在的 Figure 01 ,则在第二阶段和第三阶段中间。
但即便如此,世超觉得距离人形机器人飞入寻常百姓家,估计也还有不少距离。
一方面无论是 “ 脑子 ” 还是 “ 身体 ” ,都还有难点没突破。
比如这 “ 脑子 ” 的训练数据,是咱们和现实世界物理交互的数据,目前已经稀缺,和 ChatGPT 的文本数据相比,真就九牛一毛了。
在身体这块儿,连完全模仿人类的五只手指都还做不到。
另一方面,人形机器人的商业化路径还没有共识。
通用机器人不是在一个成熟的技术里找产品,而是边突破技术边界边找到产品化的机会,要知道,即便火如大模型,目前最成功的产品也只是聊天机器人而已。
不过,技术不是线性发展的,如果突破点出现,后面人形机器人的发展肯定也是井喷式的。
这条路,也永远都不缺探路者,这两年,做人形机器人的企业是越来越多了,大厂里像是特斯拉的擎天柱,国内也有小米 CyberOne 、智元机器人,逐际动力等等。
所以世超的预测,也很可能被打脸。
当然世超也很希望被打脸,对了,如让人形机器人写稿的话,它应该不会拖搞吧。