大多数关于仿人机器人的报道都集中在硬件设计上,这是可以理解的。鉴于仿人机器人的开发者们经常把"通用型仿人机器人"这句话挂在嘴边,我们应该更多地关注第一点。经过几十年单一用途系统的发展,向更通用系统的跳跃将是一个大问题。只是我们还没到那一步。
研究人员一直在努力开发一种机器人智能,使其能够充分利用双足仿人设计所带来的广泛运动能力。在机器人技术中使用生成式人工智能也是近期的热门话题。麻省理工学院的最新研究表明,后者可能会对前者产生深远影响。
在通往通用系统的道路上,最大的挑战之一就是培训。我们已经掌握了培训人类从事不同工作的最佳方法。机器人技术的方法虽然前景广阔,但却支离破碎。有很多有前途的方法,包括强化学习和模仿学习,但未来的解决方案可能会涉及这些方法的组合,并通过生成式人工智能模型加以增强。
麻省理工学院团队提出的主要用途之一,就是从这些小型特定任务数据集中整理相关信息的能力。这种方法被称为策略合成(PoCo)。任务包括有用的机器人动作,如敲钉子和用锅铲翻转东西。
团队指出:"[研究人员]训练一个单独的扩散模型,学习一种策略或政策,利用一个特定的数据集完成一项任务。然后,他们将扩散模型学习到的策略组合成一个通用策略,使机器人能够在各种环境下执行多项任务。"
根据麻省理工学院公布的数据,采用扩散模型后,任务性能提高了 20%。这包括执行需要多种工具的任务的能力,以及学习/适应陌生任务的能力。该系统能够将来自不同数据集的相关信息整合到执行任务所需的行动链中。
"这种方法的好处之一是,我们可以将政策结合起来,以获得两个世界的最佳效果,"论文的第一作者王立瑞说。"例如,在真实世界数据基础上训练的政策可能会更灵巧,而在模拟基础上训练的政策可能会更通用"。
这项具体工作的目标是创建智能系统,使机器人能够交换不同的工具来执行不同的任务。多用途系统的普及将使该行业离通用梦想更近一步。