揭秘OpenAI的AGI计划:超智能的五大步骤

发表时间: 2024-07-13 12:00

关注公众号【真智AI】

TOP AI模型智能问答|绘图|识图|文件分析

每天分享AI教程、赚钱技巧和前沿资讯!

OpenAI 已迅速成为最重要的 AI 公司之一,其模型被苹果和微软使用,并在 ChatGPT 上拥有数百万月度订阅用户。但该公司表示,其目标仍然是构建 AI 超级智能。尽管使用 GPT-4o 或 Claude 3.5 Sonnet 等模型,你可能会认为我们已经接近实现“通用人工智能”(AGI)的初始目标,但 Bloomberg 的一份新报告表明,我们距离创建 AGI 仍有一段路要走。

根据 Bloomberg 未具名的消息来源,OpenAI 有 5 个步骤来实现 AGI,目前我们刚刚进入第二步——创建“推理者”。这些模型能够执行与拥有博士学位且无需教科书的人类一样的解决问题的任务。OpenAI 的首席技术官 Mira Murati 之前表示,下一代模型(广泛猜测称为 GPT-5)将具备广泛领域的博士级智能,但我们不太可能在明年之前看到这一新模型。

什么是 AGI?

通用人工智能(AGI)是一种在所有任务上都能表现优于人类的 AI。它们对世界有广泛的、一般性的理解,能够进行一定程度的独立思考和推理,从而能够在现实世界中不受监督地采取行动。这种智能水平被认为是实现通用用途场景(如真正的无人驾驶汽车、能够在各种环境中工作的自主机器人以及可以充当个人助理甚至同事的 AI 模型)所必需的。

包括 Anthropic、OpenAI 和 Google DeepMind 在内的所有大 AI 实验室都将创建 AGI 作为其主要目标,他们发布的产品只是通往这一目标的步骤。

AGI 的 5 个步骤是什么?

名称

描述

聊天机器人

具有自然对话语言能力的 AI

推理者

在广泛主题上具有人类水平问题解决能力的 AI

代理

能够独立执行任务或根据人类指令执行任务的 AI 系统

创新者

能够协助发明新思想并贡献人类知识的 AI

组织者

能够独立完成一个组织的所有工作的 AI

OpenAI 尚未确认这些步骤的真实性,但 Murati 和其他人的评论表明它们可能是正确的。下一步是在“推理者”之后创建“代理”——能够在不同领域执行各种任务且无需人类输入的 AI 模型。

第一步:聊天机器人

第一步是“聊天机器人”或“具有对话语言的 AI”。这在第一版 ChatGPT 的 GPT-3.5 中得以实现,并且在此之前已经基本实现,只是效果不如现在自然。与 Siri 或 Alexa 的对话相比,ChatGPT 或 Gemini 的对话是天壤之别,这就是因为后者是对话 AI。像 GPT-4o、Gemini Pro 1.5 或 Claude Sonnet 3.5 这样的大型本地多模态模型处于这一水平的顶端,能够进行复杂的多线程对话,具有记忆能力,并能够进行有限的推理。

第二步:推理者

第二步的 AI 是“推理者”。OpenAI 表示,这些模型能够在广泛领域内进行“人类水平的问题解决”,而不仅仅是针对一两个特定任务。目前许多前沿模型在特定任务上具有人类水平的问题解决能力,但没有一个能够在没有非常具体的提示和数据输入的情况下,在广泛层面上实现这一点。与 GPT-3.5 处于第一步初期一样,第二步初期可能在今年通过中级模型实现。预计 OpenAI 将在年底前发布 GPT-4.5(或类似版本),并随着它提高推理能力。同时,Anthropic 预计将在未来几个月推出 Claude Opus 3.5,这是 Claude 3.5 Sonnet 的升级版,我们还在等待 Google 的 Gemini Ultra 1.5,这是 Gemini 模型家族的最大版本。

第三步:代理

第三步是 AI 模型开始能够创建内容或执行不需要人类输入的行动,或者至少按照人类的总体方向进行操作。OpenAI 首席执行官 Sam Altman 之前暗示,GPT-5 可能是一个基于代理的 AI 系统。有许多公司在构建代理系统,包括 Cognition 的 AI 软件工程师 Devin,但这些系统使用现有模型、巧妙的提示和设定指令,而不是 AI 自己能够独立完成的事情。

第四步:创新者

第四步是 AI 变得更加创新,能够“协助发明”。这可能是 AI 添加到人类知识总和中的地方,而不仅仅是从已创建或共享的内容中提取。如果你要求 AI 创建一种新语言,而不给它具体的词汇,它今天会给你一个 Esperanto 版本,而未来它可能会从头开始构建。OpenAI 与洛斯阿拉莫斯国家实验室建立了新的合作伙伴关系,以开发基于 AI 的生物科学研究。这在更直接的层面上是为了在实验室环境中安全使用 AI,但也可能帮助制定计划,以便 AI 能够发明自己的创造物。

第五步:组织者

最后一步,也是可以说实现 AGI 的时候,是当一个 AI 模型能够独立运行整个组织,而无需人类输入。为了实现这一能力,它需要具备前几个阶段的所有能力和技能,以及广泛的智能。要运行一个组织,它需要理解所有独立部分及其如何协同工作。Altman 之前表示,我们可能在本十年内实现 AGI。如果他是对的,那么在 2028 年我们可能不会为一位八旬老人投票,而是向天网低头。

关注公众号【真智AI】

TOP AI模型智能问答|绘图|识图|文件分析

每天分享AI教程、赚钱技巧和前沿资讯!