超越局限：ChatGPT并非终极AGI交互形态的真实现状揭秘

发表时间: 2024-10-07 16:25

美国时间周四，OpenAI推出了Canvas功能，还没真正用上呢，不少人看着展示视频就纷纷喊着“炸裂”、“震撼”、以及“这就是AGI终极交互形态”。

作为AI领域的“流量密码”，OpenAI每次发布新产品都会迎来一片喝彩，但“一边倒”的热捧真的有理吗？

我们决定不跟风，在拿到Canvas的beta权限并且亲自试用之后，才来和大家分享真实的使用体验。

先说结论：Canvas并不如外界传言般“炸裂”，更不是“AGI的终极交互形态”。

首先，我们来看看Canvas究竟是什么？

简单来说，是ChatGPT里一个内置的新交互体验，可以弹出页面以更好地辅助用户进行写作（writing）和编码（coding）。

你可以通过在提示中输入“使用画布（use canvas）”来手动打开，ChatGPT也会在检测到可能有用的场景时，自动打开Canvas。

进入到Canvas的界面，它会在右下角有几个用于写作和编码的快捷键。

对于写作项目，用户可以要求 ChatGPT 提供编辑建议或长度调整，或者要求它将一段文本的阅读级别从研究生水平降低到幼儿园水平。它还可以添加“相关的表情符号以强调和着色”。

程序员可以让 ChatGPT 审查他们的代码并添加内联改进建议。它还可以用日志和注释标记您的工作，以帮助调试并使您更容易理解代码。它还能够在 Canvas 模式下修复错误并将编码移植到不同的语言，例如 JavaScript、TypeScript、Python、Java、C++ 或 PHP。

更直观的来说，Canvas的推出，就好像ChatGPT同时内置了Notion和GitHub Copilot。

听起来很强大是不是？毕竟Notion号称坐拥1亿用户，年营收2.5亿美元，而GitHub Copilot拥有130万付费用户，年营收20亿美元。

仅仅一个Canvas就能同时提供这两种服务，这简直就是“终极AGI交互的未来”啊，OpenAI的研究员Karina Nguyen最先在推特上发出了这样的“感叹”。

随后，其他舆论也纷纷跟进，一边倒的站在Karina Nguyen身边。

为什么说Canvas既不够“炸裂”也不是AGI终极交互形态？

我们从触发Canvas这一步说起。

在展示视频里，输入“help me write an api webserver in rust”的prompt之后， ChatGPT自动跳转进入了Canvas界面，并生成了代码，就像VSCode的界面那样。

我复制了一段html代码，并要求ChatGPT帮我review一下，在输入这些之后，并没有触发Canvas功能，还是停留在原本的页面。

于是我改变策略，提出了“生成一个用来获取纳斯达克近年来的数据，并进行分析的Python脚本”这样的prompt。

这次才成功触发了Canvas。

目前，ChatGPT并不能100%准确的识别需要触发Canvas的场景，但你可以通过“use Canvas”或者“open Canvas”之类的非常明确的prompt让它直接触发。

在周四公布Canvas功能的博客里，OpenAI也承认目前触发Canvas的正确率分别在83%（写作任务）和 94%（编程任务）。

编程体验不如微软的GitHub Copilot。

在让ChatGPT Canvas生成代码之后，同样的，我要求微软的GitHub Copilot也基于同样的prompt——“生成一个用来获取纳斯达克近年来的数据并进行分析的Python脚本”——来生成代码，得到了下面的结果：

两者给出了具备基本功能的代码，但ChatGPT生成的代码看起来更细致一些。

在功能多样性上，我们可以看到Canvas界面的右下角，有五个快捷键，分别是：

1.检查代码（Review Code）：ChatGPT 提供内联建议，以优化和提升代码质量。

2.添加日志（Add Logs）：插入日志语句，以便调试和深入理解代码的执行过程。

3.添加注释（Add Comments）：向代码添加注释以使其更易于理解。

4.修复错误（Fix Bugs）：检测并重写有问题的代码。

5.移植到语言（Port to a language）：将代码转换为 JavaScript、TypeScript、Python、Java、C++ 或 PHP 等编程语言。

这些功能GitHub Copilot也都提供，甚至更多。

初体验上，Canvas和GitHub Copilot打个平手。

但真正超越Canvas的地方在于，GitHub Copilot与开发者的IDE（如Visual Studio Code）深度集成。

GitHub Copilot直接在IDE中工作，为开发者提供实时的代码建议和补全。这种无缝衔接大大简化了工作流程，省去了在聊天界面和编辑器之间来回切换的麻烦。

相比之下，Canvas依托于ChatGPT这样一个聊天工具，开发者仍需要手动将它生成的代码复制粘贴到IDE中，才能运行。

想想看，你是愿意对着一个聊天框苦哈哈地描述你想要的代码，在它生成代码后，手动复制粘贴到IDE里？还是希望在IDE里有个实时跟进的AI助手，在你敲代码的时候默默地跟着你的思路，随时蹦出补全建议？

自动补全功能也是开发者们认为GitHub Copilot优于包括ChatGPT和Claude等提供AI代码编写功能的聊天机器人的地方。

Copilot可以根据开发者刚刚输入的几行代码自动补全后面的代码，这种“联想式编程”极大地提高了代码编写速度，而ChatGPT则需要手动描述任务或询问才能生成相应的代码。

另一方面，GitHub Copilot对项目整体的理解能力是优于Canvas的。GitHub Copilot可以基于整个代码库或项目的上下文来理解代码结构，识别变量、函数、类等内容，而ChatGPT Canvas的代码生成基于当前对话的内容，无法直接读取用户的整个代码文件，因此对项目上下文的理解有限。

而ChatGPT尽管在生成代码、解释概念以及回答编程问题方面表现出色，但在编程效率和与开发流程的深度融合方面不如GitHub Copilot，而这正是开发者最需要的地方。

在文字生成方面，它有的功能Notion都有，而且更强。

为了测试Canvas的文字生成功能，我让它帮我给一位六年多没见的朋友写一封信，表达我的思念之情。

输入prompt之后，ChatGPT自动触发Canvas界面，并且生成了内容。

邮件内容没有什么可挑剔的地方。在界面的右下角依然是有几个快捷键，分别是：

1.建议修改：ChatGPT 提供内联建议和反馈。

2.调整长度：根据需要缩短或加长文档。

3.更改阅读水平：调整阅读难度，从幼儿园到研究生水准。

4.最终润色：检查语法、清晰度和一致性。

5.添加表情符号：加入相关表情符号，增添强调和色彩。

我一一进行了尝试，效果如下图：

整体还是挺丝滑的，没什么可以挑剔的。但我转念一想，Canvas的文字生成体验离让我感到“炸裂”还是挺遥远的，我常用的Notion早有这些功能了啊。

于是我让Notion也给我六年不见的朋友写封信，效果也不差。Canvas五个快捷键包含的功能，它也有，并且还有专门针对文档协作管理的更多细分功能。（如下图）

两年前Notion就推出了beta版本的Notion AI，在上周正式向所有用户开放。

Notion AI采用了包括OpenAI的GPT 和Antropic的Claude 在内的多个大型语言模型，在多样性和灵活性上显然高于Canvas。

另外，Notion AI与Notion现有的组织、标记和链接工具无缝结合，用户可在同一平台内完成从内容生成到组织的全过程，避免了在多个应用间切换的麻烦；充分利用了Notion平台的协作特性，支持团队成员在共享文档中进行实时协作。

这种无缝集成让用户能在熟悉的环境中直接使用 AI 功能，显著提高工作效率，此外，Notion AI 对用户工作环境的深入理解使其能提供更加精准和相关的建议，这是像ChatGPT Canvas这样的独立AI工具难以企及的。

无论是Notion还是GitHub Copilot与Canvas的对比，都指向了关于AGI普及的两种主要发展路径的探讨。

第一种路径由OpenAI、Anthropic等大模型供应商主导。

他们希望将大模型不仅作为基础设施提供，还发展成为一个平台，成为用户接触各类服务的主要入口。

这些公司致力于围绕AI构建更多的应用，形成自有生态系统。例如，OpenAI的ChatGPT不再仅仅是聊天机器人，通过插件集成、与文档和API连接，提供生产力工具的多样化服务，最近的Canvas更是OpenAI“野心”的直接体现。

另一条路径则由软件服务商主导，思路是“为应用加上AI”。

在这种模式下，AI作为现有工具的增强功能，而不是一个独立的平台，其作用在于优化和提升现有软件的智能性和效率。

微软、Google等公司将大模型嵌入到生产力工具中，如GitHub、Word、Excel、Google Docs和Google Emails等，使得用户在熟悉的工作流中享受到智能辅助，如文本自动生成、数据分析和智能建议等功能，更加贴近用户需求，提升工作效率。

这种路径强调的是“增强而非替代”——优化已有工具和流程，而不是另起炉灶，创建一个新的平台。目前来看，用户更倾向于软件服务商推动的这条路径，因为它依托于大众熟悉的工具，无需适应新平台，且实现了无缝的智能化增强。

正因如此，在HackerNews上，开发者们也普遍表达了类似的看法：

“这（Canvas）很酷，但我希望它能集成到已有的编码和写作工具中，而不是作为一个单独的应用程序。”

“如果Apple在Pages等应用中添加类似功能，我一点也不会感到惊讶。看来他们对AI的态度是将其集成到现有应用和体验中，而不是制作独立的AI应用。我觉得这些独立应用更多是技术演示，展示了可能实现的功能，而不是最终普及的应用形态。”

估值越高，OpenAI越“焦虑”

本周三，OpenAI宣布完成66亿美元的新一轮融资，估值达到1570亿美元。本轮融资由Thrive Capital牵头，微软、英伟达、软银、阿联酋投资公司MGX等参投。

尽管这轮融资标志着OpenAI的估值在九个月的时间里翻了一番，但也意味着更大的压力还在前头。

翻开《纽约时报》披露的财务数据，就能看出问题所在：今年OpenAI预计能赚37亿美元，听起来不少了吧？可问题是，光是运营成本和七七八八的开销，就能让公司亏掉50亿美元。

即便收入可观，OpenAI依然“深陷”入不敷出的困境。

更要命的是，投资人也不愿意继续不计回报的“烧钱”了，作为这轮融资的附加条件：公司必须在两年内转型为营利性企业，否则融资将转为债务。

如果无法完成这一转型，OpenAI将面临多重挑战：现金流紧张、债务负担加重、融资能力受限，甚至可能导致公司控制权的改变和创始人股权的稀释。这些潜在风险都将严重影响公司的发展轨迹。

因此，在本轮融资条件公布前，OpenAI已经宣布了架构重组计划，从非盈利向营利部门转型。如今看来，这更像是外部压力下的被动选择。

飞涨的估值也难以掩盖OpenAI对于盈利的焦虑。

Canvas项目的推出是它拓展商业化路径最新的努力，未来我们可能会看到更多类似尝试。

随着OpenAI增强其技术能力和商业模式独立性，它与微软之间的合作关系或许也会更多的演变为“对抗”，例如Canvas与GitHub Copilot的挑战便是一个例证。

然而，核心问题依然存在：AGI的规模化应用何时才能真正实现？只有解决这个问题，才能从根本上降低运营成本、减少亏损。这不仅是OpenAI面临的挑战，也是整个AI行业必须面对的课题。

超越局限：ChatGPT并非终极AGI交互形态的真实现状揭秘

首先，我们来看看Canvas究竟是什么？

为什么说Canvas既不够“炸裂”也不是AGI终极交互形态？

估值越高，OpenAI越“焦虑”

热门阅读

推荐阅读