AI与区块链的融合：开启代理互联网新时代

发表时间: 2024-03-13 09:00

原文标题：The Internet of Agents

原文作者：Davide Crapis

原文来源：notion

编译：Lynn，火星财经

感谢 David Minarsch、David Shi、Cem Dagdelen、Richard Blythman、Xinyuan Sun 和 Barnabé Monnot 的反馈和审阅。

近几个月来，"加密 x AI"（加密货币与人工智能的交叉）或 "加密 + AI"（用人工智能增强加密货币基础设施）的主题一直是人们关注的焦点。区块链社区的许多人对此感到兴奋，有些人持怀疑态度或尚未被说服，有些人则正在构建。区块链和人工智能交汇处的活项目有了新的变化，许多新项目也如雨后春笋般涌现。

过去一年，我一直在这一领域开展研究，特别是关于在区块链基础设施上运行的人工智能代理的研究。我们与以太坊基金会、Flashbots 和 DeepMind 等机构的一些同事共同成立了一个研究小组。我们正在继续推进应用研究，以了解和测试哪种类型的人工智能代理应用最适合区块链，以及我们需要什么样的新基础设施来支持它们。

在这篇文章中，我将论证区块链基础设施与人工智能代理的整合是可取的，它将催生代理互联网：

对当前互联模式的升级，辅以激励措施和现代加密技术，将使我们能够收获由人工智能代理驱动的经济所带来的好处，其安全性、效率和协作潜力将达到前所未有的水平。

然后，我将讨论实现这一目标的途径。我将重点讨论短期用例和应用，其中一些已经在设计和开发之中。我将讨论它们的局限性和潜在的改进，以及人工智能和区块链所需的研究，以便在中期释放新的用例。

区块链作为代理互联网的后台

首先，请允许我说明，本论点的风格将是推测性的，但又是实用的。区块链和人工智能是近十年来发展最为迅猛的两项技术。这两项技术都会对互联网乃至整个人类社会的结构产生深远影响。因此，要对这些技术将如何发展和互动描绘出有意义的愿景，需要一些推测。不过，尽管[缩放定律](
https://arxiv.org/abs/2001.08361)明确指出了快速改进的方向，我还是不会对 AGI 进行长期推测。(尽管最近炒得很热，但我认为自主自我完善的 AGI 在未来还比较遥远，而且目前还不清楚它们会采取什么形式）。

我将专注于中短期的未来，即人工智能采取人类助手和代理的形式。在这种形式下，人工智能是为人类服务的工具，它可以促进人类活动的执行，或为人类开展新的活动。

图 1. 左图：人工智能进化的概念时间轴，性能不断提高。右图：人类和不同形式的人工智能活动框图。

数十年来，各种形式的人工智能助理层出不穷，而最近在 LLM 方面取得的进展表明，新一代人工智能代理的能力将比以前更强，改进速度也更快。以下是我对[人工智能代理](
https://en.wikipedia.org/wiki/Intelligent_agent) 的工作定义：

与世界互动的计算机程序。它通过传感器感知环境（输入数据），自主处理数据（预测和规划），并采取行动以实现目标（行动）。

代理可以受到约束，也可以从环境中学习。如今，代理通常专门针对特定类型的输入和特定类型的行动。例如，聊天机器人（如 ChatGPT）将文本提示作为输入，可能会使用一些工具来生成答案，并以文本输出作出回应。另一方面，交易机器人将过去的市场状态作为输入，预测未来的市场状态和最佳行动，并执行交易。代理可以是不同类型的（例如，聊天机器人是一个 LLM，而交易机器人则是一个小型的 RL 代理），它们还可以[组成以执行任务](
https://github.com/valory-xyz/trader)。未来，我们可能会发现一种通用架构，经过训练后可以处理大多数用例。

区块链具有独特的理想特性

公共区块链具有一系列独特的功能，使其成为人工智能代理通信和交互的良好基础设施。稍后，我们将论证区块链是支持代理人工智能的最佳基础设施，但首先要介绍的是区块链的高级特性。

去中心化：设计良好的区块链协议是去中心化的。此外，去中心化是最初构建和升级这些协议的社区*精神的一部分。它内置于协议中，并通过治理得到安全保护。

激励机制：精心设计的区块链具有健全的激励机制，通过本机资产（例如以太坊中的ETH）驱动经济安全。此外，可编程智能合约使应用程序能够：（1）利用/使用原生资产；（2）发行具有所需属性的新数字资产；（3）为其参与者定义自己的原生资产和激励机制。

开放性和可组合性：区块链平台对用户和应用开发者都是开放的。此外，基于区块链上部署的智能合约的应用程序也继承了相同的开放性和无摩擦可组合性。

加密保证：区块链利用现代加密技术提供独特的安全性、可审计性和可编程隐私性。因此，与传统系统相比，区块链的信任度更低，安全性更高。请注意，区块链黑客攻击来自智能合约漏洞，这在该技术的早期阶段是不可避免的。随着堆栈的成熟，它将变得更加稳健和安全，而依赖于人类信任的传统系统则不具备这种特性。

我们可以将其与只有去中心化功能的传统互联网进行对比。TCP/IP 或 SMTP 等基础层协议是开放的，但在其上构建的几乎所有应用程序都是专有的。这使得互联网的可组合性很差，而我们认为这一特性正是设计代理互动协议的关键。此外，互联网在协议层面完全缺乏激励机制和现代加密技术。

接下来，我们提出了人类与代理合作的理想经济模型，并表明它需要区块链协议所提供的一整套功能。

图 2. 根据 ChatGPT，传统互联网（左）和代理互联网（右）的概念图。

区块链对人工智能代理的益处

快进几年。想象一下，我们现在的人工智能代理可以执行大量人类活动，并拥有足够的决策和规划能力。它们还能自主执行任务，并可能与其他代理协作。代理被广泛应用于社会，并从事对人类具有潜在高价值的活动，包括社会价值和经济价值。

以下是我们希望这种代理人工智能系统及其与人类的互动具备的一些特性/考虑因素，以及区块链如何实现这些特性/考虑因素。

代理系统需求

对齐：代理对齐的某些方面，如价值学习、可解释性和可转向性，取决于人工智能的设计和训练过程，这在大多数情况下不会直接利用区块链。然而，区块链应用的开放性和可组合性可提供独特的机会，使代理活动具有可读性、自动监测和可归属性，这是激励分配和代理系统调整的关键。
安全性：区块链的设计旨在可靠和安全，在对抗环境中以最小的信任假设，这关系到大量价值。通过智能合约应用进行交互的代理继承了这些强大的特性。例如，应用程序可以要求对敏感计算进行证明，而代理权重和输入则可以保持私有。可信智能合约也是限制代理行动空间、设置默认和有条件权限的理想工具。
发现：跨应用环境的开放性允许根据应用状态和代理的过往表现（可被完全观察到）对请求进行更丰富的路由选择。根据代理的行动历史，可以直接设想代理可信地积累声誉，然后以编程方式将声誉用于给定任务的排名和发现最佳代理。
效率：区块链基础设施提高了代理的自主性，允许他们在没有直接人工干预的情况下，以较低的成本执行包括支付在内的相应决策。

人类的需求

控制和可编程隐私：区块链使人类能够直接拥有并保持对其代理的控制，而无需中间人。个人数据可以是私有的，访问可以使用密码学小工具有条件地加以控制，从完全私有的计算（TEE/FHE）到通过zk-proofs对选定属性的可编程共享。
所有权和公平性：人们可以制定协议，集体拥有和管理代理。代理的工作报酬可按程序分配，精确到最微小的几分之一。公平性可以通过协议升级和民主管理来衡量和改善。区块链基础设施与正在开发的现代身份解决方案相配合，还可以支持雄心勃勃的分配计划并使其自动化，例如全民基本收入（或UBI），这是一个重要的长期应用。

关于人工智能供应链的小插曲

值得注意的是，除了通信和互操作性之外，区块链基础设施还能使整个模型生产供应链受益（数据收集、数据整理、培训、微调）。目前正在开发一些应用，包括若干数据收集协议和[计算](
https://akash.network/docs/getting-started/intro-to-akash/akash-network/) [市场](
https://docs.gensyn.ai/litepaper/)。它们是去中心化人工智能堆栈的重要组成部分，但我们不会在这里讨论它们。

图 3. 人工智能供应链（白色）和代理互联网（绿色）。

全球监管与治理

区块链提供了多功能协议，可以可信地执行各种规则和检查。在我看来，这为人工智能市场和应用的全球监管提供了一个独特的机会，可以很容易地对其合规性进行审计和检查。各协议之间的透明性也可以使实时识别偏差和部署纠正修复变得非常容易，而这在传统系统中是不可能实现的。

区块链基础设施的风险和成本

在训练人工智能代理做出敏感和有影响的决策时，开放性并不总是可取的。例如，部署一个开放的权重模型来做出保险承保决策，可能会暴露模型漏洞，增加被利用/攻击的可能性。

解决这一问题的方法之一是利用现代加密技术，保持代理的私密性，但公开其行动。然而，[黑盒对抗式机器学习攻击](
https://posts.specterops.io/learning-machine-learning-part-3-attacking-black-box-models-3efffc256909) 仍有可能发生，而且一般来说，用于安全但可验证的机器学习计算的加密方案实施成本很高，这增加了本已昂贵的训练过程的开销。这是人工智能安全与区块链交叉领域最重要的研究领域之一。我们需要使其在技术和经济上切实可行。最近的一项创新是针对 ML 计算的乐观证明，我将在下文讨论。

另一个[已经讨论过的](
https://www.youtube.com/watch?v=TWHmXYq_ch4)风险是，基于 LLM 的预言机降低了在现实世界中部署能够正确分配激励的物理行动（可能有害）的门槛。这在今天仍是不可能的，但更多的研究应集中在如何启用积极的用例以及如何检测和防止有害行为上。

基于区块链的系统可满足需求增长

不熟悉区块链系统现状的人经常会问的一个问题是，区块链系统是否已经准备好适应用户活动增加所带来的负载。

至少在过去五年里，这一直是区块链研发的重点。如今，我们正处于一个转折点，许多解决方案正在上线，并将可扩展性提高了*个数量级。例如，以太坊的第2层区块链继承了完全的经济安全性和可扩展的数据可用性解决方案，将很快能够每秒处理数万笔交易（TPS）。利用并行化每秒处理数十万笔交易的新链即将上线。共享排序解决方案和安全桥接器将使部署在不同领域的应用程序能够安全高效地互操作。零知识证明聚合技术的进步将使交易成本更低，同时还能实现新型链外计算和混合系统，使安全权衡更加高效。

随着所有这些基础设施创新在未来几年取得成果，毫无疑问，一个成熟的区块链生态系统将能够支持非常高的吞吐量，从现在的数万 TPS 到百万 TPS，每笔交易只需几分钱。

通往代理互联网之路

上图是一张藏宝图，展示了通往代理互联网之路的三个主要步骤。

让我们逐一介绍。

增强当前的去中心化应用

第一步是用人工智能增强当前的区块链应用。人工智能已经在去中心化金融（DeFi）中发挥作用，这是迄今为止采用最多的应用类别。其形式是专门的模型，不断监控市场状态，以采取特定行动。例如：交易机器人、清算机器人、路由机器人、统计套利机器人以及更多执行策略的一般机器人，这些策略旨在从用户交易流中[提取利润](https://libmev.com/)（也称为 MEV）。

随着区块链经济在当前的 DeFi 基础上不断发展，我们自然可以从这里入手，讨论利用人工智能的机会。

DeFi增强

区块链协议目前已实现自动化，但与之相连的接口却非常人工化，有时甚至非常笨拙，而且往往效率低下。在智能代理的调解下，人工智能有可能成为连接人类与链上市场的新界面。至少在以下三个领域存在增强当前协议的具体机会。

用户意图匹配：用户与人工智能代理互动，交流（有时是构建/细化）他们的意图，人工智能将其与用户委托给它的一连串链上操作相匹配。意图的形式可以是单个目标和若干防护栏，行动可以是单个单一事务或结构化计划，在较长时间范围内执行。一个简单的意图示例是
"我想以不高于 Z 美元的价格获得 X 单位的 Y 代币"，或
"我想在未来六个月内每月投资 Z 美元到以太坊第 2 层项目"，或
"我想用 EigenLayer 重塑我的 $ETH 并将其委托给 AVS，APR 至少为 X%，风险系数最多为 Y%"。

第一个例子只需要几笔交易，而其他例子则需要制定计划、在计划期限内通过多笔交易执行计划、多个价格馈送、风险和收益预测模型以及上下文信息。

行动规划和路由：在以太坊区块链上发送交易的基础设施越来越成熟和复杂。现在有不同的路由针对不同的需求进行优化：安全、速度、价格效率、隐私。甚至还有一种协议旨在[让部署新路由变得更容易](https://writings.flashbots.net/mevm-suave-centauri-and-beyond)。与目前 DEX 聚合器在单个交换方面所做的工作类似，还可以设计出更先进的路由算法，将更广泛的交易供应链背景和各种应用考虑在内。特别是在代表用户或从第一层协议购买服务的第二层应用程序规划长期战略时，行动空间相当大，而且随着新机制的部署，行动空间还在不断扩大。例如，用户投资组合优化的最佳计划可能是将部分资金重新部署到更便宜的第 2 层，并在那里执行投资。
共享基金和资产池：创建和管理基金，许多人汇集资源，商定目标，然后委托人工智能代理执行。这需要意向匹配和行动规划两个方面，还需要区块链能够独特提供的共享所有权机制。例如，现代版的数字艺术品收藏家代理将需要所有这些功能，同时还要利用最新一代 LLM 所拥有的更丰富的上下文，既要综合社区偏好，又要识别与之匹配的资产。

在所有这些情况下，我们都有一个主要的人类或社区，将高价值的链上行为外包给一些运行在链外的代理。因此，我们非常需要推理保证。这可以通过两种方式实现：

运行一个具有自身安全假设的链外代理网络。例如，利用[来自锚链上资产的经济安全](https://docs.autonolas.network/open-autonomy/get_started/what_is_an_agent_service/)或[通过重置实现的 ETH 经济安全](https://ritual.net/blog/eigenlayer)，或[运行 L1](https://bittensor.com/whitepaper)与[特意设计的激励机制](https://allora.network/allora-litepaper.pdf)。
使用链上智能合约设计一个代理协调协议，该协议要求推理证明行动的有效性。这可以通过 [zkML](https://www.modulus.xyz/)（zk-证明）或 [opML](https://www.ora.io/app/opml/sd)（乐观证明）来实现。这两个领域的进展都很快，但 opML 是一个非常有趣的解决方案，它可以经济地保证大型 LLM 执行的安全，而如今使用加密安全的 zk-proofs 是不可能的，或者说成本过高。

为协议提供人工智能服务

与此相关的一个类别是利用自主代理增强协议基础设施，而不是零售应用。在这里，大多数应用与正在为传统商业服务构建的基于代理的产品类似，但这些代理可以利用区块链的开放性、活泼性和数据丰富性。

例如，作为智能合约[安全审计员/测试员](https://www.pixee.ai/)的代理、分析代理以及[自动财务和风险管理服务](
https://www.gizatech.xyz/collection/yearn-risk-assessment)。以 Web3 为重点的公司已经提供了各种类型的服务，但代理自主性和推理证明方面的进步为去中心化和[从关键服务到协议操作消除信任]提供了机会(
https://www.gizatech.xyz/collection/ai-actions)。

一个新的应用领域是内容策划。随着 Farcaster 和 Lens 等去中心化社交媒体的兴起，代理自动/中介式策划出现了新的机遇。不过，这需要创建新的机制来协调代理合作，我们现在就来介绍一下。

为代理服务创建新机制

我们可以利用区块链的超强能力，创建可信的承诺设备，实现直接利用代理用户的新应用和新市场机制。在这里，我们将开始观察协调众多代理的力量，以提供新的服务。我们在[我们最近的论文](
https://arxiv.org/abs/2311.07815)中详细讨论了这个话题，这里我想重点谈谈几个具体的应用。

人工智能预测市场

近期最令人兴奋的具体应用是人工智能预测市场。DeFi释放了在区块链上交易长尾资产的能力，例如小型协议实用代币，这些代币无法在传统市场上交易，因为运营支持它们的基础设施成本太高。人工智能预测市场有可能对[超长尾](
https://www.coindesk.com/consensus-magazine/2024/03/04/how-ai-crypto-will-lead-to-a-hyper-financialized-future/)资产做同样的事情。人们关心的最微小事件的结果都可以代币化并进行交易。这些市场要发挥作用，需要

有效的价格发现：包括有意义的流动性和可观的交易量，以实现信息聚合。
可信的市场解决：市场需要可信、高效的解决。

人工智能可以通过让[专门的交易代理查询 LLM 以获得事件的概率估计，然后下注](
https://github.com/valory-xyz/trader?tab=readme-ov-file)来自动执行这些操作，正如最近的[大规模竞赛](
https://www.valory.xyz/post/prediction-agent-hackathon-success)所显示的那样。还有人建议，[多轮争议协议可用于自动解决市场问题](
https://vitalik.eth.limo/general/2024/01/30/cryptoai.html)，LLMs 可参与早期回合，只有升级到后期回合的情况才需要人类参与。

一旦这些市场发挥作用，它们就会成为以完全自主的方式评估微小不确定性的新工具，而无需依赖可能面临安全威胁或偏见的中央机构。在此基础上可以构建各种应用：小额保险、金融产品、去中心化社交媒体的内容管理、垃圾邮件过滤等。

为专用模型提供可靠高效的路由

如今，大多数人与人工智能的交互都是在专有环境中孤立进行的，使用的是通用模型，要么是封闭的"前沿"模型（重型模型），要么是开放权重模型（轻型模型）。然而，[GPT 商店](
https://openai.com/blog/introducing-the-gpt-store) 和[类似聚合器](https://flowgpt.com/) 的早期成功表明，上述交互模式只是进入具有代理能力和专门技能的大量 GPT 的入口（即，我们很快就会从解释扑克规则到玩扑克，从规划旅行路线到预订全程旅行）。

在这样的世界里，显然需要高效地将用户会话路由到能以最佳方式满足其意图的最佳专业模型上。当代理代表用户进行交易时，将从服务用户中获取巨大价值。路由器/中介方（提取租金）和终端模型方（虚报结果/性能以获取更多流量）都有动机提取价值。因此，显然需要可信的路由机制和市场，让服务提供商通过竞争来满足用户的偏好。这是一个即将到来的应用领域，我对此感到非常兴奋。

新市场的基石

随着越来越多具备专业技能的代理被部署到链上并积累历史，一个更强大的基础设施的基石就可以被开发出来。例如，代理发现协议，包括基于过去结果和代理排名的声誉、基于预测结果的微服务自动竞价等。

这是一个需要数年时间才能完全实现的迭代过程，随着每一波新的代理服务协议的创建，这种通信、声誉和交换基础设施都会发生新的迭代。最终的目标将是建立最高效的数字协调机制系统，该系统极其廉价且无需租金，将成为世界经济中越来越大份额的支柱。最终，随着代理能力的不断提高，越来越多的现实世界活动实现了自动化，我们可以预见，大部分社会经济交流都将在这一基础设施上进行。

扩大共享所有权和治理规模

智能代理生产系统一旦形成规模，解决共享所有权、公平价值分配和治理问题将至关重要。区块链为实现这一解决方案提供了基础。如今，我们还处于早期试验阶段，但已经出现了一些有趣的模式。我们有两个极端：

直接所有权和治理最小化：这是一种协议治理最小化的模式，类似于比特币。协议是最小的，也是相对固定的。代理资产/资源所有权机制非常简单，代理资产由其创建者直接拥有，并根据使用情况按比例累积价值。有一个原生网络代币，它既可以作为实用工具，支付服务费用，也可以作为有价值的资本资产，奖励贡献。
共享所有权和 DAO 治理：在另一个极端，有更丰富的协议，更类似于我们今天在以太坊之上看到的应用程序。这里有丰富的协议规范，其参数可通过明确的治理流程进行更改。原生代币可用于治理，并具有更丰富的激励机制，能够共享系统不同组件的所有权。

前者类似于[Morpheus](
https://github.com/MorpheusAIs/Docs/blob/main/!KEYDOCS%20README%20FIRST!/WhitePaper.md)正在进行的实验，后者类似于[Olas](
https://olas.network/documents/whitepaper/Whitepaper%20v1.0.pdf)，这是两个建立自主代理经济体的早期尝试。我们仍处于这些基于代理的新型协议的早期阶段，将会有新的应用和新的功能，它们很可能会改变激励机制和所有权模式的设计方式。这只是两个截然不同的例子，说明协议设计者可以采用多种解决方案。最后，请注意，除了代理经济之外，人工智能堆栈的其他层面也存在类似问题，类似的解决方案可用于激励人工智能培训、数据和基础设施服务。