原文标题:The Internet of Agents
原文作者:Davide Crapis
原文来源:notion
编译:Lynn,火星财经
感谢 David Minarsch、David Shi、Cem Dagdelen、Richard Blythman、Xinyuan Sun 和 Barnabé Monnot 的反馈和审阅。
近几个月来,"加密 x AI"(加密货币与人工智能的交叉)或 "加密 + AI"(用人工智能增强加密货币基础设施)的主题一直是人们关注的焦点。区块链社区的许多人对此感到兴奋,有些人持怀疑态度或尚未被说服,有些人则正在构建。区块链和人工智能交汇处的活项目有了新的变化,许多新项目也如雨后春笋般涌现。
过去一年,我一直在这一领域开展研究,特别是关于在区块链基础设施上运行的人工智能代理的研究。我们与以太坊基金会、Flashbots 和 DeepMind 等机构的一些同事共同成立了一个研究小组。我们正在继续推进应用研究,以了解和测试哪种类型的人工智能代理应用最适合区块链,以及我们需要什么样的新基础设施来支持它们。
在这篇文章中,我将论证区块链基础设施与人工智能代理的整合是可取的,它将催生代理互联网:
对当前互联模式的升级,辅以激励措施和现代加密技术,将使我们能够收获由人工智能代理驱动的经济所带来的好处,其安全性、效率和协作潜力将达到前所未有的水平。
然后,我将讨论实现这一目标的途径。我将重点讨论短期用例和应用,其中一些已经在设计和开发之中。我将讨论它们的局限性和潜在的改进,以及人工智能和区块链所需的研究,以便在中期释放新的用例。
首先,请允许我说明,本论点的风格将是推测性的,但又是实用的。区块链和人工智能是近十年来发展最为迅猛的两项技术。这两项技术都会对互联网乃至整个人类社会的结构产生深远影响。因此,要对这些技术将如何发展和互动描绘出有意义的愿景,需要一些推测。不过,尽管[缩放定律](
https://arxiv.org/abs/2001.08361)明确指出了快速改进的方向,我还是不会对 AGI 进行长期推测。(尽管最近炒得很热,但我认为自主自我完善的 AGI 在未来还比较遥远,而且目前还不清楚它们会采取什么形式)。
我将专注于中短期的未来,即人工智能采取人类助手和代理的形式。在这种形式下,人工智能是为人类服务的工具,它可以促进人类活动的执行,或为人类开展新的活动。
图 1. 左图:人工智能进化的概念时间轴,性能不断提高。右图:人类和不同形式的人工智能活动框图。
数十年来,各种形式的人工智能助理层出不穷,而最近在 LLM 方面取得的进展表明,新一代人工智能代理的能力将比以前更强,改进速度也更快。以下是我对[人工智能代理](
https://en.wikipedia.org/wiki/Intelligent_agent) 的工作定义:
与世界互动的计算机程序。它通过传感器感知环境(输入数据),自主处理数据(预测和规划),并采取行动以实现目标(行动)。
代理可以受到约束,也可以从环境中学习。如今,代理通常专门针对特定类型的输入和特定类型的行动。例如,聊天机器人(如 ChatGPT)将文本提示作为输入,可能会使用一些工具来生成答案,并以文本输出作出回应。另一方面,交易机器人将过去的市场状态作为输入,预测未来的市场状态和最佳行动,并执行交易。代理可以是不同类型的(例如,聊天机器人是一个 LLM,而交易机器人则是一个小型的 RL 代理),它们还可以[组成以执行任务](
https://github.com/valory-xyz/trader)。未来,我们可能会发现一种通用架构,经过训练后可以处理大多数用例。
公共区块链具有一系列独特的功能,使其成为人工智能代理通信和交互的良好基础设施。稍后,我们将论证区块链是支持代理人工智能的最佳基础设施,但首先要介绍的是区块链的高级特性。
去中心化:设计良好的区块链协议是去中心化的。此外,去中心化是最初构建和升级这些协议的社区*精神的一部分。它内置于协议中,并通过治理得到安全保护。
激励机制:精心设计的区块链具有健全的激励机制,通过本机资产(例如以太坊中的ETH)驱动经济安全。此外,可编程智能合约使应用程序能够:(1)利用/使用原生资产;(2)发行具有所需属性的新数字资产;(3)为其参与者定义自己的原生资产和激励机制。
开放性和可组合性:区块链平台对用户和应用开发者都是开放的。此外,基于区块链上部署的智能合约的应用程序也继承了相同的开放性和无摩擦可组合性。
加密保证:区块链利用现代加密技术提供独特的安全性、可审计性和可编程隐私性。因此,与传统系统相比,区块链的信任度更低,安全性更高。请注意,区块链黑客攻击来自智能合约漏洞,这在该技术的早期阶段是不可避免的。随着堆栈的成熟,它将变得更加稳健和安全,而依赖于人类信任的传统系统则不具备这种特性。
我们可以将其与只有去中心化功能的传统互联网进行对比。TCP/IP 或 SMTP 等基础层协议是开放的,但在其上构建的几乎所有应用程序都是专有的。这使得互联网的可组合性很差,而我们认为这一特性正是设计代理互动协议的关键。此外,互联网在协议层面完全缺乏激励机制和现代加密技术。
接下来,我们提出了人类与代理合作的理想经济模型,并表明它需要区块链协议所提供的一整套功能。
图 2. 根据 ChatGPT,传统互联网(左)和代理互联网(右)的概念图。
快进几年。想象一下,我们现在的人工智能代理可以执行大量人类活动,并拥有足够的决策和规划能力。它们还能自主执行任务,并可能与其他代理协作。代理被广泛应用于社会,并从事对人类具有潜在高价值的活动,包括社会价值和经济价值。
以下是我们希望这种代理人工智能系统及其与人类的互动具备的一些特性/考虑因素,以及区块链如何实现这些特性/考虑因素。
代理系统需求
人类的需求
关于人工智能供应链的小插曲
值得注意的是,除了通信和互操作性之外,区块链基础设施还能使整个模型生产供应链受益(数据收集、数据整理、培训、微调)。目前正在开发一些应用,包括若干数据收集协议和[计算](
https://akash.network/docs/getting-started/intro-to-akash/akash-network/) [市场](
https://docs.gensyn.ai/litepaper/)。它们是去中心化人工智能堆栈的重要组成部分,但我们不会在这里讨论它们。
图 3. 人工智能供应链(白色)和代理互联网(绿色)。
区块链提供了多功能协议,可以可信地执行各种规则和检查。在我看来,这为人工智能市场和应用的全球监管提供了一个独特的机会,可以很容易地对其合规性进行审计和检查。各协议之间的透明性也可以使实时识别偏差和部署纠正修复变得非常容易,而这在传统系统中是不可能实现的。
在训练人工智能代理做出敏感和有影响的决策时,开放性并不总是可取的。例如,部署一个开放的权重模型来做出保险承保决策,可能会暴露模型漏洞,增加被利用/攻击的可能性。
解决这一问题的方法之一是利用现代加密技术,保持代理的私密性,但公开其行动。然而,[黑盒对抗式机器学习攻击](
https://posts.specterops.io/learning-machine-learning-part-3-attacking-black-box-models-3efffc256909) 仍有可能发生,而且一般来说,用于安全但可验证的机器学习计算的加密方案实施成本很高,这增加了本已昂贵的训练过程的开销。这是人工智能安全与区块链交叉领域最重要的研究领域之一。我们需要使其在技术和经济上切实可行。最近的一项创新是针对 ML 计算的乐观证明,我将在下文讨论。
另一个[已经讨论过的](
https://www.youtube.com/watch?v=TWHmXYq_ch4)风险是,基于 LLM 的预言机降低了在现实世界中部署能够正确分配激励的物理行动(可能有害)的门槛。这在今天仍是不可能的,但更多的研究应集中在如何启用积极的用例以及如何检测和防止有害行为上。
不熟悉区块链系统现状的人经常会问的一个问题是,区块链系统是否已经准备好适应用户活动增加所带来的负载。
至少在过去五年里,这一直是区块链研发的重点。如今,我们正处于一个转折点,许多解决方案正在上线,并将可扩展性提高了*个数量级。例如,以太坊的第2层区块链继承了完全的经济安全性和可扩展的数据可用性解决方案,将很快能够每秒处理数万笔交易(TPS)。利用并行化每秒处理数十万笔交易的新链即将上线。共享排序解决方案和安全桥接器将使部署在不同领域的应用程序能够安全高效地互操作。零知识证明聚合技术的进步将使交易成本更低,同时还能实现新型链外计算和混合系统,使安全权衡更加高效。
随着所有这些基础设施创新在未来几年取得成果,毫无疑问,一个成熟的区块链生态系统将能够支持非常高的吞吐量,从现在的数万 TPS 到百万 TPS,每笔交易只需几分钱。
上图是一张藏宝图,展示了通往代理互联网之路的三个主要步骤。
让我们逐一介绍。
第一步是用人工智能增强当前的区块链应用。人工智能已经在去中心化金融(DeFi)中发挥作用,这是迄今为止采用最多的应用类别。其形式是专门的模型,不断监控市场状态,以采取特定行动。例如:交易机器人、清算机器人、路由机器人、统计套利机器人以及更多执行策略的一般机器人,这些策略旨在从用户交易流中[提取利润](https://libmev.com/)(也称为 MEV)。
随着区块链经济在当前的 DeFi 基础上不断发展,我们自然可以从这里入手,讨论利用人工智能的机会。
DeFi增强
区块链协议目前已实现自动化,但与之相连的接口却非常人工化,有时甚至非常笨拙,而且往往效率低下。在智能代理的调解下,人工智能有可能成为连接人类与链上市场的新界面。至少在以下三个领域存在增强当前协议的具体机会。
第一个例子只需要几笔交易,而其他例子则需要制定计划、在计划期限内通过多笔交易执行计划、多个价格馈送、风险和收益预测模型以及上下文信息。
在所有这些情况下,我们都有一个主要的人类或社区,将高价值的链上行为外包给一些运行在链外的代理。因此,我们非常需要推理保证。这可以通过两种方式实现:
为协议提供人工智能服务
与此相关的一个类别是利用自主代理增强协议基础设施,而不是零售应用。在这里,大多数应用与正在为传统商业服务构建的基于代理的产品类似,但这些代理可以利用区块链的开放性、活泼性和数据丰富性。
例如,作为智能合约[安全审计员/测试员](https://www.pixee.ai/)的代理、分析代理以及[自动财务和风险管理服务](
https://www.gizatech.xyz/collection/yearn-risk-assessment)。以 Web3 为重点的公司已经提供了各种类型的服务,但代理自主性和推理证明方面的进步为去中心化和[从关键服务到协议操作消除信任]提供了机会(
https://www.gizatech.xyz/collection/ai-actions)。
一个新的应用领域是内容策划。随着 Farcaster 和 Lens 等去中心化社交媒体的兴起,代理自动/中介式策划出现了新的机遇。不过,这需要创建新的机制来协调代理合作,我们现在就来介绍一下。
我们可以利用区块链的超强能力,创建可信的承诺设备,实现直接利用代理用户的新应用和新市场机制。在这里,我们将开始观察协调众多代理的力量,以提供新的服务。我们在[我们最近的论文](
https://arxiv.org/abs/2311.07815)中详细讨论了这个话题,这里我想重点谈谈几个具体的应用。
人工智能预测市场
近期最令人兴奋的具体应用是人工智能预测市场。DeFi释放了在区块链上交易长尾资产的能力,例如小型协议实用代币,这些代币无法在传统市场上交易,因为运营支持它们的基础设施成本太高。人工智能预测市场有可能对[超长尾](
https://www.coindesk.com/consensus-magazine/2024/03/04/how-ai-crypto-will-lead-to-a-hyper-financialized-future/)资产做同样的事情。人们关心的最微小事件的结果都可以代币化并进行交易。这些市场要发挥作用,需要
人工智能可以通过让[专门的交易代理查询 LLM 以获得事件的概率估计,然后下注](
https://github.com/valory-xyz/trader?tab=readme-ov-file)来自动执行这些操作,正如最近的[大规模竞赛](
https://www.valory.xyz/post/prediction-agent-hackathon-success)所显示的那样。还有人建议,[多轮争议协议可用于自动解决市场问题](
https://vitalik.eth.limo/general/2024/01/30/cryptoai.html),LLMs 可参与早期回合,只有升级到后期回合的情况才需要人类参与。
一旦这些市场发挥作用,它们就会成为以完全自主的方式评估微小不确定性的新工具,而无需依赖可能面临安全威胁或偏见的中央机构。在此基础上可以构建各种应用:小额保险、金融产品、去中心化社交媒体的内容管理、垃圾邮件过滤等。
为专用模型提供可靠高效的路由
如今,大多数人与人工智能的交互都是在专有环境中孤立进行的,使用的是通用模型,要么是封闭的"前沿"模型(重型模型),要么是开放权重模型(轻型模型)。然而,[GPT 商店](
https://openai.com/blog/introducing-the-gpt-store) 和[类似聚合器](https://flowgpt.com/) 的早期成功表明,上述交互模式只是进入具有代理能力和专门技能的大量 GPT 的入口(即,我们很快就会从解释扑克规则到玩扑克,从规划旅行路线到预订全程旅行)。
在这样的世界里,显然需要高效地将用户会话路由到能以最佳方式满足其意图的最佳专业模型上。当代理代表用户进行交易时,将从服务用户中获取巨大价值。路由器/中介方(提取租金)和终端模型方(虚报结果/性能以获取更多流量)都有动机提取价值。因此,显然需要可信的路由机制和市场,让服务提供商通过竞争来满足用户的偏好。这是一个即将到来的应用领域,我对此感到非常兴奋。
新市场的基石
随着越来越多具备专业技能的代理被部署到链上并积累历史,一个更强大的基础设施的基石就可以被开发出来。例如,代理发现协议,包括基于过去结果和代理排名的声誉、基于预测结果的微服务自动竞价等。
这是一个需要数年时间才能完全实现的迭代过程,随着每一波新的代理服务协议的创建,这种通信、声誉和交换基础设施都会发生新的迭代。最终的目标将是建立最高效的数字协调机制系统,该系统极其廉价且无需租金,将成为世界经济中越来越大份额的支柱。最终,随着代理能力的不断提高,越来越多的现实世界活动实现了自动化,我们可以预见,大部分社会经济交流都将在这一基础设施上进行。
扩大共享所有权和治理规模
智能代理生产系统一旦形成规模,解决共享所有权、公平价值分配和治理问题将至关重要。区块链为实现这一解决方案提供了基础。如今,我们还处于早期试验阶段,但已经出现了一些有趣的模式。我们有两个极端:
前者类似于[Morpheus](
https://github.com/MorpheusAIs/Docs/blob/main/!KEYDOCS%20README%20FIRST!/WhitePaper.md)正在进行的实验,后者类似于[Olas](
https://olas.network/documents/whitepaper/Whitepaper%20v1.0.pdf),这是两个建立自主代理经济体的早期尝试。我们仍处于这些基于代理的新型协议的早期阶段,将会有新的应用和新的功能,它们很可能会改变激励机制和所有权模式的设计方式。这只是两个截然不同的例子,说明协议设计者可以采用多种解决方案。最后,请注意,除了代理经济之外,人工智能堆栈的其他层面也存在类似问题,类似的解决方案可用于激励人工智能培训、数据和基础设施服务。