a16z研究主管揭示：区块链机制设计复杂性的八大因素

发表时间: 2024-05-16 05:40

原文作者：Tim Roughgarden

原文标题：8 reasons why blockchain mechanism design is hard

原文来源：a16zcrypto

编译：Lynn，火星财经

深入学习一个领域可以让你认识到，现实世界中出现的问题都是已经很好地解决了的问题的伪装版本或细微变化。例如，当我教授算法基础时，学生们学会了如何识别归结为最短路径计算或线性规划的问题。

这种模式匹配在机制设计中同样有效，机制设计是一种 “逆博弈论”，利用激励机制来实现理想的结果。机制设计的工具和经验在拍卖理论、市场设计和社会选择理论中尤其有用。

加密货币和网络3充斥着机制设计问题。人们可能会认为，其中许多问题都可以通过复制粘贴教科书，利用古老思想的微小变化来解决。但是，无权限区块链协议的独特挑战和限制往往迫使人们从第一原理出发，重新思考看似已经解决的问题。这使得 web3 中的机制设计变得复杂。不过，这些挑战也让 web3 中的机制设计深具魅力。

在这篇文章中，我将探讨 web3 机制设计所面临的一些挑战。这些挑战对于密码原住民来说可能并不陌生，但更深入地了解机制设计可以为所有构建者提供一个全新的视角，让他们了解为什么这些问题如此难以解决。对于机制设计者来说，如果你正在寻找新的应用，你很可能会对无权限环境带来的挑战感兴趣。

但首先，什么是机制设计？

作为一个领域，机制设计至少可以追溯到 1961 年，当时哥伦比亚大学经济学家、未来的诺贝尔奖获得者威廉-维克里（William Vickrey）正式描述了一种密封出价的第二价格拍卖。早在 1797 年，作家约翰-沃尔夫冈-冯-歌德（Johann Wolfgang von Goethe）出售其史诗《赫尔曼与多萝西娅》（Hermann and Dorothea）的手稿时，就采用了同样的拍卖方式。十九世纪的邮票收藏者也常用这种方式，但直到维克里才对其进行正式描述，现在通常被称为 “维克里拍卖”。在维克里拍卖中，出价最高者胜出，但要支付第二高的出价。这种拍卖会能反映出竞拍者的真实偏好，也能将有关物品交给最看重它的人。

维克里拍卖是一种优雅而高效的设计，它已被应用于现实世界，并根据新情况进行了修改和更新，实践为理论提供了借鉴，反之亦然。与维克里拍卖一样，机制设计作为一门正式学科，也有着理论与实践交织的历史。它既深奥又优美。

博弈论确定了战略互动的各个层面，然后探索行为上最合理的结果，与之相反，机制设计领域不是从博弈开始，而是从期望的结果开始。机制设计的目的是对某种形式的博弈进行逆向工程，从而使这种预期结果（可能以效率、公平或某些行为集为特征）成为一种均衡。就维克里拍卖而言，其目标是获得参与者愿意支付的最大金额，同时又不会因此而惩罚他们。

例如，区块链协议可能希望实现的结果是，运行协议的参与者诚实行事，不偏离预期行为。或者，一个协议可能希望获得有关交易价值的准确信息，以便有效地为最有价值的交易分配区块空间。

这类机制设计问题总是充满挑战，而在区块链背景下，它们又具有独特的挑战性。

1. 缺乏信任

如果没有受信任方来执行机制的假设，区块链领域的设计就会变得更加困难。

使用无权限区块链协议的全部意义在于，你不必信任任何一个实体或个人，只需 “平均 ”信任假设，即运行协议的节点中有足够大的一部分是正确的。

但许多区块链架构的讽刺之处在于，每一批添加到链的历史中、在协议维护的虚拟机中执行的交易，都是单个节点单方面决策的产物。

你不知道是否可以信任的正是这个单一节点。

这就是为什么在区块链环境中很少能看到维克里拍卖的原因。天真地实施 Vickrey 拍卖很快就会遇到不受信任的区块生产者操纵的问题。问题在于区块生产者可以制造 “虚假出价”--出价略低于中标出价的虚假出价，从而迫使中标者支付几乎全额的出价（而不是第二高的真实出价）。

不被信任的区块生产者的虚假出价实际上会导致维克里拍卖回归到第一价格拍卖，这也是第一价格拍卖在网络3中如此盛行的原因之一（传统机制设计文献中关于 “可信机制 ”的最新分支也考虑了不被信任的拍卖人的拍卖设计，尽管其视角略有不同）。

2. 串通的发生

区块链机制设计困难的另一个原因是区块链参与者之间的串通。例如，二次定价拍卖很容易受到边款串通的影响。直觉很简单：中标者向出价第二高的出价者付款，因此该出价者可以简单地贿赂出价第二高的出价者，使其出价更低。

关于机制设计的学术文献并不太担心合谋问题。原因之一可能是合谋，尤其是附带付款，在现实世界中很难实现。在某些合谋行动结束后，很难有可信的附带付款，因为赢家可以直接拒绝行贿。(俗话说 “盗亦有道”）。

然而，在区块链环境下，潜在的串通者往往可以使用智能合约，以可信的方式承诺支付串通所需的附带费用。第二个原因是缺乏抑制合谋附带支付的机制--“挂牌价 ”机制，这种机制只提供要么接受要么放弃的报价，而不提供其他报价。

更糟糕的是，协议用户不仅可能相互串通，还可能与（不受信任的）区块生产者串通（相当于现实世界拍卖中投标人与拍卖人串通）。

以太坊的 EIP-1559 交易费机制之所以要烧掉一部分交易费，其主要动机之一就是要抵御最后一种类型的串通。如果没有 “烧毁”（或以其他方式从区块生产者那里扣留这些收入），区块生产者和终端用户就可能串通一气，通过侧面支付来规避该机制试图强加的任何底价。

3. 不能仅仅依靠法治

串通显然不是一个新问题。几个世纪以来，它一直困扰着现实生活中的各种机制，然而，如果你研究一下机制设计文献，你可能会惊讶地发现，这些文献很少涉及合谋问题。这些文献确实直面了机制中单个参与者进行单方面操纵的动机，但一般都对合谋问题避而不谈，而是将其留给了某种未被模拟的 “法治 ”概念。例如，机制参与者可以签署一份法律合同，明确规定他们不会串通。如果发现串通行为，则将其移交给法律渠道处理。机制设计者可以通过创建一个相对容易发现串通行为的机制来提供帮助。

这是许多机制设计文献中的一个不为人知的秘密：依靠法治。虽然不能说无权限区块链协议没有法治--我们经常看到执法部门在无权限区块链上成功起诉犯罪行为--但与传统的机制设计应用相比，法治要少得多。

如果不能依靠机制外的法律规则，那么设计者就有责任在机制内处理它。这种方法在区块链领域的机制设计决策中随处可见。特别是在以太坊协议中，从 EIP-1559 中烧掉基础费用收入，到共识协议中砍掉行为不端的验证者，都是这样的例子。

4. 设计空间更大

web3 的设计空间比机制设计者所习惯的要大。因此，他们必须重新考虑任何给定的问题。例如，许多机制都涉及支付；在传统的机制设计应用中，这些支付都是以美元等法定货币进行的。许多区块链协议都有自己的原生货币，这种协议中的机制可以操纵这种货币。

想象一下，如果你写了一篇传统的机制设计论文，而你的机制描述的一部分是： “印一堆新钱，然后给一堆参与者” 在区块链语境之外，这看起来很荒谬。但是，当你在区块链协议的背景下讨论机制设计时，你就可以这样做。协议控制着货币，因此作为协议一部分的机制可以铸造或烧毁货币。

这意味着，一些如果不使用原生货币就不可能实现的设计变得可能。例如，如何激励比特币矿工按照预期执行协议？通过通货膨胀奖励：印制新的比特币来激励这些区块生产者。如果没有本地货币，这样的设计是不可能实现的。

5. 本位币会带来其他问题

原因 4 凸显了原生货币的威力。原生货币可以做的两件显而易见的事是：“铸造”（比特币协议铸造新比特币以激励矿工的方式）和 “烧毁”（以太坊的 EIP-1559 交易费机制烧毁 ETH 以实现抗串通的方式）。但是，原生货币中潜藏着一种传统机制设计中不存在的危险：微观经济设计决策可能会对宏观经济产生影响。

在传统机制设计中，没有理由担心宏观经济力量。没有任何传统拍卖对美国的货币供应或通货膨胀率产生过有意义的影响。对于网络3设计领域来说，这是一个全新的挑战。会出什么问题呢？我来举两个例子，一个是比特币的铸币，一个是以太坊的燃烧。

由于使用区块奖励--通过印制新币来激励矿工--比特币被迫产生通货膨胀。因此，比特币还必须有一个货币政策来决定通货膨胀率以及通货膨胀率如何随时间演变。中本聪还为比特币设定了 2,100 万枚的硬性供应上限。由于比特币数量有硬性上限，通货膨胀率必须归零。

如果真的归零，矿工们还有什么动力继续运行协议，为比特币的安全性做出贡献呢？人们一直希望交易费能弥补区块奖励的缺失，尽管实现这一点的证据并不充分。众所周知，如果交易费用接近于零，那么比特币协议就会出现重大的安全问题。

普林斯顿大学计算机科学家迈尔斯-卡尔斯顿（Miles Carlston）、哈里-卡洛德纳（Harry Kalodner）、马修-温伯格（Matthew Weinberg）和阿尔文德-纳拉亚南（Arvind Narayanan）的一篇论文指出了交易费用和区块奖励之间的另一个区别。每个区块的区块奖励都是相同的（至少在每四年一次的区块奖励连续 “减半 ”之间是相同的），而交易费用却可以有数量级的变化--这反过来又给协议带来了新的博弈论上的不稳定性。从这个意义上说，固定供应上限的宏观经济决策会给协议及其参与者带来负面的微观经济后果。

在比特币中，区块奖励的铸造是一种通货膨胀的力量，而在以太坊中，EIP-1559 中交易费用的燃烧则是一种通货紧缩的力量。在以太坊协议中（确实使用了通货膨胀的验证器奖励），这两种力量之间存在着拉锯战，通常是通货紧缩力量获胜。以太坊现在是一种净通货紧缩货币，这是以太坊协议交易费机制中微观经济设计决策的宏观经济后果。

通货紧缩对以太坊协议是好是坏？以太坊持有者喜欢通货紧缩，因为在其他条件相同的情况下，通货紧缩会使他们的代币随着时间的推移变得更有价值。(事实上，这种副产品可能是舆论最终倾向于改用 EIP-1559 交易费机制的原因）。然而，通货紧缩的想法让受过传统训练的宏观经济学家们不禁想起了上世纪 90 年代日本的滞胀。

谁说得对？就我个人而言，我并不认为主权法定货币是 ETH 这种加密货币的正确类比。但是，什么才是正确的类比呢？这仍然是一个悬而未决的问题，区块链研究人员可以进一步探讨：为什么通货紧缩的货币可以作为区块链协议的加密货币，而不能作为主权国家的法定货币？

6. 不能忽视底层堆栈

在计算机科学领域，我们所追求的目标之一就是模块化和简洁抽象，这使得我们能够对系统的各个部分信手拈来。在设计和分析系统的某个部分时，您可能需要了解系统其他部分输出的功能；但理想情况下，您不需要了解这些功能在底层是如何实现的。

在区块链协议中，我们还没有达到这种理想状态。虽然构建者和机制设计者可能希望专注于应用层，但他们不能忽视基础设施层如何工作的现实和细节。

例如，如果你正在设计一个自动做市商，你就必须考虑到这样一个事实：不受信任的区块生产者负责交易排序。或者，当你在考虑（第 2 层）滚动交易的交易费机制设计时，你不仅要支付第 2 层的资源消耗，还要支付底层第 1 层协议所产生的任何成本（例如，存储 calldata 所产生的成本）。

在这两个例子中，一个层的有效机制设计需要其他层的详细专业知识。也许，随着区块链技术的成熟，我们会把不同的层完全分开。但现在肯定还没有。

7. 需要在计算受限的环境中工作

区块链协议实现的 “空中计算机 ”是一个计算受限的环境。传统的机制设计只关注经济激励，忽略了计算问题（例如，著名的维克里-克拉克-格罗夫斯机制对于足够复杂的分配问题来说是不可行的）。

尼桑和罗宁在 1999 年介绍算法机制设计时指出，我们确实需要某种计算上的可操作性，这样机制才能在现实世界中具有实际意义。因此，他们建议将注意力限制在那些使用的计算量和通信量与问题参数成多项式（而非指数）函数关系的机制上。

由于区块链协议虚拟机中的计算量非常稀缺，因此链上机制必须非常轻量级--多项式时间和通信量是必要的，但还不够。例如，这种稀缺性是自动做市商完全主导以太坊 DeFI 的主要原因，而不是限价订单簿等更传统的解决方案。

8. 尚早

通常，当人们说第三代网络技术发展尚早时，他们指的是投资机会或采用数量。但从科学的角度来看，我们甚至比这还要早。尽管这是一个巨大的机遇，但这一事实只会让事情变得更加困难。

在一个成熟的研究领域工作，会给每个人带来理所当然的好处。有公认的模型和定义。对最重要的问题有共识。在如何衡量进展方面有非同一般的协调。有共同的词汇和庞大的共同知识库。有 “快速上手 ”的 “匝道”，包括经过严格审核的教科书、在线课程和其他资源。

与此同时，在区块链领域的许多地方，我们还不知道 “正确 ”的模型和定义，无法清晰地思考重要问题并取得进展。例如，在区块链协议中，最重要的激励兼容性概念是什么？web3 堆栈有哪些层？最大可提取价值（MEV）应包含哪些内容？这些只是部分开放性问题。

***

对于那些有兴趣从事区块链科学研究的人来说，该领域的不成熟是一个挑战。但是，现在提前进入这一领域也是一个独特的机遇。

机制设计一直是互联网应用层的有用工具--例如实时广告拍卖，或者当今大多数在线消费应用（从电子商务到共享出行）中普遍存在的双面市场的设计。

但在网络3中，机制设计也为基础设施本身的设计决策提供了参考。

回想上世纪七八十年代，人们还在讨论和设计互联网路由协议。据我所知，当时还没有人拥有激励机制和机制设计方面的专业知识。现在回过头来看，我们发现这样的人本可以为设计提供有用的信息。与此同时，在 web3 中，随着比特币白皮书的发布，激励机制从第一天起就成为了讨论的一部分。

围绕 web3 的 “正确 ”模型、定义和成功指标所产生的混乱，实际上是宇宙在告诉我们，我们正处于一个黄金时代。后世的学生和科学家会羡慕我们在这里，在正确的时间、正确的地点，有机会塑造这项技术的发展轨迹。因此，虽然这个领域的教科书可能不多，但总有一天会有的，而这些教科书中所描述的工作就是现在正在进行的工作。

***

蒂姆-罗夫加登（Tim Roughgarden）是哥伦比亚大学计算机科学教授、数据科学研究所成员，也是a16z crypto公司的研究主管。