在这篇文章中,我们深入研究了数据可用性问题的细节以及它如何影响以太坊的扩展。
什么是数据可用性问题?
数据可用性(DA)问题:区块链网络中的节点如何确保新提议区块的所有数据实际上是可用的?如果数据不可用,则该块可能包含被块生产者隐藏的恶意交易。
举个例子,假设 Alice 是 ZK-Rollup (ZKR) 的运营商。她在以太坊上提交了经过验证的 ZK 证明。如果她没有在以太坊上提交所有交易数据,尽管她的证据证明rollup中进行的所有状态转换都是有效的,但rollup的用户仍然可能对其当前账户余额一无所知。由于提交的证明的零知识性质,提交的证明没有说明当前状态。
Optimistic Rollup (OPR) 设置中有一个类似的例子,Alice 在以太坊上提交了一个断言,但 OPR 的任何参与者都不能挑战它,因为交易数据不可用,因此他们无法重新计算或挑战该断言 .
为了应对上述情况,OPR 和 ZKR 的设计都要求operator将以太坊上的所有交易细节作为“calldata”提交。虽然这使他们在短期内避免了 DA 问题,但随着rollup内部交易数量的增长,需要提交的数据量也会增加,从而限制了这些rollup可以提供的扩展量。
这对如今的区块链有何影响?
为了回答这个问题,让我们首先回顾一下类似以太坊的区块链的一般区块结构以及任何区块链网络上存在的客户端类型。
USDC接收地址数量达5个月低点:12月29日消息,据Glassnode数据,USDC接收地址数量达5个月低点,7日均值数额为1,138.030。[2021/12/29 8:12:42]
一个块可以分为两个主要部分:
区块头:一个小区块头包含与区块中包含的交易相关的摘要和元数据。
块体:它包含所有交易数据并占块大小的大部分。
在传统的区块链协议中,所有节点都被视为同步整个区块并验证所有状态转换的完整节点。所有节点花费大量资源来检查交易有效性并存储区块。从好的方面来说,这些节点不会接受任何无效的交易。
可能还有另一类节点没有(或不想花费)资源来验证每笔交易。相反,他们主要对了解区块链的当前状态以及与他们相关的某些交易是否包含在链中感兴趣。这些轻客户端依靠全节点来检查所有交易是否有效。因此,在安全性方面,它们依赖于可信的全节点。
但是如果区块生产者没有透露区块背后的全部数据呢?这可以防止全节点验证所有交易。这反过来又阻止了轻节点绝对确定它所看到的由所有合法交易支持的区块头。
为了解决这个问题,我们需要一种轻客户端机制来验证数据可用性。这将确保区块生产者无法通过说服轻客户端来隐藏数据。它还将迫使区块生产者公开部分数据,使整个网络以协作的方式访问整个区块。
让我们借助一个例子更深入地探讨这个问题。假设区块生产者 Alice 用交易 tx1、tx2、……、txn 构造了一个区块 B。让我们假设 tx1 是恶意交易。如果 tx1 被广播,任何完整节点都可以验证它是恶意的,并将其发送给轻客户端,轻客户端会立即知道该块是不可接受的。但是,如果 Alice 想隐藏 tx1,她会显示标头和除 tx1 之外的所有交易数据。全节点无法验证 tx1 的正确性。让轻节点查询任意一笔交易,均匀随机。轻客户端查询 tx1 的概率为 1n。因此,Alice 能够以压倒性的可能性轻客户端接受恶意交易。由于不可归因的性质,全节点无法以任何方式证明 tx1 不可用。
金色财经挖矿数据播报:ETH今日全网算力上涨2.45%:金色财经报道,据蜘蛛矿池数据显示:
BTC全网算力154.713EH/s,挖矿难度21.72T,目前区块高度672638,理论收益0.00000636/T/天。
ETH全网算力420.525TH/s,挖矿难度5494.57T,目前区块高度11949643,理论收益0.00546813/100MH/天。
BSV全网算力0.589EH/s,挖矿难度0.08T,目前区块高度676487,理论收益0.00152738/T/天。
BCH全网算力1.365EH/s,挖矿难度0.20,目前区块高度676795,理论收益0.00065934/T/天。[2021/3/1 18:02:45]
那么,我们该怎么办呢?
该问题的解决方案在于在块中引入冗余。总的来说,有大量关于编码理论的文献,特别是擦除编码,可以帮助我们解决这个问题。
简而言之,纠删码允许我们将任何 n 个数据块扩展为 2 个数据块,其中 2n 个数据块中的任何一个都足以重建原始数据块(参数是可调的,但为了简单起见,我们在这里考虑了这一点)。
如果我们强制区块生产者擦除交易 tx1、tx2、...、txn 的代码,然后隐藏单个交易,则需要隐藏 n+1 个交易,因为任何足以构建整个交易集的交易。在这种情况下,恒定数量的查询使轻客户端足以确信底层数据确实可用。
哇,原来如此?
不。虽然这个简单的技巧使隐藏工作变得更加困难,但区块生产者仍有可能故意以错误的方式执行擦除编码。然而,一个完整的节点可以验证这个擦除编码是否正确完成,如果没有,它可以向轻客户端证明这一点。这被称为欺诈证明。有趣的是,轻客户端需要有一个诚实的全节点邻居才能确定如果编码错误,那么它将收到欺诈证明。这确保了轻客户端以极高的概率访问没有恶意交易的链。
但是存在一个问题!如果简单地实现,欺诈证明的大小可以按照块本身的大小排序。但我们对轻客户端的资源预设禁止我们使用这样的设计。通过使用多维擦除编码技术,可以在这方面有所改进,该技术以可接受的大小减少欺诈证明的大小。为简洁起见,我们不涉及这些,但该文献(https://arxiv.org/abs/1809.09044)对其进行了详细分析。
基于欺诈证明的解决方案的问题在于,轻客户端永远无法完全确定尚未收到欺诈证明的任何块。此外,他们一直相信其全节点对等方是诚实的。还需要激励诚实的节点不断保持审计区块。
有没有办法避免欺诈证明?
最近,向量承诺重新引起了区块链领域的关注。这些向量承诺,尤其是对多项式的恒定大小的 KZG/Kate 承诺,可用于设计简洁的 DA 方案,而无需欺诈证明。简而言之,Kate 承诺允许我们使用单个组元素提交多项式。此外,该方案支持我们证明在某个点 i 使用恒定大小的见证,多项式评估为(i)。承诺方案在计算上是隐藏和绑定的,也是同态的,使我们能够巧妙地避免欺诈证明。
我们强制块生产者获取原始交易数据并将其排列在大小为 n,m 的二维矩阵中。它使用多项式插值将大小为 n 的每一列扩展为大小为 2n 的列。对于这个扩展矩阵的每一行,它都会生成一个多项式承诺,并将这些承诺作为区块头的一部分发送。下面给出了该块的示意图。
轻客户端查询这个扩展矩阵的任何单元格以获得见证,这使它能够立即根据块头验证它。恒定大小的成员证明使抽样非常有效。承诺的同态性质确保只有在正确构造块的情况下才验证证明,并且多项式插值确保成功样本的恒定数量意味着数据以非常高的概率可用。
该方案的更精细细节以及进一步的优化和成本估算超出了本文的范围。
其他选择是什么,以及进一步变更是什么?
更高维的擦除代码和 Kate 承诺并不是解决 DA 问题的唯一方法。我们在这里跳过了其他方法,如编码默克尔树、编码交错树、基于 FRI 和 STARK 的方法,但每种方法都有其优点和缺点。
我们在 Polygon,一直在使用 Kate 承诺开发数据可用性解决方案。在后面的文章中,我们将介绍实现细节、您现在可以如何使用它以及我们如何致力于转变 DA 问题空间。
郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。