数据可用性

“不信任，验证”是以太坊中通用的信条。这种观念是指，你的节点可以通过执行从对等节点接收的区块中的所有交易来独立验证它收到的信息是正确的，以此来确保提议的更改与其独立计算出的更改完全一致。这意味着节点无需相信区块的发送者是诚实的。但如果数据遗失，就无法验证。

数据可用性是指用户能够确信，验证区块所需的数据确实可供所有网络参与者使用。对于以太坊 Layer 1 上的全节点来说，这相对简单；全节点会下载每个区块中所有数据的副本——数据_必须_可用，下载才可能进行。数据缺失的区块将被丢弃，而不是添加进区块链。这就是”链上数据可用性“，是单片式区块链的特征。无法欺骗全节点让其接受无效交易，因为它们自己下载并执行所有交易。然而，对于模块化区块链、二层网络卷叠和轻客户端来说，数据可用性局面更加复杂，需要更加复杂的验证程序。

前提条件

你应该对区块链基础知识有很好的了解，尤其是共识机制。本页面还假设读者熟悉区块、交易、节点、扩容解决方案及其他相关主题。

数据可用性问题

数据可用性问题是指，需要向整个网络证明正在被添加到区块链中的某些汇总交易数据确实代表一组有效的交易，但在证明时不需要所有节点下载所有数据。完整的交易数据是独立验证块所必需的，但要求所有节点下载所有交易数据是对扩容的阻碍。解决数据可用性问题的目的是充分保证，自己不下载和存储数据的网络参与者可以使用全部交易数据进行验证。

轻节点和 Layer 2 卷叠是重要的网络参与者示例，它们需要强大的数据可用性保证，但无法自行下载和处理交易数据。无需下载交易数据是轻节点之所以轻量并让卷叠成为有效扩容解决方案的原因。

数据可用性对于未来的"无状态"以太坊客户端来说也是一个关键问题，这些客户端无需下载和存储状态数据即可验证区块。无状态客户端仍需要确定数据_在某个地方_是可用的，并且已被正确处理。

数据可用性解决方案

数据可用性采样 (DAS)

数据可用性采样 (DAS) 是网络在不给任何单个节点带来过多压力的情况下检查数据是否可用的一种方法。每个节点（包括非质押节点）下载全部数据中随机选择的数据小子集。成功地下载样本便可以非常肯定地确认所有数据都是可用的。这依赖于数据纠删码，它用冗余信息来扩展给定的数据集（实现方法是将一个称为_多项式_的函数与数据拟合，并在额外的点上对该多项式进行评估）。这样可以在必要时从冗余数据中恢复原始数据。这种数据创建的一个后果是，如果_任何_原始数据不可用，那么扩展数据中的_一半_将会丢失！每个节点下载的数据样本量可以调整，这样_如果_实际可用的数据不足一半，那么每个客户端采样的数据片段就_极有_可能至少会丢失一个。

在完整 Danksharding 实施后，DAS 将用于确保卷叠运营方公布其交易数据。以太坊节点将使用上述冗余方案，随机采样二进制大对象中提供的交易数据，以确保所有数据都存在。同样的技术也可用于确保区块生产者让将其所有数据可用，以保护轻客户端的安全。同样，在提议者-构建者分离下，只需要区块构建者处理整个区块——其他验证者将使用数据可用性采样进行验证。

数据可用性委员会

数据可用性委员会 (DAC) 是提供或证明数据可用性的可信参与方。数据可用性委员会 (DAC) 可以替代 DAS，或与 (opens in a new tab) DAS 结合使用。数据可用性委员会提供的安全保证取决于具体设置。例如，以太坊使用随机抽样的验证者子集来证明轻节点的数据可用性。

一些 Validium 也使用数据可用性委员会。数据可用性委员会是一组可信节点，它们在线下存储数据副本。在出现争议时，需要通过数据可用性委员会来确保数据可用。数据可用性委员会的成员还需要发布链上认证来证明这些数据确实是可用的。有些 Validium 使用权益证明 (PoS) 验证者系统代替数据可用性委员会。在该系统中，任何人都能成为验证者并在链下存储数据。然而，他们必须提供“保证金”，并且保证金存入到智能合约中。在发生恶意行为时，例如验证者隐藏数据，保证金会被罚没。权益证明数据可用性委员会在安全性方面明显优于一般数据可用性委员，因为它们直接激励诚实的行为。

数据可用性和轻节点

轻节点需要验证所接收区块头的正确性，而无需下载区块数据。轻节点轻量化的代价就是无法像全节点那样在本地独立地重新执行交易以验证区块头。

以太坊轻节点信任由 512 个验证者组成的随机集合，这些验证者被分配到一个_同步委员会_。同步委员会充当数据可用性委员会，使用加密签名向轻节点表明区块头中的数据是正确的。同步委员会每天都刷新。每个区块头都会提醒轻节点，预期哪些验证者会签发_下一个_区块，这样它们就不会被骗去信任一个冒充真实同步委员会的恶意团体。

但是，如果攻击者_确实_设法将恶意区块头传递给轻客户端，并使他们相信该区块头是由诚实的同步委员会签署的，会发生什么？在这种情况下，攻击者可能会添加无效的交易，而轻节点将会盲目地接受它们，因为轻节点无法独立验证汇总在区块头中的所有状态变化。为了防止这种情况，轻节点可以使用欺诈证明。

欺诈证明的工作原理如下：全节点发现一个无效状态转换在网络上广播时，可以快速生成证明已提议状态转换不可能源自给定一组交易的一小段数据，并把这段数据广播到对等节点。轻节点可以选取这些欺诈证明并用来丢弃有害的区块头，确保它们和全节点留在相同的诚实区块链上。

这仰仗于全节点能够访问完整的交易数据。广播有害区块头并且不提供交易数据的攻击者可能能够阻止全节点生成欺诈证明。全节点也许可以发出关于有害区块的警告，但没有证据来证明它们的警告，因为没有可用于生成证明据的数据！

数据可用性采样可以解决这个数据可用性问题。轻节点下载完整状态数据的小随机片段，并使用这些样本验证完整数据集可用。在下载 N 个随机数据块后错误地假定数据完全可用的实际可能性是可以计算的（下载 100 个数据块的概率为 10^-30 (opens in a new tab)，即极不可能）。

即使出现错误估计，仅仅隐藏几个字节的攻击，可能不会被发出随机数据请求的客户端所察觉。纠删码通过重建丢失的小数据片段来解决这个问题，这些数据片段可用来检查提议的状态变化。然后，可以使用重建的数据构建欺诈证明，防止轻节点接受有害的区块头。

**注意：**数据可用性采样 (DAS) 和欺诈证明尚未为权益证明以太坊轻客户端实现，但它们已在路线图上，很可能采取基于 ZK-SNARK 的证明形式。目前，轻客户端依赖于一种数据可用性委员会：它们验证同步委员会的身份，然后信任接收到的已签名区块头。

数据可用性和二层网络卷叠

二层网络扩容解决方案，例如，通过在链下处理交易来降低交易成本并提高以太坊的吞吐量。卷叠交易是分批次压缩并发布到以太坊上。批次表示将成千上万单个链下交易打包到以太坊上的单个交易中。这减少了基础层的拥塞并降低了用户费用。

然而，只有提议的状态变化可被独立验证并确认是应用所有单独链下交易的结果时，才能信任发布到以太坊上的“汇总”交易。如果卷叠运营者不提供进行此验证所需的交易数据，那么它们可以将不正确的数据发送至以太坊。

乐观卷叠将压缩后的交易数据发布到以太坊，并等待一段时间（通常为 7 天），以允许独立验证者检查数据。如果有任何验证者发现问题，它们可以生成欺诈证明并用来质疑卷叠。这将导致链回滚并丢弃无效区块。只有在数据可用时，才能实现这一点。目前，乐观卷叠有两种方式将交易数据发布到一层网络。一些卷叠以 CALLDATA 的形式使数据永久可用，这些数据永久存在于链上。随着 EIP-4844 的实施，一些卷叠将其交易数据发布到更便宜的二进制大对象存储中。它不是永久存储。独立验证者必须在数据从以太坊第 1 层删除之前约 18 天内查询二进制大对象并提出挑战。通过以太坊协议，数据可用性仅在一个短暂的固定窗口期内得到保证。此后，数据可用性成为以太坊生态系统中其他实体的责任。任何节点都可以使用 DAS 验证数据可用性，即通过下载 blob 数据的小型随机样本。

零知识 (ZK) 卷叠不需要发布交易数据，因为保证了状态转换的正确性。然而，数据可用性依然是一个问题，因为在不访问其状态数据的情况下我们无法担保零知识卷叠的功能（或与之交互）。例如，如果运营者隐瞒了卷叠状态的细节，用户就无法知道自己的余额。而且，用户也不能使用新添加区块中的信息来执行状态更新。

数据可用性与数据可检索性

数据可用性不同于数据可检索性。数据可用性是一种保障，它确保全节点能够访问和验证与某个特定区块相关的全部交易。然而，数据也不见得始终可以访问。

数据可检索性是节点从区块链中检索_历史信息_的能力。验证新区块不需要此历史数据，历史数据仅用于将全节点与创世区块同步或者满足具体的历史数据请求。

核心以太坊协议主要涉及数据可用性，而不是数据可检索性。数据可检索性可以由第三方运行的少量存档节点提供，也可以使用去中心化文件存储（例如 Portal Network (opens in a new tab)）分布在整个网络中。