メインコンテンツへスキップ

オフラインデータの完全性のためのマークル証明

ストレージ
上級
オリ・ポメランツ
2021年12月30日
18 分で読めます

はじめに

理想的には、すべてをイーサリアムのストレージに保存したいところです。イーサリアムのストレージは数千台のコンピューターに分散して保存されており、極めて高い可用性(データは検閲されない)と完全性(データは不正に変更されない)を備えていますが、32バイトのワードを保存するには通常20,000ガスかかります。この記事を書いている時点では、そのコストは6.60ドルに相当します。1バイトあたり21セントでは、多くの用途にとって高すぎます。

この問題を解決するために、イーサリアムのエコシステムは分散型でデータを保存する多くの代替方法を開発しました。通常、これらには可用性と価格のトレードオフが伴います。しかし、完全性は通常保証されています。

この記事では、マークル証明 (opens in a new tab)を使用して、データをブロックチェーンに保存せずにデータの完全性を確保する方法について学びます。

どのように機能するのか?

理論的には、データのハッシュをオンチェーンに保存し、それを必要とするトランザクションですべてのデータを送信するだけで済みます。しかし、これでもまだ高すぎます。トランザクションへの1バイトのデータには約16ガスかかり、現在約0.5セント、つまり1キロバイトあたり約5ドルです。1メガバイトあたり5000ドルでは、データをハッシュ化する追加コストがなくても、多くの用途にとってまだ高すぎます。

解決策は、データの異なるサブセットを繰り返しハッシュ化することです。そうすれば、送信する必要のないデータについてはハッシュを送信するだけで済みます。これは、各ノードがその下のノードのハッシュであるツリーデータ構造、マークル・ツリーを使用して行います。

Merkle Tree

ルートハッシュは、オンチェーンに保存する必要がある唯一の部分です。特定の値を証明するには、ルートを取得するためにその値と組み合わせる必要があるすべてのハッシュを提供します。たとえば、Cを証明するには、DH(A-B)、およびH(E-H)を提供します。

Proof of the value of C

実装

サンプルコードはこちらで提供されています (opens in a new tab)

オフチェーンコード

この記事では、オフチェーンの計算にJavaScriptを使用します。ほとんどの分散型アプリケーション (dapp) は、オフチェーンコンポーネントをJavaScriptで実装しています。

マークル・ルートの作成

まず、マークル・ルートをチェーンに提供する必要があります。

const ethers = require("ethers")

ethersパッケージのハッシュ関数を使用します (opens in a new tab)

// 整合性を検証する必要がある生データ。最初の2バイトは
// ユーザー識別子であり、最後の2バイトはユーザーが
// 現在所有しているトークンの量です。
const dataArray = [
  0x0bad0010, 0x60a70020, 0xbeef0030, 0xdead0040, 0xca110050, 0x0e660060,
  0xface0070, 0xbad00080, 0x060d0091,
]

各エントリを単一の256ビット整数にエンコードすると、たとえばJSONを使用するよりもコードの可読性が低下します。しかし、これはコントラクトでデータを取得するための処理が大幅に少なくなることを意味し、ガスコストがはるかに低くなります。オンチェーンでJSONを読み取ることは可能ですが (opens in a new tab)、避けられるのであれば避けるべきです。

// BigIntとしてのハッシュ値の配列
const hashArray = dataArray

この場合、データは最初から256ビットの値であるため、処理は必要ありません。文字列などのより複雑なデータ構造を使用する場合は、最初にデータをハッシュ化してハッシュの配列を取得する必要があります。これは、ユーザーが他のユーザーの情報を知っても構わないと考えているためでもあります。そうでない場合は、ユーザー1がユーザー0の値を、ユーザー2がユーザー3の値を知らないようにハッシュ化する必要がありました。

// ハッシュ関数が期待する文字列と、
// 他のすべての場所で使用するBigIntとの間で変換します。
const hash = (x) =>
  BigInt(ethers.utils.keccak256("0x" + x.toString(16).padStart(64, 0)))

ethersのハッシュ関数は、0x60A7のような16進数を含むJavaScriptの文字列を受け取ることを想定しており、同じ構造の別の文字列を返します。しかし、残りのコードではBigIntを使用する方が簡単なので、16進数の文字列に変換してから元に戻します。

// ペアの対称ハッシュ。順序が逆になっても問題ありません。
const pairHash = (a, b) => hash(hash(a) ^ hash(b))

この関数は対称です(aとbのXOR (opens in a new tab)のハッシュ)。これは、マークル証明をチェックする際に、証明からの値を計算された値の前に置くか後に置くかを気にする必要がないことを意味します。マークル証明のチェックはオンチェーンで行われるため、そこでの処理は少ないほど良いです。

警告: 暗号技術は見た目よりも難しいものです。 この記事の初期バージョンでは、ハッシュ関数はhash(a^b)でした。 これは悪いアイデアでした。なぜなら、abの正当な値を知っていれば、b' = a^b^a'を使用して任意のa'の値を証明できるからです。 この関数を使用すると、hash(a') ^ hash(b')が既知の値(ルートに向かう次のブランチ)と等しくなるようにb'を計算する必要があり、これははるかに困難です。

// 特定のブランチが空であり、
// 値を持たないことを示す値
const empty = 0n

値の数が2の整数乗でない場合は、空のブランチを処理する必要があります。このプログラムでは、プレースホルダーとしてゼロを配置することでこれを行います。

Merkle tree with branches missing

この関数は、現在のレイヤーの値のペアをハッシュ化することで、マークル・ツリーを1レベル「登り」ます。これは最も効率的な実装ではないことに注意してください。入力のコピーを避け、ループ内の適切な場所でhashEmptyを追加するだけでもよかったのですが、このコードは可読性のために最適化されています。

ルートを取得するには、値が1つだけ残るまで登ります。

マークル証明の作成

マークル証明は、マークル・ルートを取り戻すために、証明される値と一緒にハッシュ化する値です。証明する値は他のデータから利用できることが多いため、コードの一部としてではなく、個別に提供することを好みます。

(v[0],v[1])(v[2],v[3])などをハッシュ化します。したがって、偶数の値には次の値が必要であり、奇数の値には前の値が必要です。

        // 次の上のレイヤーに移動します
        currentN = Math.floor(currentN/2)
        currentLayer = oneLevelUp(currentLayer)
    }   // while currentLayer.length > 1

    return result
}   // getMerkleProof

オンチェーンコード

最後に、証明をチェックするコードがあります。オンチェーンのコードはSolidity (opens in a new tab)で書かれています。ガスは比較的高価であるため、ここでは最適化がはるかに重要です。

//SPDX-License-Identifier: Public Domain
pragma solidity ^0.8.0;

import "hardhat/console.sol";

これはHardhat開発環境 (opens in a new tab)を使用して書きました。これにより、開発中にSolidityからのコンソール出力 (opens in a new tab)を得ることができます。

マークル・ルートのsetおよびget関数です。本番システムで誰でもマークル・ルートを更新できるようにするのは、_極めて悪いアイデア_です。ここではサンプルコードをシンプルにするために行っています。データの完全性が実際に重要となるシステムでは行わないでください

    function hash(uint _a) internal pure returns(uint) {
      return uint(keccak256(abi.encode(_a)));
    }

    function pairHash(uint _a, uint _b) internal pure returns(uint) {
      return hash(hash(_a) ^ hash(_b));
    }

この関数はペアハッシュを生成します。これは、hashpairHashのJavaScriptコードをSolidityに翻訳しただけのものです。

注: これも可読性のための最適化のケースです。関数定義 (opens in a new tab)に基づくと、データをbytes32 (opens in a new tab)値として保存し、変換を避けることができるかもしれません。

数学的表記では、マークル証明の検証は次のようになります:H(proof_n, H(proof_n-1, H(proof_n-2, ... H(proof_1, H(proof_0, value))...)))。このコードはそれを実装しています。

マークル証明とロールアップの相性

マークル証明はロールアップとは相性が良くありません。その理由は、ロールアップはすべてのトランザクションデータをレイヤー1 (L1) に書き込みますが、処理はレイヤー2 (L2) で行うためです。トランザクションと一緒にマークル証明を送信するコストは、1レイヤーあたり平均638ガスです(現在、コールデータの1バイトはゼロでなければ16ガス、ゼロであれば4ガスかかります)。1024ワードのデータがある場合、マークル証明には10レイヤー、つまり合計6380ガスが必要です。

たとえばオプティミズム (opens in a new tab)を見ると、L1ガスの書き込みには約100 Gweiかかり、L2ガスには0.001 Gweiかかります(これは通常価格であり、混雑時には上昇する可能性があります)。したがって、1つのL1ガスのコストで、L2の処理に10万ガスを費やすことができます。ストレージを上書きしないと仮定すると、これは1つのL1ガスの価格でL2のストレージに約5ワードを書き込めることを意味します。1つのマークル証明について、1024ワード全体をストレージに書き込むことができ(トランザクションで提供されるのではなく、最初からオンチェーンで計算できると仮定して)、それでもガスの大部分が残ります。

結論

現実には、マークル・ツリーを自分で実装することは決してないかもしれません。使用できるよく知られた監査済みのライブラリがあり、一般的に言って、暗号技術のプリミティブを自分で実装しないのが最善です。しかし、これでマークル証明についてより深く理解し、いつ使用する価値があるかを判断できるようになることを願っています。

マークル証明は_完全性_を保持しますが、_可用性_は保持しないことに注意してください。データストレージがアクセスを許可しないと決定し、アクセスするためのマークル・ツリーを構築することもできない場合、他の誰もあなたの資産を奪うことができないと知っていても、それは小さな慰めにすぎません。したがって、マークル・ツリーはIPFSなどの何らかの分散型ストレージと一緒に使用するのが最適です。

私の他の作品はこちらをご覧ください (opens in a new tab)