マークル・パトリシア・ツリー
最終編集者: @HiroyukiNaito(opens in a new tab), 2024年7月3日
イーサリアムの状態 (あらゆるアカウント、残高、スマートコントラクトの全体) は、コンピューターサイエンスでマークルツリーとして一般的に知られている特殊なバージョンのデータ構造にエンコードされます。 この構造は、暗号技術の多くのアプリケーションにおいて有用です。なぜなら、ツリー内で関わるすべてのデータのそれぞれの部分間で検証可能な関係が作成され、データに関することを証明をするのに使用できる単一のルート値が得られるからです。
イーサリアムのデータ構造は、「修正マークル・パトリシア・ツリー」です。PATRICIA (the Practical Algorithm To Retrieve Information Coded in Alphanumeric) の機能の一部を借用しており、イーサリアムの状態を構成するアイテムから成るデータの効率的な再検索ができるように設計されているため、そのように名付けられました。
マークル・パトリシア・ツリーは、決定論的で暗号的に検証可能です。状態ルートを生成する唯一の方法は、状態のそれぞれの部分で計算することです。2つの状態が同一であることは、ルートハッシュとその計算から導かれたハッシュを比較することで簡単に証明できます (マークルプルーフ) 。 反対に、同じルートハッシュで2つの異なる状態を生成することはあり得ません。また、異なる値で状態を変更しようとすると、異なる状態のルートハッシュになります。 理論的には、この構造により、挿入、検索、削除でO(log(n))
による効率の「ホーリー・グレイル」を提供します。
今後、イーサリアムではバークルツリー(opens in a new tab)構造への移行を計画しています。これにより、将来のプロトコルの改善において、さまざまな新しい可能性が開かれます。
前提知識
このページを理解するには、ハッシュ(opens in a new tab)、マークル ツリー(opens in a new tab)、ツリー(opens in a new tab)、シリアライゼーション(opens in a new tab)に関する基本的な知識が必要です。 この記事では、基本的な基数ツリー(opens in a new tab)の説明から開始します。その後、イーサリアムで最適化されたデータ構造として必要とされた変更について順を追って説明します。
基本的な基数ツリー
基本的な基数ツリーでは、すべてのノードは次のようになります。
1 [i_0, i_1 ... i_n, value]
i_0 ... i_n
は、アルファベットの記号列(通常は2進数または16進数)を表し、value
はノードの最終値、スロット i_0, i_1 ... i_n
の値は、NULL
または他のノードへのポインタ(イーサリアムの場合はハッシュ値)です。 これにより、基本的な(key, value)
型ストアが形成されます。
キーバリューセットに対する順序を永続化するために、基数ツリーのデータ構造を使用するとします。 ツリーで現在dog
に対応する値を知るには、最初にdog
のアルファベットの文字を変換します(64 6f 67
)。次に、値が見つかるまで64 6f 67のパスをたどってツリーを下ります。 つまり、ツリーのルートノードを見つけるために、フラットなキーバリューDBのルートハッシュを調べることから始めます。 これは、他のノードを指すキーの配列として表現されます。 インデックス6
の値をキーとして使用し、フラットなキーバリューDBで検索し、ノードを1レベル下げます。 次にインデックス4
を選択して次の値を検索し、次にインデックス6
を選択します。 root -> 6 -> 4 -> 6 -> 15 -> 6 -> 7
のパスをたどり、ノードの値を参照して結果を返します。
「ツリー」で何かを検索することと、下層のフラットなキーバリュー型「データベース」で検索することには、違いがあります。 どちらもキーバリューの配列を定義しますが、下層のデータベースは従来の1ステップのキー検索が実行できます。 ツリーでキーを検索するには、複数のデータベースを検索して上記の最終値を得る必要があります。 あいまいさをなくすために、後者をpath
としましょう。
基数ツリーの更新操作と削除操作は、次のように定義できます。
1 def update(node,path,value):2 curnode = db.get(node) if node else [ NULL ] * 173 newnode = curnode.copy()4 if path == '':5 newnode[-1] = value6 else:7 newindex = update(curnode[path[0]],path[1:],value)8 newnode[path[0]] = newindex9 db.put(hash(newnode),newnode)10 return hash(newnode)1112 def delete(node,path):13 if node is NULL:14 return NULL15 else:16 curnode = db.get(node)17 newnode = curnode.copy()18 if path == '':19 newnode[-1] = NULL20 else:21 newindex = delete(curnode[path[0]],path[1:])22 newnode[path[0]] = newindex2324 if all(x is NULL for x in newnode):25 return NULL26 else:27 db.put(hash(newnode),newnode)28 return hash(newnode)すべて表示
「マークル」基数ツリーは、決定論的に生成された暗号ハッシュダイジェストを使用してノードをリンクすることによって構築されます。 このコンテンツアドレッシング(キーバリューDBでkey == keccak256(rlp(value))
)は、格納されたデータの暗号完全性保証を提供します。 特定のツリーのルートハッシュが公に知られている場合、特定の値をツリールートに結合する各ノードのハッシュ値を提供することで、ツリーの内部にあるリーフデータにアクセスして、特定のパスに特定の値が存在していることを証明できます。
攻撃者は、存在しない(path, value)
のペアの証明を提供することは不可能です。これはルートハッシュは、結局のところその下のにあるすべてのハッシュ値に基づいているためです。 下層の変更はルートハッシュを変更します。 ハッシュについては、データの構造情報を圧縮して表現し、ハッシュ関数の事前イメージによって保護されていると考えることができます。
基数ツリーの最小単位(1つの16 進数文字、すなわち4ビットの2進数)を「ニブル」と呼びます。 上記のように一度に1つのニブルでパスを横断している間、ノードは最大で16の子を参照することができますがvalue
要素を含んでいます。 そのため、ノードは長さ17の配列として表されます。 これらの17要素配列を「ブランチノード」と呼びます。
マークル・パトリシア・ツリー
基数ツリーには、1つの大きな制限があります。それは、非効率的であることです。 イーサリアムのようにパスが64文字長 (bytes32
単位のニブル数)の1つの(path, value)
のバインディングを格納する場合、1文字を格納する1レベルに、1キロバイト以上のスペースが必要となり、また、それぞれの検索または削除には、64ステップが必要です。 次に紹介するパトリシア・ツリーは、この問題を解決します。
最適化
マークル・パトリシア・ツリーのノードは、以下のいずれかです。
NULL
(空文字列を表す)branch
17アイテムのノード[ v0 ... v15, vt ]
leaf
2アイテムのノード[ encodedPath, value ]
extension
2アイテムのノード[ encodedPath, key ]
64文字のパスでは、ツリーの最初のいくつかのレイヤーを横断した後、少なくとも下方の一部に分岐パスが存在しないノードに到達することは避けらません。 パスに沿って最大15のNULL
のスパースノードを作成する必要性を回避するために、[ encodedPath, key ]
フォームのextension
ノードを設定することで下りへショートカットをします。このencodedPath
は、次へスキップするための「部分パス」を含みます(後述のコンパクトエンコーディングを使用)。そして、key
は、次のDBルックアップ用です。
leaf
ノードは、encodedPath
の最初のニブルのフラグでマークできます。パスは、前のノードのすべてのパスのフラグメントをエンコードし、value
を直接調べることができます。
しかし、上記の最適化は、次の問題があります。
パスをニブルで横断する場合、すべてのデータがbytes
形式で格納されているため、ニブルの数が奇数になる場合があります。 例えば、ニブル1
とニブル01
を区別することはできません(両方とも<01>
として格納される必要があります)。 奇数の長さを指定するには、部分パスの前にフラグをつけます。
仕様: オプショナルターミネーターを使用した16進数シーケンスのコンパクトエンコーディング
上記の残りの部分パス長が偶数または奇数かと、リーフまたは拡張ノードかを表すフラグは両方、あらゆる「2アイテムのノード」の部分パスの最初のニブルにあります。 結果は、次の通りになります。
1hex char bits | node type partial path length2----------------------------------------------------------3 0 0000 | extension even4 1 0001 | extension odd5 2 0010 | terminating (leaf) even6 3 0011 | terminating (leaf) odd
偶数の残りのパス長 (0
または2
)の場合 、もう一つの0
の「パディング」のニブルが常に続きます。
1 def compact_encode(hexarray):2 term = 1 if hexarray[-1] == 16 else 03 if term: hexarray = hexarray[:-1]4 oddlen = len(hexarray) % 25 flags = 2 * term + oddlen6 if oddlen:7 hexarray = [flags] + hexarray8 else:9 hexarray = [flags] + [0] + hexarray10 // hexarray now has an even length whose first nibble is the flags.11 o = ''12 for i in range(0,len(hexarray),2):13 o += chr(16 * hexarray[i] + hexarray[i+1])14 return oすべて表示
例:
1 > [ 1, 2, 3, 4, 5, ...]2 '11 23 45'3 > [ 0, 1, 2, 3, 4, 5, ...]4 '00 01 23 45'5 > [ 0, f, 1, c, b, 8, 10]6 '20 0f 1c b8'7 > [ f, 1, c, b, 8, 10]8 '3f 1c b8'
以下は、パトリシア・マークル・ツリーでノードを取得する拡張コードです。
1 def get_helper(node,path):2 if path == []: return node3 if node = '': return ''4 curnode = rlp.decode(node if len(node) < 32 else db.get(node))5 if len(curnode) == 2:6 (k2, v2) = curnode7 k2 = compact_decode(k2)8 if k2 == path[:len(k2)]:9 return get(v2, path[len(k2):])10 else:11 return ''12 elif len(curnode) == 17:13 return get_helper(curnode[path[0]],path[1:])1415 def get(node,path):16 path2 = []17 for i in range(len(path)):18 path2.push(int(ord(path[i]) / 16))19 path2.push(ord(path[i]) % 16)20 path2.push(16)21 return get_helper(node,path2)すべて表示
ツリーの例
次の4つのパス/バリューのペアを含むツリーが必要だとします。 ('do', 'verb')
、('dog', 'puppy')
、('doge', 'coins')
、('horse', 'stallion')
。
まず、パスと値(バリュー)の両方をbytes
に変換します。 以下では、pathsを実際のバイト表現 <>
によって表示しています。しかし、 valuesは、分かりやすいように文字列として''
で表示しています(実際はbytes
) 。
1 <64 6f> : 'verb'2 <64 6f 67> : 'puppy'3 <64 6f 67 65> : 'coins'4 <68 6f 72 73 65> : 'stallion'
それでは、下層のデータベースで、次のようなキーバリューのペアを持つこのようなツリーを構築します。
1 rootHash: [ <16>, hashA ]2 hashA: [ <>, <>, <>, <>, hashB, <>, <>, <>, [ <20 6f 72 73 65>, 'stallion' ], <>, <>, <>, <>, <>, <>, <>, <> ]3 hashB: [ <00 6f>, hashC ]4 hashC: [ <>, <>, <>, <>, <>, <>, hashD, <>, <>, <>, <>, <>, <>, <>, <>, <>, 'verb' ]5 hashD: [ <17>, [ <>, <>, <>, <>, <>, <>, [ <35>, 'coins' ], <>, <>, <>, <>, <>, <>, <>, <>, <>, 'puppy' ] ]
1つのノードが内部の別のノードから参照されるとき、含まれているのは、H(rlp.encode(node))
であり、H(x) = keccak256(x) if len(x) >= 32 else x
とrlp.encode
は、RLPエンコーディング関数です。
ツリーを更新するとき、新しく作成されたノードの長さが32以上の場合、キーバリューのペア(keccak256(x), x)
を永続的なルックアップテーブルに格納する必要があることに注意してください。 ただし、ノードがそれよりも短い場合、関数 function f(x) = x は可逆であるため、何も格納する必要はありません。
イーサリアムのツリー
イーサリアムの実行レイヤーのすべてのマークルツリーは、マークル・パトリシア・ツリーを使用しています。
ブロックヘッダーに、これらのツリーの3つから、3つのルートがあります。
- stateRoot (ステートルート)
- transactionsRoot (トランザクションルート)
- receiptsRoot (レシートルート)
ステート(状態)ツリー
グローバルの状態ツリーが1つあり、クライアントがブロックを処理するたびに更新されます。 その中では、 path
は常にkeccak256(ethereumAddress)
であり、value
は常にrlp(ethereumAccount)
です。 より具体的には、イーサリアムのaccount
は、4つのアイテムの配列[nonce,balance,storageRoot,codeHash]
です。 この点において、このstorageRoot
が、もう一つのパトリシア・ツリーであることは非常に重要です。
ストレージツリー
ストレージツリーは、 すべてのコントラクトデータが存在する場所です。 アカウントごとに個別のストレージツリーがあります。 与えられたアドレスにある、特定のストレージポジションの値を取得するには、ストレージアドレスであるストレージに格納されたデータの整数のポジションと、ブロックIDが必要です。 これらは、JSON-RPC APIで定義されているeth_getStorageAt
に引数として渡すことができます。アドレス0x295a70b2de5e3953354a6a8344e616ed314d7251
ストレージスロット0のデータを取得する例は、次のようになります。
1curl -X POST --data '{"jsonrpc":"2.0", "method": "eth_getStorageAt", "params": ["0x295a70b2de5e3953354a6a8344e616ed314d7251", "0x0", "latest"], "id": 1}' localhost:854523{"jsonrpc":"2.0","id":1,"result":"0x00000000000000000000000000000000000000000000000000000000000004d2"}4
ストレージの他の要素を取得するのは、ストレージツリーのポジションを最初に計算する必要があるため、より複雑になります。 ポジションは、アドレスとストレージポジションのkeccak256
ハッシュとして計算され、両方とも長さ32バイト長になるように左からゼロが足されます。 例えば、アドレス 0x391694e7e0b0cce554cb130d723a9d27458f9298
のストレージスロット1のデータの位置は、次のようになります。
1keccak256(decodeHex("000000000000000000000000391694e7e0b0cce554cb130d723a9d27458f9298" + "0000000000000000000000000000000000000000000000000000000000000001"))
Gethコンソールでは、これは次のように計算できます。
1> var key = "000000000000000000000000391694e7e0b0cce554cb130d723a9d27458f9298" + "0000000000000000000000000000000000000000000000000000000000000001"2undefined3> web3.sha3(key, {"encoding": "hex"})4"0x6661e9d6d8b923d5bbaab1b96e1dd51ff6ea2a93520fdc9eb75d059238b8c5e9"
よって、path
はkeccak256(<6661e9d6d8b923d5bbaab1b96e1dd51ff6ea2a93520fdc9eb75d059238b8c5e9>)
となります。 これを使用して、前と同様にストレージツリーからデータを取得できます。
1curl -X POST --data '{"jsonrpc":"2.0", "method": "eth_getStorageAt", "params": ["0x295a70b2de5e3953354a6a8344e616ed314d7251", "0x6661e9d6d8b923d5bbaab1b96e1dd51ff6ea2a93520fdc9eb75d059238b8c5e9", "latest"], "id": 1}' localhost:854523{"jsonrpc":"2.0","id":1,"result":"0x000000000000000000000000000000000000000000000000000000000000162e"}
注: イーサリアムアカウントのstorageRoot
は、コントラクトアカウントでなければ、デフォルトで空になります。
トランザクションツリー
ブロックごとに個別のトランザクションツリーがあり、ここでも(key, value)
ペアが格納されます。 パスは、ここではrlp(transactionIndex)
で、以下によって決定される値に対応するキーを表します。
1if legacyTx:2 value = rlp(tx)3else:4 value = TxType | encode(tx)
詳細については、EIP 2718(opens in a new tab)のドキュメントを参照してください。
レシートツリー
すべてのブロックは、それぞれのレシートツリーを持っています。 ここでのpath
は、rlp(transactionIndex)
です。 transactionIndex
は、そのトランザクションが含まれたブロック内でのインデックスです。 レシートツリーは更新されることはありません。 トランザクションと同様に、現在のレシートとレガシーのレシートがあります。 レシートツリーで特定のレシートをクエリーするには、ブロックのトランザクションのインデックス、レシートのペイロード、トランザクションタイプが必要となります。 返されるレシートは、TransactionType
とReceiptPayload
の集まったものとして定義されるReceipt
タイプまたは、rlp([status, cumulativeGasUsed, logsBloom, logs])
として定義されるLegacyReceipt
タイプとなります。
詳細については、EIP 2718(opens in a new tab)のドキュメントを参照してください。