Merkle Patricia Trie

Der Status von Ethereum (die Gesamtheit aller Konten, Salden und Smart Contracts) ist in einer speziellen Version der Datenstruktur kodiert, die in der Informatik allgemein als Merkle-Baum (Merkle Tree) bekannt ist. Diese Struktur ist für viele Anwendungen in der Kryptografie nützlich, da sie eine überprüfbare Beziehung zwischen all den einzelnen Datenbestandteilen herstellt, die in dem Baum miteinander verflochten sind. Dies führt zu einem einzigen Root-Wert (Wurzelwert), der verwendet werden kann, um Dinge über die Daten zu beweisen.

Die Datenstruktur von Ethereum ist ein „modifizierter Merkle-Patricia Trie“. Er wird so genannt, weil er einige Merkmale von PATRICIA (Practical Algorithm To Retrieve Information Coded in Alphanumeric) entlehnt und weil er für den effizienten Datenabruf (engl. retrieval) von Elementen konzipiert ist, die den Ethereum-Status ausmachen.

Ein Merkle-Patricia Trie ist deterministisch und kryptografisch verifizierbar: Die einzige Möglichkeit, einen Status-Root zu generieren, besteht darin, ihn aus jedem einzelnen Teil des Status zu berechnen. Dass zwei Status identisch sind, lässt sich leicht beweisen, indem man den Root-Hash und die Hashes, die zu ihm geführt haben, vergleicht (ein Merkle-Beweis). Umgekehrt gibt es keine Möglichkeit, zwei verschiedene Status mit demselben Root-Hash zu erstellen, und jeder Versuch, den Status mit anderen Werten zu ändern, führt zu einem anderen Status-Root-Hash. Theoretisch bietet diese Struktur den „heiligen Gral“ der O(log(n))-Effizienz für Einfügungen, Suchvorgänge und Löschungen.

In naher Zukunft plant Ethereum die Migration zu einer Verkle-Baum-Struktur (Verkle Tree), was viele neue Möglichkeiten für zukünftige Protokollverbesserungen eröffnen wird.

Voraussetzungen

Um diese Seite besser zu verstehen, wäre es hilfreich, über Grundkenntnisse zu Hashes (opens in a new tab), Merkle-Bäumen (opens in a new tab), Tries (opens in a new tab) und Serialisierung (opens in a new tab) zu verfügen. Dieser Artikel beginnt mit der Beschreibung eines grundlegenden Radix-Baums (opens in a new tab) und führt dann nach und nach die Modifikationen ein, die für die optimiertere Datenstruktur von Ethereum erforderlich sind.

Grundlegende Radix-Tries

In einem grundlegenden Radix-Trie sieht jeder Knoten wie folgt aus:

1    [i_0, i_1 ... i_n, value]

Wobei i_0 ... i_n die Symbole des Alphabets (oft binär oder hexadezimal) darstellen, value der Endwert am Knoten ist und die Werte in den i_0, i_1 ... i_n-Slots entweder NULL oder Zeiger auf (in unserem Fall Hashes von) andere(n) Knoten sind. Dies bildet einen grundlegenden (key, value)-Speicher (Schlüssel-Wert-Speicher).

Angenommen, Sie möchten eine Radix-Baum-Datenstruktur verwenden, um eine Reihenfolge über eine Menge von Schlüssel-Wert-Paaren zu persistieren. Um den Wert zu finden, der aktuell dem Schlüssel dog im Trie zugeordnet ist, würden Sie zunächst dog in Buchstaben des Alphabets umwandeln (was 64 6f 67 ergibt) und dann den Trie entlang dieses Pfades absteigen, bis Sie den Wert finden. Das heißt, Sie beginnen damit, den Root-Hash in einer flachen Schlüssel-Wert-Datenbank (DB) nachzuschlagen, um den Wurzelknoten des Tries zu finden. Er wird als ein Array von Schlüsseln dargestellt, die auf andere Knoten zeigen. Sie würden den Wert am Index 6 als Schlüssel verwenden und ihn in der flachen Schlüssel-Wert-DB nachschlagen, um den Knoten eine Ebene tiefer zu erhalten. Dann wählen Sie Index 4, um den nächsten Wert nachzuschlagen, dann Index 6 und so weiter, bis Sie, nachdem Sie dem Pfad root -> 6 -> 4 -> 6 -> 15 -> 6 -> 7 gefolgt sind, den Wert des Knotens nachschlagen und das Ergebnis zurückgeben.

Es gibt einen Unterschied zwischen dem Nachschlagen von etwas im „Trie“ und der zugrunde liegenden flachen Schlüssel-Wert-„DB“. Beide definieren Schlüssel-Wert-Anordnungen, aber die zugrunde liegende DB kann ein traditionelles 1-Schritt-Nachschlagen eines Schlüssels durchführen. Das Nachschlagen eines Schlüssels im Trie erfordert mehrere Nachschlagevorgänge in der zugrunde liegenden DB, um zu dem oben beschriebenen Endwert zu gelangen. Lassen Sie uns Letzteres als path (Pfad) bezeichnen, um Unklarheiten zu beseitigen.

Die Aktualisierungs- und Löschoperationen für Radix-Tries können wie folgt definiert werden:

1    def update(node_hash, path, value):
2        curnode = db.get(node_hash) if node_hash else [NULL] * 17
3        newnode = curnode.copy()
4        if path == "":
5            newnode[-1] = value
6        else:
7            newindex = update(curnode[path[0]], path[1:], value)
8            newnode[path[0]] = newindex
9        db.put(hash(newnode), newnode)
10        return hash(newnode)
11
12    def delete(node_hash, path):
13        if node_hash is NULL:
14            return NULL
15        else:
16            curnode = db.get(node_hash)
17            newnode = curnode.copy()
18            if path == "":
19                newnode[-1] = NULL
20            else:
21                newindex = delete(curnode[path[0]], path[1:])
22                newnode[path[0]] = newindex
23
24            if all(x is NULL for x in newnode):
25                return NULL
26            else:
27                db.put(hash(newnode), newnode)
28                return hash(newnode)
Alle anzeigen

Ein „Merkle“-Radix-Baum wird aufgebaut, indem Knoten mithilfe deterministisch generierter kryptografischer Hash-Werte verknüpft werden. Diese Inhaltsadressierung (in der Schlüssel-Wert-DB key == keccak256(rlp(value))) bietet eine kryptografische Integritätsgarantie für die gespeicherten Daten. Wenn der Root-Hash eines bestimmten Tries öffentlich bekannt ist, kann jeder mit Zugriff auf die zugrunde liegenden Blattdaten einen Beweis konstruieren, dass der Trie einen bestimmten Wert an einem bestimmten Pfad enthält, indem er die Hashes jedes Knotens bereitstellt, die einen bestimmten Wert mit der Baumwurzel verbinden.

Es ist für einen Angreifer unmöglich, einen Beweis für ein (path, value)-Paar zu liefern, das nicht existiert, da der Root-Hash letztendlich auf allen darunter liegenden Hashes basiert. Jede zugrunde liegende Änderung würde den Root-Hash verändern. Sie können sich den Hash als eine komprimierte Darstellung von Strukturinformationen über die Daten vorstellen, die durch den Urbild-Schutz (Pre-Image Protection) der Hash-Funktion gesichert ist.

Wir bezeichnen eine atomare Einheit eines Radix-Baums (z. B. ein einzelnes Hex-Zeichen oder eine 4-Bit-Binärzahl) als „Nibble“. Während man einen Pfad Nibble für Nibble durchläuft, wie oben beschrieben, können Knoten maximal auf 16 Kinder verweisen, enthalten aber ein value-Element. Wir stellen sie daher als ein Array der Länge 17 dar. Wir nennen diese 17-Element-Arrays „Zweigknoten“ (Branch Nodes).

Radix-Tries haben eine große Einschränkung: Sie sind ineffizient. Wenn Sie eine (path, value)-Bindung speichern möchten, bei der der Pfad, wie bei Ethereum, 64 Zeichen lang ist (die Anzahl der Nibbles in bytes32), benötigen wir über ein Kilobyte zusätzlichen Speicherplatz, um eine Ebene pro Zeichen zu speichern, und jedes Nachschlagen oder Löschen wird die vollen 64 Schritte in Anspruch nehmen. Der im Folgenden vorgestellte Patricia Trie löst dieses Problem.

Optimierung

Ein Knoten in einem Merkle Patricia Trie ist eines der folgenden Elemente:

NULL (dargestellt als leere Zeichenfolge)
branch (Zweig) Ein 17-Element-Knoten [ v0 ... v15, vt ]
leaf (Blatt) Ein 2-Element-Knoten [ encodedPath, value ]
extension (Erweiterung) Ein 2-Element-Knoten [ encodedPath, key ]

Bei 64 Zeichen langen Pfaden ist es unvermeidlich, dass Sie nach dem Durchlaufen der ersten paar Ebenen des Tries einen Knoten erreichen, an dem zumindest für einen Teil des Weges nach unten kein abweichender Pfad existiert. Um zu vermeiden, dass bis zu 15 spärliche NULL-Knoten entlang des Pfades erstellt werden müssen, kürzen wir den Abstieg ab, indem wir einen extension-Knoten der Form [ encodedPath, key ] einrichten, wobei encodedPath den „Teilpfad“ enthält, um vorzuspringen (unter Verwendung einer unten beschriebenen kompakten Kodierung), und der key für das nächste DB-Nachschlagen dient.

Für einen leaf-Knoten, der durch ein Flag im ersten Nibble des encodedPath markiert werden kann, kodiert der Pfad alle Pfadfragmente der vorherigen Knoten und wir können den value direkt nachschlagen.

Diese obige Optimierung führt jedoch zu Mehrdeutigkeiten.

Wenn wir Pfade in Nibbles durchlaufen, kann es sein, dass wir am Ende eine ungerade Anzahl von Nibbles durchlaufen müssen, aber da alle Daten im bytes-Format gespeichert werden, ist es nicht möglich, beispielsweise zwischen dem Nibble 1 und den Nibbles 01 zu unterscheiden (beide müssen als <01> gespeichert werden). Um eine ungerade Länge anzugeben, wird dem Teilpfad ein Flag vorangestellt.

Spezifikation: Kompakte Kodierung einer Hex-Sequenz mit optionalem Terminator

Die Kennzeichnung sowohl von ungerader vs. gerader verbleibender Teilpfadlänge als auch von Blatt- vs. Erweiterungsknoten, wie oben beschrieben, befindet sich im ersten Nibble des Teilpfads jedes 2-Element-Knotens. Daraus ergibt sich Folgendes:

Hex-Zeichen	Bits	Knotentyp (Teil)	Pfadlänge
0	0000	extension	gerade
1	0001	extension	ungerade
2	0010	terminating (leaf)	gerade
3	0011	terminating (leaf)	ungerade

Bei einer geraden verbleibenden Pfadlänge (0 oder 2) folgt immer ein weiteres 0-„Füll“-Nibble (Padding).

1    def compact_encode(hexarray):
2        term = 1 if hexarray[-1] == 16 else 0
3        if term:
4            hexarray = hexarray[:-1]
5        oddlen = len(hexarray) % 2
6        flags = 2 * term + oddlen
7        if oddlen:
8            hexarray = [flags] + hexarray
9        else:
10            hexarray = [flags] + [0] + hexarray
11        # hexarray hat nun eine gerade Länge, dessen erstes Nibble die Flags sind.
12        o = ""
13        for i in range(0, len(hexarray), 2):
14            o += chr(16 * hexarray[i] + hexarray[i + 1])
15        return o
Alle anzeigen

Beispiele:

1    > [1, 2, 3, 4, 5, ...]
2    '11 23 45'
3    > [0, 1, 2, 3, 4, 5, ...]
4    '00 01 23 45'
5    > [0, f, 1, c, b, 8, 10]
6    '20 0f 1c b8'
7    > [f, 1, c, b, 8, 10]
8    '3f 1c b8'

Hier ist der erweiterte Code zum Abrufen eines Knotens im Merkle Patricia Trie:

1    def get_helper(node_hash, path):
2        if path == []:
3            return node_hash
4        if node_hash == "":
5            return ""
6        curnode = rlp.decode(node_hash if len(node_hash) < 32 else db.get(node_hash))
7        if len(curnode) == 2:
8            (k2, v2) = curnode
9            k2 = compact_decode(k2)
10            if k2 == path[: len(k2)]:
11                return get(v2, path[len(k2) :])
12            else:
13                return ""
14        elif len(curnode) == 17:
15            return get_helper(curnode[path[0]], path[1:])
16
17    def get(node_hash, path):
18        path2 = []
19        for i in range(len(path)):
20            path2.push(int(ord(path[i]) / 16))
21            path2.push(ord(path[i]) % 16)
22        path2.push(16)
23        return get_helper(node_hash, path2)
Alle anzeigen

Beispiel-Trie

Angenommen, wir möchten einen Trie, der vier Pfad-Wert-Paare enthält: ('do', 'verb'), ('dog', 'puppy'), ('doge', 'coins'), ('horse', 'stallion').

Zuerst konvertieren wir sowohl Pfade als auch Werte in bytes. Unten werden die tatsächlichen Byte-Darstellungen für Pfade durch <> gekennzeichnet, obwohl Werte zum leichteren Verständnis weiterhin als Zeichenfolgen (Strings) angezeigt werden, gekennzeichnet durch '' (auch sie wären eigentlich bytes):

1    <64 6f> : 'verb'
2    <64 6f 67> : 'puppy'
3    <64 6f 67 65> : 'coins'
4    <68 6f 72 73 65> : 'stallion'

Nun bauen wir einen solchen Trie mit den folgenden Schlüssel-Wert-Paaren in der zugrunde liegenden DB auf:

1    rootHash: [ <16>, hashA ]
2    hashA:    [ <>, <>, <>, <>, hashB, <>, <>, <>, [ <20 6f 72 73 65>, 'stallion' ], <>, <>, <>, <>, <>, <>, <>, <> ]
3    hashB:    [ <00 6f>, hashC ]
4    hashC:    [ <>, <>, <>, <>, <>, <>, hashD, <>, <>, <>, <>, <>, <>, <>, <>, <>, 'verb' ]
5    hashD:    [ <17>, [ <>, <>, <>, <>, <>, <>, [ <35>, 'coins' ], <>, <>, <>, <>, <>, <>, <>, <>, <>, 'puppy' ] ]

Wenn ein Knoten innerhalb eines anderen Knotens referenziert wird, wird keccak256(rlp.encode(node)) eingefügt, falls len(rlp.encode(node)) >= 32, andernfalls node, wobei rlp.encode die RLP-Kodierungsfunktion ist.

Beachten Sie, dass man beim Aktualisieren eines Tries das Schlüssel-Wert-Paar (keccak256(x), x) in einer persistenten Lookup-Tabelle speichern muss, wenn der neu erstellte Knoten eine Länge >= 32 hat. Wenn der Knoten jedoch kürzer ist, muss man nichts speichern, da die Funktion f(x) = x umkehrbar ist.

Tries in Ethereum

Alle Merkle-Tries in der Ausführungsebene von Ethereum verwenden einen Merkle Patricia Trie.

Aus einem Block-Header stammen 3 Roots von 3 dieser Tries.

stateRoot
transactionsRoot
receiptsRoot

Status-Trie

Es gibt einen globalen Status-Trie, und er wird jedes Mal aktualisiert, wenn eine Anwendung einen Block verarbeitet. Darin ist ein path immer: keccak256(ethereumAddress) und ein value ist immer: rlp(ethereumAccount). Genauer gesagt ist ein Ethereum-account (Konto) ein 4-Element-Array aus [nonce,balance,storageRoot,codeHash]. An dieser Stelle ist es erwähnenswert, dass dieser storageRoot die Wurzel eines weiteren Patricia Tries ist:

Speicher-Trie

Im Speicher-Trie (Storage Trie) befinden sich alle Vertragsdaten. Es gibt einen separaten Speicher-Trie für jedes Konto. Um Werte an bestimmten Speicherpositionen bei einer gegebenen Adresse abzurufen, werden die Speicheradresse, die ganzzahlige Position der gespeicherten Daten im Speicher und die Block-ID benötigt. Diese können dann als Argumente an die in der JSON-RPC-API definierte Methode eth_getStorageAt übergeben werden, z. B. um die Daten im Speicher-Slot 0 für die Adresse 0x295a70b2de5e3953354a6a8344e616ed314d7251 abzurufen:

curl -X POST --data '{"jsonrpc":"2.0", "method": "eth_getStorageAt", "params": ["0x295a70b2de5e3953354a6a8344e616ed314d7251", "0x0", "latest"], "id": 1}' localhost:8545
{"jsonrpc":"2.0","id":1,"result":"0x00000000000000000000000000000000000000000000000000000000000004d2"}

Das Abrufen anderer Elemente im Speicher ist etwas aufwendiger, da die Position im Speicher-Trie zunächst berechnet werden muss. Die Position wird als keccak256-Hash der Adresse und der Speicherposition berechnet, die beide links mit Nullen auf eine Länge von 32 Bytes aufgefüllt werden. Zum Beispiel ist die Position für die Daten im Speicher-Slot 1 für die Adresse 0x391694e7e0b0cce554cb130d723a9d27458f9298 wie folgt:

1keccak256(decodeHex("000000000000000000000000391694e7e0b0cce554cb130d723a9d27458f9298" + "0000000000000000000000000000000000000000000000000000000000000001"))

In einer Geth-Konsole kann dies wie folgt berechnet werden:

1> var key = "000000000000000000000000391694e7e0b0cce554cb130d723a9d27458f9298" + "0000000000000000000000000000000000000000000000000000000000000001"
2undefined
3> web3.sha3(key, {"encoding": "hex"})
4"0x6661e9d6d8b923d5bbaab1b96e1dd51ff6ea2a93520fdc9eb75d059238b8c5e9"

Der path ist daher keccak256(<6661e9d6d8b923d5bbaab1b96e1dd51ff6ea2a93520fdc9eb75d059238b8c5e9>). Dies kann nun verwendet werden, um die Daten wie zuvor aus dem Speicher-Trie abzurufen:

curl -X POST --data '{"jsonrpc":"2.0", "method": "eth_getStorageAt", "params": ["0x295a70b2de5e3953354a6a8344e616ed314d7251", "0x6661e9d6d8b923d5bbaab1b96e1dd51ff6ea2a93520fdc9eb75d059238b8c5e9", "latest"], "id": 1}' localhost:8545
{"jsonrpc":"2.0","id":1,"result":"0x000000000000000000000000000000000000000000000000000000000000162e"}

Hinweis: Der storageRoot für ein Ethereum-Konto ist standardmäßig leer, wenn es sich nicht um ein Vertragskonto handelt.

Transaktions-Trie

Es gibt einen separaten Transaktions-Trie für jeden Block, der wiederum (key, value)-Paare speichert. Ein Pfad ist hier: rlp(transactionIndex), was den Schlüssel darstellt, der einem Wert entspricht, der wie folgt bestimmt wird:

1if legacyTx:
2  value = rlp(tx)
3else:
4  value = TxType | encode(tx)

Weitere Informationen dazu finden Sie in der Dokumentation zu EIP 2718 (opens in a new tab).

Receipts-Trie

Jeder Block hat seinen eigenen Receipts-Trie. Ein path ist hier: rlp(transactionIndex). transactionIndex ist sein Index innerhalb des Blocks, in den er aufgenommen wurde. Der Receipts-Trie wird niemals aktualisiert. Ähnlich wie beim Transaktions-Trie gibt es aktuelle und Legacy-Receipts. Um einen bestimmten Receipt im Receipts-Trie abzufragen, werden der Index der Transaktion in ihrem Block, die Receipt-Nutzdaten (Payload) und der Transaktionstyp benötigt. Der zurückgegebene Receipt kann vom Typ Receipt sein, der als Verkettung von TransactionType und ReceiptPayload definiert ist, oder er kann vom Typ LegacyReceipt sein, der als rlp([status, cumulativeGasUsed, logsBloom, logs]) definiert ist.

Weitere Informationen dazu finden Sie in der Dokumentation zu EIP 2718 (opens in a new tab).

Merkle Patricia Trie

Voraussetzungen

Grundlegende Radix-Tries