रिकर्सिव-लेंथ प्रीफ़िक्स (RLP) सीरियलाइज़ेशन
पेज का अंतिम अपडेट: 14 मार्च 2026
रिकर्सिव लेंथ प्रीफ़िक्स (RLP) सीरियलाइज़ेशन का एथेरियम के निष्पादन क्लाइंट में बड़े पैमाने पर उपयोग किया जाता है। RLP नोड्स के बीच डेटा के हस्तांतरण को स्पेस-एफ़िशिएंट फ़ॉर्मैट में मानकीकृत करता है। RLP का उद्देश्य बाइनरी डेटा के मनमाने ढंग से नेस्टेड ऐरे को एन्कोड करना है, और RLP, एथेरियम की निष्पादन परत में ऑब्जेक्ट को सीरियलाइज़ करने के लिए उपयोग की जाने वाली प्राथमिक एन्कोडिंग विधि है। RLP का मुख्य उद्देश्य संरचना को एन्कोड करना है; धनात्मक पूर्णांकों के अपवाद के साथ, RLP विशिष्ट डेटा प्रकारों (जैसे, स्ट्रिंग्स, फ़्लोट्स) को एन्कोड करने का काम हायर-ऑर्डर प्रोटोकॉल को सौंपता है। धनात्मक पूर्णांकों को बिना किसी लीडिंग ज़ीरो के बिग-एंडियन बाइनरी फ़ॉर्म में दर्शाया जाना चाहिए (इस प्रकार पूर्णांक मान शून्य को खाली बाइट ऐरे के बराबर बनाता है)। लीडिंग ज़ीरो वाले डीसीरियलाइज़्ड धनात्मक पूर्णांकों को RLP का उपयोग करने वाले किसी भी हायर-ऑर्डर प्रोटोकॉल द्वारा अमान्य माना जाना चाहिए।
एथेरियम येलो पेपर (परिशिष्ट B) (opens in a new tab) में अधिक जानकारी।
किसी डिक्शनरी को एन्कोड करने के लिए RLP का उपयोग करने के लिए, दो सुझाए गए कैनोनिकल फ़ॉर्म हैं:
- लेक्सिकोग्राफ़िक क्रम में कीज़ के साथ
[[k1,v1],[k2,v2]...]का उपयोग करें - हायर-लेवल पेट्रीसिया ट्री एन्कोडिंग का उपयोग करें जैसा कि एथेरियम करता है
परिभाषा
RLP एन्कोडिंग फ़ंक्शन एक आइटम लेता है। एक आइटम को इस प्रकार परिभाषित किया गया है:
- एक स्ट्रिंग (यानी, बाइट ऐरे) एक आइटम है
- आइटम की एक सूची एक आइटम है
- एक धनात्मक पूर्णांक एक आइटम है
उदाहरण के लिए, निम्नलिखित सभी आइटम हैं:
- एक खाली स्ट्रिंग;
- "cat" शब्द वाली स्ट्रिंग;
- किसी भी संख्या में स्ट्रिंग वाली सूची;
- और
["cat", ["puppy", "cow"], "horse", [[]], "pig", [""], "sheep"]जैसी अधिक जटिल डेटा संरचनाएँ। - संख्या
100
ध्यान दें कि इस पृष्ठ के बाकी हिस्सों के संदर्भ में, 'स्ट्रिंग' का अर्थ है "बाइनरी डेटा के बाइट्स की एक निश्चित संख्या"; किसी विशेष एन्कोडिंग का उपयोग नहीं किया जाता है, और स्ट्रिंग्स की सामग्री के बारे में कोई जानकारी निहित नहीं है (नॉन-मिनिमल धनात्मक पूर्णांकों के विरुद्ध नियम के अनुसार आवश्यक को छोड़कर)।
RLP एन्कोडिंग को इस प्रकार परिभाषित किया गया है:
- एक धनात्मक पूर्णांक के लिए, इसे सबसे छोटे बाइट ऐरे में बदल दिया जाता है, जिसकी बिग-एंडियन व्याख्या पूर्णांक है, और फिर नीचे दिए गए नियमों के अनुसार स्ट्रिंग के रूप में एन्कोड किया जाता है।
- एक एकल बाइट के लिए जिसका मान
[0x00, 0x7f](दशमलव[0, 127]) रेंज में है, वह बाइट स्वयं का RLP एन्कोडिंग है। - अन्यथा, यदि कोई स्ट्रिंग 0-55 बाइट लंबी है, तो RLP एन्कोडिंग में 0x80 (दशमलव 128) मान वाला एक एकल बाइट, उसके बाद स्ट्रिंग की लंबाई और फिर स्ट्रिंग शामिल होती है। इस प्रकार पहले बाइट की रेंज
[0x80, 0xb7](दशमलव[128, 183]) है। - यदि कोई स्ट्रिंग 55 बाइट से अधिक लंबी है, तो RLP एन्कोडिंग में 0xb7 (दशमलव 183) मान वाला एक एकल बाइट, उसके बाद बाइनरी फ़ॉर्म में स्ट्रिंग की लंबाई के बाइट्स में लंबाई, उसके बाद स्ट्रिंग की लंबाई, और फिर स्ट्रिंग शामिल होती है। उदाहरण के लिए, एक 1024 बाइट लंबी स्ट्रिंग को
\xb9\x04\x00(दशमलव185, 4, 0) के रूप में एन्कोड किया जाएगा, जिसके बाद स्ट्रिंग होगी। यहाँ, पहले बाइट के रूप में0xb9(183 + 2 = 185) है, जिसके बाद 2 बाइट0x0400(दशमलव 1024) हैं जो वास्तविक स्ट्रिंग की लंबाई को दर्शाते हैं। इस प्रकार पहले बाइट की रेंज[0xb8, 0xbf](दशमलव[184, 191]) है। - यदि कोई स्ट्रिंग 2^64 बाइट लंबी या उससे अधिक लंबी है, तो इसे एन्कोड नहीं किया जा सकता है।
- यदि किसी सूची का कुल पेलोड (यानी, RLP एन्कोड किए जा रहे उसके सभी आइटमों की संयुक्त लंबाई) 0-55 बाइट लंबा है, तो RLP एन्कोडिंग में 0xc0 मान वाला एक एकल बाइट, उसके बाद पेलोड की लंबाई और फिर आइटमों के RLP एन्कोडिंग का संयोजन शामिल होता है। इस प्रकार पहले बाइट की रेंज
[0xc0, 0xf7](दशमलव[192, 247]) है। - यदि किसी सूची का कुल पेलोड 55 बाइट से अधिक लंबा है, तो RLP एन्कोडिंग में 0xf7 मान वाला एक एकल बाइट, उसके बाद बाइनरी फ़ॉर्म में पेलोड की लंबाई के बाइट्स में लंबाई, उसके बाद पेलोड की लंबाई, और फिर आइटमों के RLP एन्कोडिंग का संयोजन शामिल होता है। इस प्रकार पहले बाइट की रेंज
[0xf8, 0xff](दशमलव[248, 255]) है।
कोड में, यह है:
1def rlp_encode(input):2 if isinstance(input,str):3 if len(input) == 1 and ord(input) < 0x80:4 return input5 return encode_length(len(input), 0x80) + input6 elif isinstance(input, list):7 output = ''8 for item in input:9 output += rlp_encode(item)10 return encode_length(len(output), 0xc0) + output1112def encode_length(L, offset):13 if L < 56:14 return chr(L + offset)15 elif L < 256**8:16 BL = to_binary(L)17 return chr(len(BL) + offset + 55) + BL18 raise Exception("इनपुट बहुत लंबा है")1920def to_binary(x):21 if x == 0:22 return ''23 return to_binary(int(x / 256)) + chr(x % 256)सभी दिखाएँउदाहरण
- स्ट्रिंग "dog" = [ 0x83, 'd', 'o', 'g' ]
- सूची [ "cat", "dog" ] =
[ 0xc8, 0x83, 'c', 'a', 't', 0x83, 'd', 'o', 'g' ] - खाली स्ट्रिंग ('null') =
[ 0x80 ] - खाली सूची =
[ 0xc0 ] - पूर्णांक 0 =
[ 0x80 ] - बाइट '\x00' =
[ 0x00 ] - बाइट '\x0f' =
[ 0x0f ] - बाइट्स '\x04\x00' =
[ 0x82, 0x04, 0x00 ] - तीन का सेट थिओरेटिकल निरूपण (opens in a new tab),
[ [], [[]], [ [], [[]] ] ] = [ 0xc7, 0xc0, 0xc1, 0xc0, 0xc3, 0xc0, 0xc1, 0xc0 ] - स्ट्रिंग "Lorem ipsum dolor sit amet, consectetur adipisicing elit" =
[ 0xb8, 0x38, 'L', 'o', 'r', 'e', 'm', ' ', ..., 'e', 'l', 'i', 't' ]`
RLP डिकोडिंग
RLP एन्कोडिंग के नियमों और प्रक्रिया के अनुसार, RLP डिकोड के इनपुट को बाइनरी डेटा के ऐरे के रूप में माना जाता है। RLP डिकोडिंग प्रक्रिया इस प्रकार है:
-
इनपुट डेटा के पहले बाइट (यानी, प्रीफ़िक्स) के अनुसार डेटा प्रकार, वास्तविक डेटा की लंबाई और ऑफ़सेट को डिकोड करना;
-
डेटा के प्रकार और ऑफ़सेट के अनुसार, धनात्मक पूर्णांकों के लिए न्यूनतम एन्कोडिंग नियम का सम्मान करते हुए, डेटा को तदनुसार डिकोड करें;
-
बाकी इनपुट को डिकोड करना जारी रखें;
उनमें से, डेटा प्रकारों और ऑफ़सेट को डिकोड करने के नियम इस प्रकार हैं:
-
डेटा एक स्ट्रिंग है यदि पहले बाइट (यानी, प्रीफ़िक्स) की रेंज [0x00, 0x7f] है, और स्ट्रिंग ठीक पहला बाइट ही है;
-
डेटा एक स्ट्रिंग है यदि पहले बाइट की रेंज [0x80, 0xb7] है, और वह स्ट्रिंग जिसकी लंबाई पहले बाइट माइनस 0x80 के बराबर है, पहले बाइट के बाद आती है;
-
डेटा एक स्ट्रिंग है यदि पहले बाइट की रेंज [0xb8, 0xbf] है, और स्ट्रिंग की लंबाई जिसकी बाइट्स में लंबाई पहले बाइट माइनस 0xb7 के बराबर है, पहले बाइट के बाद आती है, और स्ट्रिंग, स्ट्रिंग की लंबाई के बाद आती है;
-
डेटा एक सूची है यदि पहले बाइट की रेंज [0xc0, 0xf7] है, और सूची के सभी आइटमों के RLP एन्कोडिंग का संयोजन जिसका कुल पेलोड पहले बाइट माइनस 0xc0 के बराबर है, पहले बाइट के बाद आता है;
-
डेटा एक सूची है यदि पहले बाइट की रेंज [0xf8, 0xff] है, और सूची का कुल पेलोड जिसकी लंबाई पहले बाइट माइनस 0xf7 के बराबर है, पहले बाइट के बाद आता है, और सूची के सभी आइटमों के RLP एन्कोडिंग का संयोजन सूची के कुल पेलोड के बाद आता है;
कोड में, यह है:
1def rlp_decode(input):2 if len(input) == 0:3 return4 output = ''5 (offset, dataLen, type) = decode_length(input)6 if type is str:7 output = instantiate_str(substr(input, offset, dataLen))8 elif type is list:9 output = instantiate_list(substr(input, offset, dataLen))10 output += rlp_decode(substr(input, offset + dataLen))11 return output1213def decode_length(input):14 length = len(input)15 if length == 0:16 raise Exception("इनपुट शून्य है")17 prefix = ord(input[0])18 if prefix <= 0x7f:19 return (0, 1, str)20 elif prefix <= 0xb7 and length > prefix - 0x80:21 strLen = prefix - 0x8022 return (1, strLen, str)23 elif prefix <= 0xbf and length > prefix - 0xb7 and length > prefix - 0xb7 + to_integer(substr(input, 1, prefix - 0xb7)):24 lenOfStrLen = prefix - 0xb725 strLen = to_integer(substr(input, 1, lenOfStrLen))26 return (1 + lenOfStrLen, strLen, str)27 elif prefix <= 0xf7 and length > prefix - 0xc0:28 listLen = prefix - 0xc0;29 return (1, listLen, list)30 elif prefix <= 0xff and length > prefix - 0xf7 and length > prefix - 0xf7 + to_integer(substr(input, 1, prefix - 0xf7)):31 lenOfListLen = prefix - 0xf732 listLen = to_integer(substr(input, 1, lenOfListLen))33 return (1 + lenOfListLen, listLen, list)34 raise Exception("इनपुट RLP एन्कोडिंग फ़ॉर्म के अनुरूप नहीं है")3536def to_integer(b):37 length = len(b)38 if length == 0:39 raise Exception("इनपुट शून्य है")40 elif length == 1:41 return ord(b[0])42 return ord(substr(b, -1)) + to_integer(substr(b, 0, -1)) * 256सभी दिखाएँआगे की रीडिंग
- एथेरियम में RLP (opens in a new tab)
- एथेरियम की आंतरिक कार्यप्रणाली: RLP (opens in a new tab)
- Coglio, A. (2020). ACL2 में एथेरियम का रिकर्सिव लेंथ प्रीफ़िक्स। arXiv preprint arXiv:2009.13769. (opens in a new tab)