डेटा उपलब्धता
"भरोसा मत करो, सत्यापित करो" इथेरियम में एक आम कहावत है। विचार यह है कि आपका नोड साथियों से प्राप्त ब्लॉक में सभी लेन-देन को निष्पादित करके स्वतंत्र रूप से यह सत्यापित कर सकता है कि उसे प्राप्त जानकारी सही है, ताकि यह सुनिश्चित हो सके कि प्रस्तावित परिवर्तन नोड द्वारा स्वतंत्र रूप से गणना किए गए परिवर्तनों से पूरी तरह मेल खाते हैं। इसका मतलब है कि नोड्स को यह भरोसा करने की आवश्यकता नहीं है कि ब्लॉक भेजने वाले ईमानदार हैं। यदि डेटा गायब है तो यह संभव नहीं है।
डेटा उपलब्धता उस विश्वास को संदर्भित करती है जो एक उपयोगकर्ता को हो सकता है कि किसी ब्लॉक को सत्यापित करने के लिए आवश्यक डेटा वास्तव में सभी नेटवर्क प्रतिभागियों के लिए उपलब्ध है। इथेरियम लेयर 1 (L1) पर पूर्ण नोड्स के लिए यह अपेक्षाकृत सरल है; पूर्ण नोड प्रत्येक ब्लॉक में सभी डेटा की एक प्रति डाउनलोड करता है - डाउनलोडिंग संभव होने के लिए डेटा का उपलब्ध होना आवश्यक है। गायब डेटा वाले ब्लॉक को ब्लॉकचेन में जोड़ने के बजाय छोड़ दिया जाएगा। यह "ऑनचेन डेटा उपलब्धता" है और यह मोनोलिथिक ब्लॉकचेन की एक विशेषता है। पूर्ण नोड्स को अमान्य लेन-देन स्वीकार करने के लिए धोखा नहीं दिया जा सकता क्योंकि वे अपने लिए हर लेन-देन को डाउनलोड और निष्पादित करते हैं। हालाँकि, मॉड्यूलर ब्लॉकचेन, लेयर 2 (L2) रोलअप्स और लाइट क्लाइंट्स के लिए, डेटा उपलब्धता परिदृश्य अधिक जटिल है, जिसके लिए कुछ अधिक परिष्कृत सत्यापन प्रक्रियाओं की आवश्यकता होती है।
पूर्वापेक्षाएँ
आपको ब्लॉकचेन के मूल सिद्धांतों, विशेष रूप से सर्वसम्मति तंत्र की अच्छी समझ होनी चाहिए। यह पृष्ठ यह भी मानकर चलता है कि पाठक ब्लॉक, लेन-देन, नोड्स, स्केलिंग समाधानों और अन्य प्रासंगिक विषयों से परिचित है।
डेटा उपलब्धता की समस्या
डेटा उपलब्धता की समस्या पूरे नेटवर्क को यह साबित करने की आवश्यकता है कि ब्लॉकचेन में जोड़े जा रहे कुछ लेन-देन डेटा का संक्षिप्त रूप वास्तव में वैध लेन-देन के एक सेट का प्रतिनिधित्व करता है, लेकिन ऐसा सभी नोड्स को सभी डेटा डाउनलोड करने की आवश्यकता के बिना करना है। ब्लॉक को स्वतंत्र रूप से सत्यापित करने के लिए पूर्ण लेन-देन डेटा आवश्यक है, लेकिन सभी नोड्स को सभी लेन-देन डेटा डाउनलोड करने की आवश्यकता स्केलिंग में एक बाधा है। डेटा उपलब्धता समस्या के समाधान का उद्देश्य पर्याप्त आश्वासन प्रदान करना है कि पूर्ण लेन-देन डेटा उन नेटवर्क प्रतिभागियों को सत्यापन के लिए उपलब्ध कराया गया था जो अपने लिए डेटा डाउनलोड और संग्रहीत नहीं करते हैं।
लाइट नोड्स और लेयर 2 (L2) रोलअप्स नेटवर्क प्रतिभागियों के महत्वपूर्ण उदाहरण हैं जिन्हें मजबूत डेटा उपलब्धता आश्वासनों की आवश्यकता होती है लेकिन वे अपने लिए लेन-देन डेटा डाउनलोड और संसाधित नहीं कर सकते हैं। लेन-देन डेटा डाउनलोड करने से बचना ही लाइट नोड्स को हल्का बनाता है और रोलअप्स को प्रभावी स्केलिंग समाधान बनने में सक्षम बनाता है।
भविष्य के "स्टेटलेस" इथेरियम क्लाइंट्स के लिए भी डेटा उपलब्धता एक महत्वपूर्ण चिंता का विषय है, जिन्हें ब्लॉक सत्यापित करने के लिए स्थिति डेटा डाउनलोड और संग्रहीत करने की आवश्यकता नहीं होती है। स्टेटलेस क्लाइंट्स को अभी भी यह सुनिश्चित करने की आवश्यकता है कि डेटा कहीं उपलब्ध है और इसे सही ढंग से संसाधित किया गया है।
डेटा उपलब्धता समाधान
डेटा उपलब्धता सैंपलिंग (DAS)
डेटा उपलब्धता सैंपलिंग (DAS) नेटवर्क के लिए यह जांचने का एक तरीका है कि किसी भी व्यक्तिगत नोड पर बहुत अधिक दबाव डाले बिना डेटा उपलब्ध है। प्रत्येक नोड (नॉन-स्टेकिंग नोड्स सहित) कुल डेटा का कुछ छोटा, यादृच्छिक रूप से चुना गया उपसमुच्चय डाउनलोड करता है। नमूनों को सफलतापूर्वक डाउनलोड करना उच्च विश्वास के साथ पुष्टि करता है कि सभी डेटा उपलब्ध है। यह डेटा इरेज़र कोडिंग पर निर्भर करता है, जो अनावश्यक जानकारी के साथ दिए गए डेटासेट का विस्तार करता है (ऐसा करने का तरीका डेटा पर पॉलीनोमियल के रूप में ज्ञात फ़ंक्शन को फिट करना और अतिरिक्त बिंदुओं पर उस पॉलीनोमियल का मूल्यांकन करना है)। यह आवश्यकता पड़ने पर अनावश्यक डेटा से मूल डेटा को पुनर्प्राप्त करने की अनुमति देता है। इस डेटा निर्माण का एक परिणाम यह है कि यदि मूल डेटा में से कोई भी अनुपलब्ध है, तो विस्तारित डेटा का आधा हिस्सा गायब हो जाएगा! प्रत्येक नोड द्वारा डाउनलोड किए गए डेटा नमूनों की मात्रा को इस तरह से ट्यून किया जा सकता है कि यह अत्यंत संभावित है कि प्रत्येक क्लाइंट द्वारा नमूना किए गए डेटा अंशों में से कम से कम एक गायब होगा यदि आधे से कम डेटा वास्तव में उपलब्ध है।
पूर्ण डैन्कशार्डिंग लागू होने के बाद रोलअप ऑपरेटर अपना लेन-देन डेटा उपलब्ध कराते हैं, यह सुनिश्चित करने के लिए DAS का उपयोग किया जाएगा। इथेरियम नोड्स यह सुनिश्चित करने के लिए ऊपर बताई गई रिडंडेंसी योजना का उपयोग करके ब्लॉब में प्रदान किए गए लेन-देन डेटा का यादृच्छिक रूप से नमूना लेंगे कि सभी डेटा मौजूद है। लाइट क्लाइंट्स को सुरक्षित करने के लिए ब्लॉक निर्माता अपना सारा डेटा उपलब्ध करा रहे हैं, यह सुनिश्चित करने के लिए भी इसी तकनीक का उपयोग किया जा सकता है। इसी तरह, प्रस्तावक-निर्माता पृथक्करण (PBS) के तहत, केवल ब्लॉक निर्माता को पूरे ब्लॉक को संसाधित करने की आवश्यकता होगी - अन्य सत्यापक डेटा उपलब्धता सैंपलिंग का उपयोग करके सत्यापित करेंगे।
डेटा उपलब्धता समितियाँ
डेटा उपलब्धता समितियाँ (DACs) विश्वसनीय पक्ष हैं जो डेटा उपलब्धता प्रदान करते हैं, या प्रमाणित करते हैं। DACs का उपयोग DAS के बजाय, या इसके संयोजन में (opens in a new tab) किया जा सकता है। समितियों के साथ आने वाली सुरक्षा गारंटी विशिष्ट सेटअप पर निर्भर करती है। उदाहरण के लिए, इथेरियम लाइट नोड्स के लिए डेटा उपलब्धता को प्रमाणित करने के लिए सत्यापकों के यादृच्छिक रूप से नमूने वाले उपसमुच्चय का उपयोग करता है।
DACs का उपयोग कुछ वैलिडियम द्वारा भी किया जाता है। DAC नोड्स का एक विश्वसनीय सेट है जो डेटा की प्रतियों को ऑफ़लाइन संग्रहीत करता है। विवाद की स्थिति में DAC को डेटा उपलब्ध कराना आवश्यक है। DAC के सदस्य यह साबित करने के लिए ऑनचेन सत्यापन भी प्रकाशित करते हैं कि उक्त डेटा वास्तव में उपलब्ध है। कुछ वैलिडियम DACs को प्रूफ-ऑफ़-स्टेक (PoS) सत्यापक प्रणाली से बदल देते हैं। यहाँ, कोई भी सत्यापक बन सकता है और डेटा को ऑफचेन संग्रहीत कर सकता है। हालाँकि, उन्हें एक "बॉन्ड" प्रदान करना होगा, जो एक स्मार्ट अनुबंध में जमा किया जाता है। दुर्भावनापूर्ण व्यवहार की स्थिति में, जैसे कि सत्यापक द्वारा डेटा रोकना, बॉन्ड में कटौती की जा सकती है। प्रूफ-ऑफ़-स्टेक डेटा उपलब्धता समितियाँ नियमित DACs की तुलना में काफी अधिक सुरक्षित हैं क्योंकि वे सीधे ईमानदार व्यवहार को प्रोत्साहित करती हैं।
डेटा उपलब्धता और लाइट नोड्स
लाइट नोड्स को ब्लॉक डेटा डाउनलोड किए बिना प्राप्त होने वाले ब्लॉक हेडर की शुद्धता को मान्य करने की आवश्यकता होती है। इस हल्केपन की कीमत पूर्ण नोड्स की तरह स्थानीय रूप से लेन-देन को फिर से निष्पादित करके ब्लॉक हेडर को स्वतंत्र रूप से सत्यापित करने में असमर्थता है।
इथेरियम लाइट नोड्स 512 सत्यापकों के यादृच्छिक सेट पर भरोसा करते हैं जिन्हें एक सिंक समिति को सौंपा गया है। सिंक समिति एक DAC के रूप में कार्य करती है जो लाइट क्लाइंट्स को संकेत देती है कि हेडर में डेटा क्रिप्टोग्राफ़िक हस्ताक्षर का उपयोग करके सही है। हर दिन, सिंक समिति ताज़ा होती है। प्रत्येक ब्लॉक हेडर लाइट नोड्स को सचेत करता है कि अगले ब्लॉक पर हस्ताक्षर करने के लिए किन सत्यापकों से अपेक्षा की जाए, ताकि उन्हें वास्तविक सिंक-समिति होने का दिखावा करने वाले दुर्भावनापूर्ण समूह पर भरोसा करने के लिए धोखा न दिया जा सके।
हालाँकि, क्या होता है यदि कोई हमलावर किसी तरह लाइट क्लाइंट्स को एक दुर्भावनापूर्ण ब्लॉक हेडर पास करने का प्रबंधन करता है और उन्हें आश्वस्त करता है कि इसे एक ईमानदार सिंक-समिति द्वारा हस्ताक्षरित किया गया था? उस स्थिति में, हमलावर अमान्य लेन-देन शामिल कर सकता है और लाइट क्लाइंट उन्हें आँख बंद करके स्वीकार कर लेगा, क्योंकि वे ब्लॉक हेडर में संक्षेपित सभी स्थिति परिवर्तनों की स्वतंत्र रूप से जांच नहीं करते हैं। इससे बचाव के लिए, लाइट क्लाइंट धोखाधड़ी प्रमाण का उपयोग कर सकता है।
ये धोखाधड़ी प्रमाण इस तरह काम करते हैं कि एक पूर्ण नोड, नेटवर्क के चारों ओर एक अमान्य स्थिति संक्रमण को गपशप होते हुए देखकर, जल्दी से डेटा का एक छोटा टुकड़ा उत्पन्न कर सकता है जो यह प्रदर्शित करता है कि एक प्रस्तावित स्थिति संक्रमण संभवतः लेन-देन के दिए गए सेट से उत्पन्न नहीं हो सकता है और उस डेटा को साथियों को प्रसारित कर सकता है। लाइट नोड्स उन धोखाधड़ी-प्रमाणों को उठा सकते हैं और खराब ब्लॉक हेडर को छोड़ने के लिए उनका उपयोग कर सकते हैं, यह सुनिश्चित करते हुए कि वे पूर्ण नोड्स के समान ईमानदार चेन पर बने रहें।
यह पूर्ण नोड्स के पास पूर्ण लेन-देन डेटा तक पहुंच होने पर निर्भर करता है। एक हमलावर जो खराब ब्लॉक हेडर प्रसारित करता है और लेन-देन डेटा उपलब्ध कराने में भी विफल रहता है, वह पूर्ण नोड्स को धोखाधड़ी प्रमाण उत्पन्न करने से रोकने में सक्षम होगा। पूर्ण नोड्स खराब ब्लॉक के बारे में चेतावनी का संकेत देने में सक्षम हो सकते हैं, लेकिन वे प्रमाण के साथ अपनी चेतावनी का समर्थन नहीं कर सकते, क्योंकि प्रमाण उत्पन्न करने के लिए डेटा उपलब्ध नहीं कराया गया था!
इस डेटा उपलब्धता समस्या का समाधान DAS है। लाइट नोड्स पूर्ण स्थिति डेटा के बहुत छोटे यादृच्छिक चंक्स डाउनलोड करते हैं और यह सत्यापित करने के लिए नमूनों का उपयोग करते हैं कि पूर्ण डेटा सेट उपलब्ध है। N यादृच्छिक चंक्स डाउनलोड करने के बाद पूर्ण डेटा उपलब्धता को गलत तरीके से मानने की वास्तविक संभावना की गणना की जा सकती है (100 चंक्स के लिए संभावना 10^-30 है (opens in a new tab), यानी, अविश्वसनीय रूप से असंभव)।
इस परिदृश्य में भी, ऐसे हमले जो केवल कुछ बाइट्स को रोकते हैं, यादृच्छिक डेटा अनुरोध करने वाले क्लाइंट्स द्वारा संभवतः किसी का ध्यान नहीं जा सकते हैं। इरेज़र कोडिंग डेटा के छोटे गायब टुकड़ों का पुनर्निर्माण करके इसे ठीक करता है जिनका उपयोग प्रस्तावित स्थिति परिवर्तनों की जांच करने के लिए किया जा सकता है। फिर पुनर्निर्मित डेटा का उपयोग करके एक धोखाधड़ी प्रमाण का निर्माण किया जा सकता है, जो लाइट नोड्स को खराब हेडर स्वीकार करने से रोकता है।
नोट: प्रूफ-ऑफ़-स्टेक इथेरियम लाइट क्लाइंट्स के लिए DAS और धोखाधड़ी प्रमाण अभी तक लागू नहीं किए गए हैं, लेकिन वे रोडमैप पर हैं, जो संभवतः ज़ीके-स्नार्क आधारित प्रमाणों का रूप ले रहे हैं। आज के लाइट क्लाइंट्स DAC के एक रूप पर निर्भर करते हैं: वे सिंक-समिति की पहचान सत्यापित करते हैं और फिर प्राप्त हस्ताक्षरित ब्लॉक हेडर पर भरोसा करते हैं।
डेटा उपलब्धता और लेयर 2 (L2) रोलअप्स
लेयर 2 (L2) स्केलिंग समाधान, जैसे कि , लेन-देन की लागत को कम करते हैं और लेन-देन को ऑफचेन संसाधित करके इथेरियम के थ्रूपुट को बढ़ाते हैं। रोलअप लेन-देन को संकुचित किया जाता है और बैचों में इथेरियम पर पोस्ट किया जाता है। बैच इथेरियम पर एक ही लेन-देन में हजारों व्यक्तिगत ऑफचेन लेन-देन का प्रतिनिधित्व करते हैं। यह बेस लेयर पर भीड़ को कम करता है और उपयोगकर्ताओं के लिए शुल्क कम करता है।
हालाँकि, इथेरियम पर पोस्ट किए गए 'सारांश' लेन-देन पर भरोसा करना तभी संभव है जब प्रस्तावित स्थिति परिवर्तन को स्वतंत्र रूप से सत्यापित किया जा सके और सभी व्यक्तिगत ऑफचेन लेन-देन को लागू करने का परिणाम होने की पुष्टि की जा सके। यदि रोलअप ऑपरेटर इस सत्यापन के लिए लेन-देन डेटा उपलब्ध नहीं कराते हैं, तो वे इथेरियम को गलत डेटा भेज सकते हैं।
ऑप्टिमिस्टिक रोलअप्स संकुचित लेन-देन डेटा को इथेरियम पर पोस्ट करते हैं और स्वतंत्र सत्यापकों को डेटा की जांच करने की अनुमति देने के लिए कुछ समय (आमतौर पर 7 दिन) तक प्रतीक्षा करते हैं। यदि कोई किसी समस्या की पहचान करता है, तो वे धोखाधड़ी-प्रमाण उत्पन्न कर सकते हैं और रोलअप को चुनौती देने के लिए इसका उपयोग कर सकते हैं। इससे चेन वापस रोल हो जाएगी और अमान्य ब्लॉक को छोड़ देगी। यह तभी संभव है जब डेटा उपलब्ध हो। वर्तमान में, दो तरीके हैं जिनसे ऑप्टिमिस्टिक रोलअप्स L1 पर लेन-देन डेटा पोस्ट करते हैं। कुछ रोलअप्स डेटा को CALLDATA के रूप में स्थायी रूप से उपलब्ध कराते हैं जो स्थायी रूप से ऑनचेन रहता है। EIP-4844 के कार्यान्वयन के साथ, कुछ रोलअप्स इसके बजाय अपना लेन-देन डेटा सस्ते ब्लॉब स्टोरेज में पोस्ट करते हैं। यह स्थायी स्टोरेज नहीं है। स्वतंत्र सत्यापकों को ब्लॉब्स से पूछताछ करनी होती है और इथेरियम लेयर-1 से डेटा हटाए जाने से पहले ~18 दिनों के भीतर अपनी चुनौतियाँ उठानी होती हैं। डेटा उपलब्धता की गारंटी इथेरियम प्रोटोकॉल द्वारा केवल उस छोटी निश्चित विंडो के लिए दी जाती है। उसके बाद, यह इथेरियम इकोसिस्टम में अन्य संस्थाओं की जिम्मेदारी बन जाती है। कोई भी नोड DAS का उपयोग करके डेटा उपलब्धता को सत्यापित कर सकता है, यानी ब्लॉब डेटा के छोटे, यादृच्छिक नमूने डाउनलोड करके।
शून्य-ज्ञान (ZK) रोलअप्स को लेन-देन डेटा पोस्ट करने की आवश्यकता नहीं है क्योंकि स्थिति संक्रमण की शुद्धता की गारंटी देते हैं। हालाँकि, डेटा उपलब्धता अभी भी एक समस्या है क्योंकि हम इसके स्थिति डेटा तक पहुंच के बिना ZK-रोलअप की कार्यक्षमता (या इसके साथ बातचीत) की गारंटी नहीं दे सकते हैं। उदाहरण के लिए, यदि कोई ऑपरेटर रोलअप की स्थिति के बारे में विवरण रोकता है तो उपयोगकर्ता अपना बैलेंस नहीं जान सकते हैं। इसके अलावा, वे नए जोड़े गए ब्लॉक में मौजूद जानकारी का उपयोग करके स्थिति अपडेट नहीं कर सकते हैं।
डेटा उपलब्धता बनाम डेटा पुनर्प्राप्ति
डेटा उपलब्धता डेटा पुनर्प्राप्ति से अलग है। डेटा उपलब्धता यह आश्वासन है कि पूर्ण नोड्स किसी विशिष्ट ब्लॉक से जुड़े लेन-देन के पूर्ण सेट तक पहुंचने और सत्यापित करने में सक्षम हैं। इसका मतलब यह नहीं है कि डेटा हमेशा के लिए सुलभ है।
डेटा पुनर्प्राप्ति नोड्स की ब्लॉकचेन से ऐतिहासिक जानकारी प्राप्त करने की क्षमता है। नए ब्लॉक को सत्यापित करने के लिए इस ऐतिहासिक डेटा की आवश्यकता नहीं होती है, यह केवल जेनेसिस ब्लॉक से पूर्ण नोड्स को सिंकिंग करने या विशिष्ट ऐतिहासिक अनुरोधों को पूरा करने के लिए आवश्यक है।
मुख्य इथेरियम प्रोटोकॉल मुख्य रूप से डेटा उपलब्धता से संबंधित है, डेटा पुनर्प्राप्ति से नहीं। डेटा पुनर्प्राप्ति तीसरे पक्ष द्वारा चलाए जा रहे आर्काइव नोड्स की एक छोटी आबादी द्वारा प्रदान की जा सकती है, या इसे पोर्टल नेटवर्क (opens in a new tab) जैसे विकेंद्रीकृत फ़ाइल स्टोरेज का उपयोग करके पूरे नेटवर्क में वितरित किया जा सकता है।
आगे की पढ़ाई
- डेटा उपलब्धता क्या है? (opens in a new tab)
- डेटा उपलब्धता क्या है? (opens in a new tab)
- डेटा उपलब्धता जांच पर एक प्राइमर (opens in a new tab)
- शार्डिंग + DAS प्रस्ताव की व्याख्या (opens in a new tab)
- डेटा उपलब्धता और इरेज़र कोडिंग पर एक नोट (opens in a new tab)
- डेटा उपलब्धता समितियाँ। (opens in a new tab)
- प्रूफ-ऑफ़-स्टेक डेटा उपलब्धता समितियाँ। (opens in a new tab)
- डेटा पुनर्प्राप्ति समस्या के समाधान (opens in a new tab)
- डेटा उपलब्धता या: कैसे रोलअप्स ने चिंता करना छोड़ दिया और इथेरियम से प्यार करना सीख लिया (opens in a new tab)
- EIP-7623: कॉल डेटा लागत बढ़ाना (opens in a new tab)