डेटा उपलब्धता

"विश्वास ठेवू नका, पडताळणी करा" ही इथेरियममधील एक सामान्य म्हण आहे. कल्पना अशी आहे की तुमचा नोड समवयस्कांकडून प्राप्त झालेल्या ब्लॉकमधील सर्व व्यवहारांची अंमलबजावणी करून त्याला मिळणारी माहिती योग्य असल्याची स्वतंत्रपणे पडताळणी करू शकतो, जेणेकरून प्रस्तावित बदल नोडने स्वतंत्रपणे मोजलेल्या बदलांशी तंतोतंत जुळतील. याचा अर्थ असा की ब्लॉक पाठवणारे प्रामाणिक आहेत यावर नोड्सना विश्वास ठेवण्याची आवश्यकता नाही. जर डेटा गहाळ असेल तर हे शक्य नाही.

डेटा उपलब्धता म्हणजे ब्लॉकची पडताळणी करण्यासाठी आवश्यक असलेला डेटा खरोखरच सर्व नेटवर्क सहभागींना उपलब्ध आहे असा वापरकर्त्याला वाटणारा आत्मविश्वास. इथेरियम स्तर १ (l1) वरील पूर्ण नोड्ससाठी हे तुलनेने सोपे आहे; पूर्ण नोड प्रत्येक ब्लॉकमधील सर्व डेटाची एक प्रत डाउनलोड करतो - डाउनलोड करणे शक्य होण्यासाठी डेटा उपलब्ध असावाच लागतो. गहाळ डेटा असलेला ब्लॉक ब्लॉकचेनमध्ये जोडण्याऐवजी टाकून दिला जाईल. ही "ऑनचेन डेटा उपलब्धता" आहे आणि हे मोनोलिथिक ब्लॉकचेनचे वैशिष्ट्य आहे. पूर्ण नोड्सना अवैध व्यवहार स्वीकारण्यासाठी फसवले जाऊ शकत नाही कारण ते प्रत्येक व्यवहार स्वतःसाठी डाउनलोड करतात आणि कार्यान्वित करतात. तथापि, मॉड्युलर ब्लॉकचेन, स्तर २ (l2) रोलअप्स आणि लाइट क्लायंट्ससाठी, डेटा उपलब्धतेचे स्वरूप अधिक गुंतागुंतीचे आहे, ज्यासाठी काही अधिक प्रगत पडताळणी प्रक्रिया आवश्यक आहेत.

पूर्वतयारी

तुम्हाला ब्लॉकचेनच्या मूलभूत गोष्टींची, विशेषतः एकमत यंत्रणेची चांगली समज असली पाहिजे. हे पृष्ठ असेही गृहीत धरते की वाचकाला ब्लॉक्स, व्यवहार, नोड्स, स्केलिंग उपाय आणि इतर संबंधित विषयांची माहिती आहे.

डेटा उपलब्धतेची समस्या

डेटा उपलब्धतेची समस्या म्हणजे संपूर्ण नेटवर्कला हे सिद्ध करण्याची आवश्यकता आहे की ब्लॉकचेनमध्ये जोडल्या जाणाऱ्या काही व्यवहार डेटाचे संक्षिप्त रूप खरोखरच वैध व्यवहारांचा संच दर्शवते, परंतु सर्व नोड्सना सर्व डेटा डाउनलोड करण्याची आवश्यकता न ठेवता हे करणे. ब्लॉक्सची स्वतंत्रपणे पडताळणी करण्यासाठी संपूर्ण व्यवहार डेटा आवश्यक आहे, परंतु सर्व नोड्सना सर्व व्यवहार डेटा डाउनलोड करणे आवश्यक करणे हा स्केलिंगमधील एक अडथळा आहे. डेटा उपलब्धतेच्या समस्येवरील उपायांचे उद्दिष्ट हे पुरेसे आश्वासन देणे आहे की संपूर्ण व्यवहार डेटा नेटवर्क सहभागींना पडताळणीसाठी उपलब्ध करून देण्यात आला होता जे स्वतःसाठी डेटा डाउनलोड आणि संचयित करत नाहीत.

लाइट नोड्स आणि स्तर २ (l2) रोलअप्स हे नेटवर्क सहभागींची महत्त्वाची उदाहरणे आहेत ज्यांना मजबूत डेटा उपलब्धता आश्वासनांची आवश्यकता असते परंतु ते स्वतःसाठी व्यवहार डेटा डाउनलोड आणि प्रक्रिया करू शकत नाहीत. व्यवहार डेटा डाउनलोड करणे टाळल्यामुळेच लाइट नोड्स हलके होतात आणि रोलअप्स प्रभावी स्केलिंग उपाय बनण्यास सक्षम होतात.

भविष्यातील "स्टेटलेस" इथेरियम क्लायंट्ससाठी डेटा उपलब्धता ही एक गंभीर चिंता आहे ज्यांना ब्लॉक्सची पडताळणी करण्यासाठी स्थिती डेटा डाउनलोड आणि संचयित करण्याची आवश्यकता नाही. स्टेटलेस क्लायंट्सना अद्याप खात्री असणे आवश्यक आहे की डेटा कुठेतरी उपलब्ध आहे आणि त्यावर योग्यरित्या प्रक्रिया केली गेली आहे.

डेटा उपलब्धतेवरील उपाय

डेटा उपलब्धता सॅम्पलिंग (DAS)

डेटा उपलब्धता सॅम्पलिंग (DAS) हा नेटवर्कसाठी कोणत्याही वैयक्तिक नोडवर जास्त ताण न टाकता डेटा उपलब्ध आहे की नाही हे तपासण्याचा एक मार्ग आहे. प्रत्येक नोड (नॉन-स्टेकिंग नोड्ससह) एकूण डेटाचा काही लहान, यादृच्छिकपणे निवडलेला उपसंच डाउनलोड करतो. नमुने यशस्वीरित्या डाउनलोड केल्याने सर्व डेटा उपलब्ध असल्याची उच्च आत्मविश्वासाने पुष्टी होते. हे डेटा इरेजर कोडिंगवर अवलंबून असते, जे अनावश्यक माहितीसह दिलेला डेटासेट विस्तृत करते (हे करण्याचा मार्ग म्हणजे डेटावर पॉलिॉमियल (बहुपदी) म्हणून ओळखले जाणारे फंक्शन बसवणे आणि अतिरिक्त बिंदूंवर त्या बहुपदीचे मूल्यांकन करणे). हे आवश्यकतेनुसार अनावश्यक डेटामधून मूळ डेटा पुनर्प्राप्त करण्यास अनुमती देते. या डेटा निर्मितीचा परिणाम असा होतो की जर मूळ डेटापैकी काहीही अनुपलब्ध असेल, तर विस्तारित डेटापैकी अर्धा डेटा गहाळ होईल! प्रत्येक नोडद्वारे डाउनलोड केलेल्या डेटा नमुन्यांचे प्रमाण ट्यून केले जाऊ शकते जेणेकरून जर अर्ध्यापेक्षा कमी डेटा खरोखर उपलब्ध असेल, तर प्रत्येक क्लायंटने नमुना घेतलेल्या डेटा तुकड्यांपैकी किमान एक गहाळ होण्याची अत्यंत शक्यता असते.

पूर्ण डँकशार्डिंग लागू झाल्यानंतर रोलअप ऑपरेटर त्यांचा व्यवहार डेटा उपलब्ध करून देतील याची खात्री करण्यासाठी DAS चा वापर केला जाईल. सर्व डेटा अस्तित्वात असल्याची खात्री करण्यासाठी इथेरियम नोड्स वर स्पष्ट केलेल्या रिडंडन्सी योजनेचा वापर करून ब्लॉब्समध्ये प्रदान केलेल्या व्यवहार डेटाचे यादृच्छिकपणे नमुने घेतील. सुरक्षित लाइट क्लायंट्ससाठी ब्लॉक उत्पादक त्यांचा सर्व डेटा उपलब्ध करून देत आहेत याची खात्री करण्यासाठी हेच तंत्र वापरले जाऊ शकते. त्याचप्रमाणे, प्रस्तावक-निर्माता विभाजन (PBS) अंतर्गत, केवळ ब्लॉक निर्मात्याला संपूर्ण ब्लॉकवर प्रक्रिया करणे आवश्यक असेल - इतर प्रमाणक डेटा उपलब्धता सॅम्पलिंग वापरून पडताळणी करतील.

डेटा उपलब्धता समित्या

डेटा उपलब्धता समित्या (DACs) हे विश्वसनीय पक्ष आहेत जे डेटा उपलब्धता प्रदान करतात किंवा प्रमाणित करतात. DACs चा वापर DAS ऐवजी किंवा त्याच्या संयोजनात (opens in a new tab) केला जाऊ शकतो. समित्यांसोबत मिळणाऱ्या सुरक्षिततेची हमी विशिष्ट सेटअपवर अवलंबून असते. उदाहरणार्थ, लाइट नोड्ससाठी डेटा उपलब्धतेची पुष्टी करण्यासाठी इथेरियम प्रमाणकांच्या यादृच्छिकपणे नमुना घेतलेल्या उपसंचांचा वापर करते.

काही व्हॅलिडियम्सद्वारे (validiums) देखील DACs वापरले जातात. DAC हा नोड्सचा एक विश्वसनीय संच आहे जो डेटाच्या प्रती ऑफलाइन संचयित करतो. वादाच्या परिस्थितीत DAC ला डेटा उपलब्ध करून देणे आवश्यक आहे. DAC चे सदस्य सदर डेटा खरोखरच उपलब्ध आहे हे सिद्ध करण्यासाठी ऑनचेन प्रमाणपत्रे देखील प्रकाशित करतात. काही व्हॅलिडियम्स DACs च्या जागी प्रूफ-ऑफ-स्टेक (PoS) प्रमाणक प्रणाली वापरतात. येथे, कोणीही प्रमाणक बनू शकतो आणि डेटा साखळीबाह्य संचयित करू शकतो. तथापि, त्यांनी "बाँड" प्रदान करणे आवश्यक आहे, जे स्मार्ट कॉन्ट्रॅक्टमध्ये जमा केले जाते. दुर्भावनापूर्ण वर्तनाच्या बाबतीत, जसे की प्रमाणकाने डेटा रोखून ठेवणे, बाँड स्लॅशिंग केले जाऊ शकते. प्रूफ-ऑफ-स्टेक डेटा उपलब्धता समित्या नियमित DACs पेक्षा बऱ्याच अधिक सुरक्षित असतात कारण ते थेट प्रामाणिक वर्तनाला प्रोत्साहन देतात.

डेटा उपलब्धता आणि लाइट नोड्स

लाइट नोड्सना ब्लॉक डेटा डाउनलोड न करता त्यांना प्राप्त होणाऱ्या ब्लॉक हेडर्सच्या अचूकतेची पडताळणी करणे आवश्यक आहे. या हलकेपणाची किंमत म्हणजे पूर्ण नोड्स ज्या प्रकारे स्थानिक पातळीवर व्यवहारांची पुन्हा अंमलबजावणी करून ब्लॉक हेडर्सची स्वतंत्रपणे पडताळणी करतात तसे करण्यास असमर्थता.

इथेरियम लाइट नोड्स 512 प्रमाणकांच्या यादृच्छिक संचांवर विश्वास ठेवतात ज्यांना सिंक समिती नियुक्त केले गेले आहे. सिंक समिती DAC म्हणून कार्य करते जे क्रिप्टोग्राफिक स्वाक्षरी वापरून लाइट क्लायंट्सना संकेत देते की हेडरमधील डेटा योग्य आहे. दररोज, सिंक समिती रिफ्रेश होते. प्रत्येक ब्लॉक हेडर लाइट नोड्सना पुढील ब्लॉकवर स्वाक्षरी करण्यासाठी कोणत्या प्रमाणकांची अपेक्षा करावी याबद्दल सतर्क करते, जेणेकरून त्यांना वास्तविक सिंक-समिती असल्याचे भासवणाऱ्या दुर्भावनापूर्ण गटावर विश्वास ठेवण्यासाठी फसवले जाऊ शकत नाही.

तथापि, जर एखाद्या हल्लेखोराने लाइट क्लायंट्सना दुर्भावनापूर्ण ब्लॉक हेडर पाठवण्यात यश मिळवले आणि त्यांना पटवून दिले की त्यावर एका प्रामाणिक सिंक-समितीने स्वाक्षरी केली आहे तर काय होईल? अशा परिस्थितीत, हल्लेखोर अवैध व्यवहारांचा समावेश करू शकतो आणि लाइट क्लायंट त्यांना आंधळेपणाने स्वीकारेल, कारण ते ब्लॉक हेडरमध्ये सारांशित केलेल्या सर्व स्थिती बदलांची स्वतंत्रपणे तपासणी करत नाहीत. यापासून संरक्षण करण्यासाठी, लाइट क्लायंट फसवणूक पुराव्यांचा वापर करू शकतो.

हे फसवणूक पुरावे ज्या प्रकारे कार्य करतात ते असे की, नेटवर्कभोवती अवैध स्थिती संक्रमण पसरत असल्याचे पाहून, पूर्ण नोड त्वरीत डेटाचा एक छोटा तुकडा तयार करू शकतो जो हे दर्शवितो की प्रस्तावित स्थिती संक्रमण दिलेल्या व्यवहारांच्या संचातून उद्भवू शकत नाही आणि तो डेटा समवयस्कांना प्रसारित करू शकतो. लाइट नोड्स ते फसवणूक-पुरावे उचलू शकतात आणि खराब ब्लॉक हेडर्स टाकून देण्यासाठी त्यांचा वापर करू शकतात, हे सुनिश्चित करून की ते पूर्ण नोड्सप्रमाणेच प्रामाणिक चेनवर राहतील.

हे पूर्ण नोड्सना संपूर्ण व्यवहार डेटामध्ये प्रवेश असण्यावर अवलंबून असते. खराब ब्लॉक हेडर प्रसारित करणारा आणि व्यवहार डेटा उपलब्ध करून देण्यात अपयशी ठरणारा हल्लेखोर पूर्ण नोड्सना फसवणूक पुरावे तयार करण्यापासून रोखू शकेल. पूर्ण नोड्स खराब ब्लॉकबद्दल चेतावणी देण्यास सक्षम असू शकतात, परंतु ते पुराव्यासह त्यांच्या चेतावणीचे समर्थन करू शकत नाहीत, कारण पुरावा तयार करण्यासाठी डेटा उपलब्ध करून दिला गेला नव्हता!

या डेटा उपलब्धतेच्या समस्येवरील उपाय म्हणजे DAS. लाइट नोड्स संपूर्ण स्थिती डेटाचे अतिशय लहान यादृच्छिक तुकडे डाउनलोड करतात आणि संपूर्ण डेटा संच उपलब्ध असल्याची पडताळणी करण्यासाठी नमुन्यांचा वापर करतात. N यादृच्छिक तुकडे डाउनलोड केल्यानंतर संपूर्ण डेटा उपलब्धतेचे चुकीचे गृहितक धरण्याची वास्तविक शक्यता मोजली जाऊ शकते (100 तुकड्यांसाठी शक्यता 10^-30 आहे (opens in a new tab), म्हणजेच, अत्यंत अशक्य).

या परिस्थितीतही, केवळ काही बाइट्स रोखून ठेवणारे हल्ले यादृच्छिक डेटा विनंत्या करणाऱ्या क्लायंट्सच्या लक्षात न येण्याची शक्यता असते. इरेजर कोडिंग डेटाचे लहान गहाळ तुकडे पुनर्रचित करून हे निश्चित करते जे प्रस्तावित स्थिती बदल तपासण्यासाठी वापरले जाऊ शकतात. त्यानंतर पुनर्रचित डेटा वापरून फसवणूक पुरावा तयार केला जाऊ शकतो, ज्यामुळे लाइट नोड्सना खराब हेडर्स स्वीकारण्यापासून रोखता येते.

टीप: प्रूफ-ऑफ-स्टेक इथेरियम लाइट क्लायंट्ससाठी DAS आणि फसवणूक पुरावे अद्याप लागू केले गेले नाहीत, परंतु ते रोडमॅपवर आहेत, बहुधा झेडके-स्नार्क (ZK-SNARK) आधारित पुराव्यांचे स्वरूप घेतील. आजचे लाइट क्लायंट्स DAC च्या एका स्वरूपावर अवलंबून आहेत: ते सिंक-समितीच्या ओळखीची पडताळणी करतात आणि नंतर त्यांना प्राप्त झालेल्या स्वाक्षरी केलेल्या ब्लॉक हेडर्सवर विश्वास ठेवतात.

डेटा उपलब्धता आणि स्तर २ (l2) रोलअप्स

स्तर २ (l2) स्केलिंग उपाय, जसे की , साखळीबाह्य व्यवहारांवर प्रक्रिया करून व्यवहार खर्च कमी करतात आणि इथेरियमची प्रक्रिया क्षमता वाढवतात. रोलअप व्यवहार संकुचित केले जातात आणि इथेरियमवर बॅचमध्ये पोस्ट केले जातात. बॅचेस इथेरियमवरील एकाच व्यवहारामध्ये हजारो वैयक्तिक साखळीबाह्य व्यवहारांचे प्रतिनिधित्व करतात. यामुळे बेस लेयरवरील गर्दी कमी होते आणि वापरकर्त्यांसाठी शुल्क कमी होते.

तथापि, इथेरियमवर पोस्ट केलेल्या 'सारांश' व्यवहारांवर विश्वास ठेवणे तेव्हाच शक्य आहे जेव्हा प्रस्तावित स्थिती बदल स्वतंत्रपणे सत्यापित केला जाऊ शकतो आणि सर्व वैयक्तिक साखळीबाह्य व्यवहार लागू केल्याचा परिणाम असल्याची पुष्टी केली जाऊ शकते. जर रोलअप ऑपरेटर्सनी या पडताळणीसाठी व्यवहार डेटा उपलब्ध करून दिला नाही, तर ते इथेरियमला चुकीचा डेटा पाठवू शकतात.

ऑप्टिमिस्टिक रोलअप्स संकुचित व्यवहार डेटा इथेरियमवर पोस्ट करतात आणि स्वतंत्र पडताळणीकर्त्यांना डेटा तपासण्याची अनुमती देण्यासाठी काही काळ (सामान्यतः 7 दिवस) प्रतीक्षा करतात. जर कोणाला एखादी समस्या आढळली, तर ते फसवणूक-पुरावा तयार करू शकतात आणि रोलअपला आव्हान देण्यासाठी त्याचा वापर करू शकतात. यामुळे चेन मागे फिरेल आणि अवैध ब्लॉक वगळेल. हे तेव्हाच शक्य आहे जेव्हा डेटा उपलब्ध असेल. सध्या, ऑप्टिमिस्टिक रोलअप्स L1 वर व्यवहार डेटा पोस्ट करण्याचे दोन मार्ग आहेत. काही रोलअप्स CALLDATA म्हणून डेटा कायमस्वरूपी उपलब्ध करून देतात जो कायमस्वरूपी ऑनचेन राहतो. EIP-4844 च्या अंमलबजावणीसह, काही रोलअप्स त्याऐवजी त्यांचा व्यवहार डेटा स्वस्त ब्लॉब स्टोरेजमध्ये पोस्ट करतात. हे कायमस्वरूपी स्टोरेज नाही. स्वतंत्र पडताळणीकर्त्यांना ब्लॉब्सची चौकशी करावी लागते आणि इथेरियम स्तर-१ मधून डेटा हटवण्यापूर्वी ~18 दिवसांच्या आत त्यांची आव्हाने उभी करावी लागतात. डेटा उपलब्धतेची हमी इथेरियम प्रोटोकॉलद्वारे केवळ त्या लहान निश्चित विंडोसाठी दिली जाते. त्यानंतर, ती इथेरियम इकोसिस्टममधील इतर संस्थांची जबाबदारी बनते. कोणताही नोड DAS वापरून डेटा उपलब्धतेची पडताळणी करू शकतो, म्हणजेच ब्लॉब डेटाचे लहान, यादृच्छिक नमुने डाउनलोड करून.

झिरो-नॉलेज (ZK) रोलअप्सना व्यवहार डेटा पोस्ट करण्याची आवश्यकता नाही कारण स्थिती संक्रमणांच्या अचूकतेची हमी देतात. तथापि, डेटा उपलब्धता ही अद्याप एक समस्या आहे कारण आम्ही त्याच्या स्थिती डेटामध्ये प्रवेश केल्याशिवाय ZK-रोलअपच्या कार्यक्षमतेची हमी देऊ शकत नाही (किंवा त्याच्याशी संवाद साधू शकत नाही). उदाहरणार्थ, जर ऑपरेटरने रोलअपच्या स्थितीबद्दल तपशील रोखून ठेवला तर वापरकर्ते त्यांची शिल्लक जाणून घेऊ शकत नाहीत. तसेच, ते नव्याने जोडलेल्या ब्लॉकमध्ये असलेल्या माहितीचा वापर करून स्थिती अद्यतने करू शकत नाहीत.

डेटा उपलब्धता वि. डेटा पुनर्प्राप्ती

डेटा उपलब्धता ही डेटा पुनर्प्राप्तीपेक्षा वेगळी आहे. डेटा उपलब्धता हे एक आश्वासन आहे की पूर्ण नोड्स विशिष्ट ब्लॉकशी संबंधित व्यवहारांच्या संपूर्ण संचामध्ये प्रवेश करण्यास आणि पडताळणी करण्यास सक्षम आहेत. याचा अर्थ असा नाही की डेटा कायमचा प्रवेशयोग्य आहे.

डेटा पुनर्प्राप्ती ही ब्लॉकचेनमधून ऐतिहासिक माहिती पुनर्प्राप्त करण्याची नोड्सची क्षमता आहे. नवीन ब्लॉक्सची पडताळणी करण्यासाठी या ऐतिहासिक डेटाची आवश्यकता नाही, ते केवळ उत्पत्ती ब्लॉकमधून पूर्ण नोड्स समक्रमित करण्यासाठी किंवा विशिष्ट ऐतिहासिक विनंत्या पूर्ण करण्यासाठी आवश्यक आहे.

मुख्य इथेरियम प्रोटोकॉल प्रामुख्याने डेटा उपलब्धतेशी संबंधित आहे, डेटा पुनर्प्राप्तीशी नाही. डेटा पुनर्प्राप्ती तृतीय पक्षांद्वारे चालवल्या जाणाऱ्या आर्काइव्ह नोड्सच्या लहान लोकसंख्येच्या द्वारे प्रदान केली जाऊ शकते, किंवा ती पोर्टल नेटवर्क (opens in a new tab) सारख्या विकेंद्रित फाइल स्टोरेजचा वापर करून नेटवर्कवर वितरित केली जाऊ शकते.