মূল কন্টেন্টে যান

অফলাইন ডেটা ইন্টিগ্রিটির জন্য মার্কেল প্রমাণ

স্টোরেজ
উন্নত
ওরি পোমেরান্টজ
30 ডিসেম্বর, 2021
10 মিনিট পড়ার সময়

ভূমিকা

আদর্শভাবে আমরা ইথেরিয়াম স্টোরেজে সবকিছু সংরক্ষণ করতে চাই, যা হাজার হাজার কম্পিউটারে সংরক্ষিত থাকে এবং এর অত্যন্ত উচ্চ প্রাপ্যতা (ডেটা সেন্সর করা যায় না) এবং ইন্টিগ্রিটি (ডেটা অননুমোদিতভাবে পরিবর্তন করা যায় না) রয়েছে, তবে একটি 32-বাইট শব্দ সংরক্ষণ করতে সাধারণত 20,000 গ্যাস খরচ হয়। আমি যখন এটি লিখছি, তখন সেই খরচ $6.60 এর সমান। প্রতি বাইটে 21 সেন্ট হিসেবে এটি অনেক ব্যবহারের জন্যই খুব ব্যয়বহুল।

এই সমস্যার সমাধানের জন্য ইথেরিয়াম ইকোসিস্টেম বিকেন্দ্রীকৃত উপায়ে ডেটা সংরক্ষণের অনেক বিকল্প উপায় তৈরি করেছে। সাধারণত এগুলোতে প্রাপ্যতা এবং দামের মধ্যে একটি আপস (tradeoff) থাকে। তবে, ইন্টিগ্রিটি সাধারণত নিশ্চিত করা হয়।

এই নিবন্ধে আপনি শিখবেন কীভাবে মার্কেল প্রমাণ (opens in a new tab) ব্যবহার করে ব্লকচেইনে ডেটা সংরক্ষণ না করেই ডেটা ইন্টিগ্রিটি নিশ্চিত করা যায়।

এটি কীভাবে কাজ করে?

তাত্ত্বিকভাবে আমরা শুধু অনচেইনে ডেটার হ্যাশ সংরক্ষণ করতে পারি এবং যেসব ট্রানজ্যাকশনে এটি প্রয়োজন সেখানে সমস্ত ডেটা পাঠাতে পারি। তবে, এটি এখনও খুব ব্যয়বহুল। একটি ট্রানজ্যাকশনে এক বাইট ডেটার জন্য প্রায় 16 গ্যাস খরচ হয়, যা বর্তমানে প্রায় আধা সেন্ট, বা প্রতি কিলোবাইটে প্রায় $5। প্রতি মেগাবাইটে $5000 হিসেবে, ডেটা হ্যাশিংয়ের অতিরিক্ত খরচ ছাড়াই এটি অনেক ব্যবহারের জন্য এখনও খুব ব্যয়বহুল।

এর সমাধান হলো ডেটার বিভিন্ন সাবসেট বারবার হ্যাশ করা, যাতে যে ডেটা আপনার পাঠানোর প্রয়োজন নেই তার জন্য আপনি শুধু একটি হ্যাশ পাঠাতে পারেন। আপনি এটি একটি মার্কেল ট্রি ব্যবহার করে করতে পারেন, যা এমন একটি ট্রি ডেটা স্ট্রাকচার যেখানে প্রতিটি নোড তার নিচের নোডগুলোর একটি হ্যাশ:

Merkle Tree

রুট হ্যাশ হলো একমাত্র অংশ যা অনচেইনে সংরক্ষণ করা প্রয়োজন। একটি নির্দিষ্ট মান প্রমাণ করার জন্য, রুট পেতে এর সাথে যে সমস্ত হ্যাশ যুক্ত করতে হবে তা আপনি প্রদান করেন। উদাহরণস্বরূপ, C প্রমাণ করতে আপনি D, H(A-B) এবং H(E-H) প্রদান করেন।

Proof of the value of C

বাস্তবায়ন

নমুনা কোড এখানে দেওয়া হয়েছে (opens in a new tab)

অফচেইন কোড

এই নিবন্ধে আমরা অফচেইন গণনার জন্য JavaScript ব্যবহার করি। বেশিরভাগ বিকেন্দ্রীকৃত অ্যাপ্লিকেশন (dapp)-এর অফচেইন উপাদান JavaScript-এ থাকে।

মার্কেল রুট তৈরি করা

প্রথমে আমাদের চেইনে মার্কেল রুট প্রদান করতে হবে।

const ethers = require("ethers")

আমরা ethers প্যাকেজ থেকে হ্যাশ ফাংশন ব্যবহার করি (opens in a new tab)

// র ডেটা যার অখণ্ডতা আমাদের যাচাই করতে হবে। প্রথম দুটি বাইট হ
// লো একটি ইউজার আইডেন্টিফায়ার, এবং শেষ দুটি বাইট হলো টোকেনের পরিমাণ যা
// বর্তমানে ইউজারের কাছে আছে।
const dataArray = [
  0x0bad0010, 0x60a70020, 0xbeef0030, 0xdead0040, 0xca110050, 0x0e660060,
  0xface0070, 0xbad00080, 0x060d0091,
]

প্রতিটি এন্ট্রিকে একটি একক 256-বিট ইন্টিজারে এনকোড করার ফলে উদাহরণস্বরূপ JSON ব্যবহার করার চেয়ে কম পঠনযোগ্য কোড তৈরি হয়। তবে, এর মানে হলো কন্ট্রাক্টে ডেটা পুনরুদ্ধার করতে উল্লেখযোগ্যভাবে কম প্রসেসিং লাগে, তাই গ্যাস খরচ অনেক কম হয়। আপনি অনচেইনে JSON পড়তে পারেন (opens in a new tab), তবে এড়ানো গেলে এটি একটি খারাপ ধারণা।

// হ্যাশ ভ্যালুর অ্যারে, BigInt হিসেবে
const hashArray = dataArray

এই ক্ষেত্রে আমাদের ডেটা শুরু থেকেই 256-বিট মান, তাই কোনো প্রসেসিংয়ের প্রয়োজন নেই। যদি আমরা স্ট্রিংয়ের মতো আরও জটিল ডেটা স্ট্রাকচার ব্যবহার করি, তবে আমাদের নিশ্চিত করতে হবে যে আমরা হ্যাশগুলোর একটি অ্যারে পেতে প্রথমে ডেটা হ্যাশ করি। মনে রাখবেন যে এটি এই কারণেও যে ব্যবহারকারীরা অন্য ব্যবহারকারীদের তথ্য জানলে আমাদের কিছু যায় আসে না। অন্যথায় আমাদের এমনভাবে হ্যাশ করতে হতো যাতে ব্যবহারকারী 1 ব্যবহারকারী 0-এর মান জানতে না পারে, ব্যবহারকারী 2 ব্যবহারকারী 3-এর মান জানতে না পারে ইত্যাদি।

// হ্যাশ ফাংশন যে স্ট্রিং আশা করে এবং
// অন্য সব জায়গায় ব্যবহৃত BigInt-এর মধ্যে রূপান্তর করুন।
const hash = (x) =>
  BigInt(ethers.utils.keccak256("0x" + x.toString(16).padStart(64, 0)))

ethers হ্যাশ ফাংশন একটি হেক্সাডেসিমেল নম্বর সহ একটি JavaScript স্ট্রিং পাওয়ার আশা করে, যেমন 0x60A7, এবং একই স্ট্রাকচারের আরেকটি স্ট্রিং দিয়ে প্রতিক্রিয়া জানায়। তবে, বাকি কোডের জন্য BigInt ব্যবহার করা সহজ, তাই আমরা একটি হেক্সাডেসিমেল স্ট্রিংয়ে রূপান্তর করি এবং আবার ফিরে আসি।

// একটি জোড়ার সিমেট্রিকাল হ্যাশ যাতে ক্রম উল্টে গেলেও আমাদের কোনো সমস্যা না হয়।
const pairHash = (a, b) => hash(hash(a) ^ hash(b))

এই ফাংশনটি প্রতিসম (symmetrical) (a xor (opens in a new tab) b এর হ্যাশ)। এর মানে হলো যখন আমরা মার্কেল প্রমাণ পরীক্ষা করি তখন আমাদের চিন্তা করতে হবে না যে প্রমাণ থেকে প্রাপ্ত মানটি গণনা করা মানের আগে নাকি পরে রাখতে হবে। মার্কেল প্রমাণ পরীক্ষা অনচেইনে করা হয়, তাই সেখানে আমাদের যত কম কাজ করতে হবে ততই ভালো।

সতর্কতা: ক্রিপ্টোগ্রাফি দেখতে যতটা সহজ মনে হয় তার চেয়ে অনেক কঠিন। এই নিবন্ধের প্রাথমিক সংস্করণে হ্যাশ ফাংশন hash(a^b) ছিল। এটি একটি খারাপ ধারণা ছিল কারণ এর মানে হলো যদি আপনি a এবং b এর বৈধ মানগুলো জানতেন তবে আপনি যেকোনো কাঙ্ক্ষিত a' মান প্রমাণ করতে b' = a^b^a' ব্যবহার করতে পারতেন। এই ফাংশনের সাহায্যে আপনাকে b' এমনভাবে গণনা করতে হবে যাতে hash(a') ^ hash(b') একটি পরিচিত মানের (রুটের পথে পরবর্তী শাখা) সমান হয়, যা অনেক বেশি কঠিন।

// এমন একটি ভ্যালু যা নির্দেশ করে যে একটি নির্দিষ্ট ব্রাঞ্চ খালি, এর কোনো
// ভ্যালু নেই
const empty = 0n

যখন মানগুলোর সংখ্যা দুইয়ের পূর্ণসংখ্যার ঘাত (integer power of two) না হয় তখন আমাদের খালি শাখাগুলো পরিচালনা করতে হবে। এই প্রোগ্রামটি যেভাবে এটি করে তা হলো প্লেসহোল্ডার হিসেবে শূন্য রাখা।

Merkle tree with branches missing

এই ফাংশনটি বর্তমান লেয়ারে মানগুলোর জোড়াকে হ্যাশ করে মার্কেল ট্রিতে এক স্তর "উপরে ওঠে"। মনে রাখবেন যে এটি সবচেয়ে কার্যকর বাস্তবায়ন নয়, আমরা ইনপুট কপি করা এড়াতে পারতাম এবং লুপে উপযুক্ত সময়ে শুধু hashEmpty যোগ করতে পারতাম, তবে এই কোডটি পঠনযোগ্যতার জন্য অপ্টিমাইজ করা হয়েছে।

রুট পেতে, যতক্ষণ না শুধুমাত্র একটি মান অবশিষ্ট থাকে ততক্ষণ উপরে উঠতে থাকুন।

একটি মার্কেল প্রমাণ তৈরি করা

একটি মার্কেল প্রমাণ হলো সেই মানগুলো যা মার্কেল রুট ফিরে পেতে প্রমাণ করা মানের সাথে একসাথে হ্যাশ করতে হয়। প্রমাণ করার মানটি প্রায়শই অন্যান্য ডেটা থেকে পাওয়া যায়, তাই আমি এটিকে কোডের অংশ হিসেবে না দিয়ে আলাদাভাবে প্রদান করতে পছন্দ করি।

আমরা (v[0],v[1]), (v[2],v[3]) ইত্যাদি হ্যাশ করি। তাই জোড় মানের জন্য আমাদের পরবর্তীটি প্রয়োজন, বিজোড় মানের জন্য আগেরটি।

        // পরবর্তী উপরের লেয়ারে যান
        currentN = Math.floor(currentN/2)
        currentLayer = oneLevelUp(currentLayer)
    }   // while currentLayer.length > 1

    return result
}   // getMerkleProof

অনচেইন কোড

সবশেষে আমাদের কাছে সেই কোড আছে যা প্রমাণ পরীক্ষা করে। অনচেইন কোডটি Solidity (opens in a new tab)-তে লেখা হয়েছে। এখানে অপ্টিমাইজেশন অনেক বেশি গুরুত্বপূর্ণ কারণ গ্যাস তুলনামূলকভাবে ব্যয়বহুল।

//SPDX-License-Identifier: Public Domain
pragma solidity ^0.8.0;

import "hardhat/console.sol";

আমি এটি Hardhat ডেভেলপমেন্ট এনভায়রনমেন্ট (opens in a new tab) ব্যবহার করে লিখেছি, যা আমাদের ডেভেলপ করার সময় Solidity থেকে কনসোল আউটপুট (opens in a new tab) পেতে দেয়।

মার্কেল রুটের জন্য সেট এবং গেট ফাংশন। একটি প্রোডাকশন সিস্টেমে সবাইকে মার্কেল রুট আপডেট করতে দেওয়া একটি অত্যন্ত খারাপ ধারণা। আমি নমুনা কোডের সরলতার স্বার্থে এখানে এটি করেছি। এমন কোনো সিস্টেমে এটি করবেন না যেখানে ডেটা ইন্টিগ্রিটি সত্যিই গুরুত্বপূর্ণ

    function hash(uint _a) internal pure returns(uint) {
      return uint(keccak256(abi.encode(_a)));
    }

    function pairHash(uint _a, uint _b) internal pure returns(uint) {
      return hash(hash(_a) ^ hash(_b));
    }

এই ফাংশনটি একটি জোড়া হ্যাশ তৈরি করে। এটি মূলত hash এবং pairHash এর জন্য JavaScript কোডের Solidity অনুবাদ।

দ্রষ্টব্য: এটি পঠনযোগ্যতার জন্য অপ্টিমাইজেশনের আরেকটি ক্ষেত্র। ফাংশনের সংজ্ঞা (opens in a new tab) এর উপর ভিত্তি করে, ডেটাকে একটি bytes32 (opens in a new tab) মান হিসেবে সংরক্ষণ করা এবং রূপান্তরগুলো এড়ানো সম্ভব হতে পারে।

গাণিতিক নোটেশনে মার্কেল প্রমাণ যাচাইকরণ দেখতে এরকম: H(proof_n, H(proof_n-1, H(proof_n-2, ... H(proof_1, H(proof_0, value))...)))। এই কোডটি এটি বাস্তবায়ন করে।

মার্কেল প্রমাণ এবং রোলআপ একসাথে কাজ করে না

মার্কেল প্রমাণ রোলআপ-এর সাথে ভালোভাবে কাজ করে না। এর কারণ হলো রোলআপ সমস্ত ট্রানজ্যাকশন ডেটা লেয়ার ১ (l1)-এ লেখে, কিন্তু লেয়ার ২ (l2)-এ প্রসেস করে। একটি ট্রানজ্যাকশনের সাথে একটি মার্কেল প্রমাণ পাঠানোর খরচ প্রতি লেয়ারে গড়ে 638 গ্যাস হয় (বর্তমানে কল ডেটা-তে একটি বাইটের খরচ 16 গ্যাস যদি এটি শূন্য না হয়, এবং 4 গ্যাস যদি এটি শূন্য হয়)। যদি আমাদের কাছে 1024 শব্দের ডেটা থাকে, তবে একটি মার্কেল প্রমাণের জন্য দশটি লেয়ার বা মোট 6380 গ্যাস প্রয়োজন।

উদাহরণস্বরূপ অপটিমিজম (opens in a new tab)-এর দিকে তাকালে, লেয়ার ১ (l1) গ্যাস লেখার খরচ প্রায় 100 Gwei এবং লেয়ার ২ (l2) গ্যাসের খরচ 0.001 Gwei (এটি স্বাভাবিক দাম, নেটওয়ার্ক ব্যস্ত থাকলে এটি বাড়তে পারে)। তাই একটি লেয়ার ১ (l1) গ্যাসের খরচে আমরা লেয়ার ২ (l2) প্রসেসিংয়ে এক লক্ষ গ্যাস খরচ করতে পারি। ধরে নিচ্ছি যে আমরা স্টোরেজ ওভাররাইট করব না, এর মানে হলো আমরা একটি লেয়ার ১ (l1) গ্যাসের দামে লেয়ার ২ (l2)-এর স্টোরেজে প্রায় পাঁচটি শব্দ লিখতে পারি। একটি একক মার্কেল প্রমাণের জন্য আমরা সম্পূর্ণ 1024 শব্দ স্টোরেজে লিখতে পারি (ধরে নিচ্ছি যে সেগুলো ট্রানজ্যাকশনে প্রদান করার পরিবর্তে শুরুতেই অনচেইনে গণনা করা যেতে পারে) এবং তারপরেও বেশিরভাগ গ্যাস অবশিষ্ট থাকবে।

উপসংহার

বাস্তব জীবনে আপনি হয়তো কখনোই নিজে থেকে মার্কেল ট্রি বাস্তবায়ন করবেন না। সুপরিচিত এবং অডিটেড লাইব্রেরি রয়েছে যা আপনি ব্যবহার করতে পারেন এবং সাধারণভাবে বলতে গেলে নিজে থেকে ক্রিপ্টোগ্রাফিক প্রিমিটিভগুলো বাস্তবায়ন না করাই ভালো। তবে আমি আশা করি যে এখন আপনি মার্কেল প্রমাণ আরও ভালোভাবে বুঝতে পেরেছেন এবং কখন এগুলো ব্যবহার করা উচিত তা সিদ্ধান্ত নিতে পারবেন।

মনে রাখবেন যে মার্কেল প্রমাণ ইন্টিগ্রিটি বজায় রাখলেও, এগুলো প্রাপ্যতা বজায় রাখে না। অন্য কেউ আপনার সম্পদ নিতে পারবে না এটা জানা খুব সামান্যই সান্ত্বনা দেয় যদি ডেটা স্টোরেজ অ্যাক্সেস অস্বীকার করার সিদ্ধান্ত নেয় এবং আপনি সেগুলো অ্যাক্সেস করার জন্য একটি মার্কেল ট্রি-ও তৈরি করতে না পারেন। তাই মার্কেল ট্রি কোনো ধরনের বিকেন্দ্রীকৃত স্টোরেজ, যেমন IPFS-এর সাথে ব্যবহার করা সবচেয়ে ভালো।

আমার আরও কাজের জন্য এখানে দেখুন (opens in a new tab)