DA=Tính sẵn có của dữ liệu≠Truy xuất dữ liệu lịch sử

Trung cấpFeb 28, 2024
Bài viết này tập trung vào chính xác tính sẵn có của dữ liệu là gì.
DA=Tính sẵn có của dữ liệu≠Truy xuất dữ liệu lịch sử
  • Tiêu đề gốc được chuyển tiếp: Hiểu sai về tính sẵn có của dữ liệu: DA = phát hành dữ liệu ≠ truy xuất dữ liệu lịch sử

Giới thiệu:

Chính xác thì tính sẵn có của dữ liệu là gì? Đối với hầu hết mọi người, ấn tượng đầu tiên có thể là “truy cập dữ liệu lịch sử của một thời điểm nhất định”, nhưng đây thực sự là một sự hiểu lầm lớn về khái niệm DA. Gần đây, những người đồng sáng lập L2BEAT và những người ủng hộ Danksharding, cùng với người sáng lập Celestia, đã làm rõ quan niệm sai lầm này. Họ chỉ ra rằng Tính khả dụng của Dữ liệu (DA) thực sự nên đề cập đến “xuất bản dữ liệu”, nhưng hầu hết mọi người đều hiểu DA là “khả năng truy xuất dữ liệu lịch sử”, thực sự liên quan đến các vấn đề lưu trữ dữ liệu.


Ví dụ: cách đây không lâu, Dankrad đã đề cập đến cơ chế rút tiền/thoát bắt buộc của Lớp 2, lưu ý rằng việc rút tiền bắt buộc của Validium yêu cầu phải có trạng thái L2 mới nhất để xây dựng Bằng chứng Merkle, trong khi Plasma chỉ cần dữ liệu từ 7 ngày trước đó (điều này liên quan đến phương pháp xác định nguồn gốc Nhà nước hợp pháp của họ).

Với điều này, Dankrad đã chỉ ra rõ ràng rằng Validium yêu cầu DA đảm bảo an toàn cho tiền của người dùng, nhưng Plasma thì không. Ở đây,Trường hợp sử dụng Dankrad chỉ ra sự khác biệt giữa DA và truy xuất dữ liệu lịch sử, đó là DA thường chỉ liên quan đến dữ liệu mới được phát hành.


Tại L2BEAT, sự khác biệt giữa Tính khả dụng của Dữ liệu (DA) và Lưu trữ Dữ liệu (DS) đã được nhấn mạnh hơn nữa. Bartek của L2BEAT đã nhiều lần nhấn mạnh rằng DA và lưu trữ dữ liệu/khả năng truy xuất dữ liệu lịch sử là hai thứ khác nhau và người dùng có thể truy cập dữ liệu L2 mà họ cần chỉ vì các nút cung cấp dữ liệu đó “đủ tốt với bạn”. Ngoài ra, L2BEAT có kế hoạch sử dụng “liệu có sẵn các nút lưu trữ dữ liệu được phép hay không” làm chỉ số mới để đánh giá Bản tổng hợp, ngoài DA.


Các tuyên bố từ cộng đồng Ethereum/các thành viên Ethereum Foundation cho thấy ý định của họ là làm rõ và hoàn thiện các khái niệm liên quan đến Lớp 2 trong tương lai, cũng như cung cấp định nghĩa chi tiết hơn về chính Lớp 2. Điều này là do nhiều thuật ngữ liên quan đến Rollup và L2 chưa được giải thích rõ ràng, chẳng hạn như dữ liệu lùi xa đến mức nào được coi là “lịch sử”—một số người tin rằng vì hợp đồng thông minh chỉ có thể gọi dữ liệu từ 256 khối trước đây, dữ liệu từ trước 256 khối ( 50 phút) được coi là “lịch sử”.

Tuy nhiên, “Rollup” được Celestia và Ethereum Foundation đề cập đề cập đến hai điều khác nhau. Bài viết này nhằm mục đích làm rõ sự khác biệt giữa khái niệm DA và lưu trữ dữ liệu, từ nguồn DA, lấy mẫu tính khả dụng của dữ liệu đến các phương pháp triển khai DA trong Rollups, giải thích ý nghĩa thực sự của tính khả dụng của dữ liệu—xuất bản dữ liệu.

Nguồn gốc của khái niệm DA

Khái niệm DA bắt nguồn từ câu hỏi về “dữ liệu sẵn có”, mà người sáng lập Celestia Mustafa giải thích như sau: DA là cách đảm bảo rằng tất cả dữ liệu trong một khối được xuất bản lên mạng khi nhà sản xuất khối đề xuất một khối mới. Nếu nhà sản xuất khối không giải phóng tất cả dữ liệu trong khối thì không thể kiểm tra xem khối đó có chứa các giao dịch sai sót hay không.

Mustafa cũng chỉ ra rằng Ethereum Rollups chỉ cần xuất bản dữ liệu khối L2 trên chuỗi Ethereum và dựa vào ETH để đảm bảo tính khả dụng của dữ liệu. Trên trang web chính thức của Ethereum, vấn đề về tính sẵn có của dữ liệu được tóm tắt dưới dạng câu hỏi: “Làm cách nào để chúng tôi xác minh xem dữ liệu của một khối mới có sẵn hay không?” Đối với các máy khách nhẹ, vấn đề về tính khả dụng của dữ liệu đề cập đến việc xác minh tính khả dụng của một khối mà không cần phải tải xuống toàn bộ khối.

Trang web chính thức của Ethereum cũng phân biệt rõ ràng giữa tính sẵn có của dữ liệu và khả năng truy xuất dữ liệu: tính khả dụng của dữ liệu đề cập đến khả năng các nút tải xuống dữ liệu khối khi nó được đề xuất, nói cách khác, nó liên quan đến thời gian trước khi một khối đạt được sự đồng thuận. Khả năng truy xuất dữ liệu đề cập đến khả năng của các nút truy xuất thông tin lịch sử từ blockchain. Mặc dù việc lưu trữ có thể yêu cầu dữ liệu lịch sử blockchain, nhưng các nút không cần sử dụng dữ liệu lịch sử để xác minh khối và xử lý giao dịch.

Theo quan điểm của cộng tác viên Trung Quốc của Celestia và đối tác của W3Hitchhiker, Ren Hongyi, Lớp 2 giả định trước rằng Ethereum đủ an toàn và phi tập trung. Người sắp xếp có thể tự tin gửi dữ liệu DA tới Ethereum và dữ liệu này sẽ được truyền đi không bị cản trở đến tất cả các nút đầy đủ của Ethereum. Vì các nút đầy đủ L2 tự chạy ứng dụng khách Geth nên chúng được coi là một tập hợp con của các nút đầy đủ Ethereum và do đó có thể nhận dữ liệu DA của Lớp 2.

Trong con mắt của Tiến sĩ Qi Zhou, người sáng lập EthStorage, định nghĩa về Tính khả dụng của Dữ liệu (DA) là không ai có thể giữ lại dữ liệu giao dịch do người dùng gửi lên mạng. Mô hình tin cậy tương ứng là chúng ta chỉ cần tin cậy giao thức của chính Lớp 1 (L1) mà không cần đưa ra các giả định tin cậy khác.

Qi Zhou chỉ ra rằng việc triển khai DA hiện tại trong Ethereum về cơ bản là phát sóng P2P (sử dụng giao thức tin đồn), trong đó mọi nút đầy đủ đều tải xuống, truyền bá các khối mới và lưu trữ dữ liệu Rollup. Tuy nhiên, các nút đầy đủ của Ethereum sẽ không lưu trữ các khối lịch sử mãi mãi. Sau khi triển khai EIP-4844, họ có thể tự động xóa dữ liệu từ một thời điểm nhất định trước đó (khoảng 18 ngày). Không có nhiều nút lưu trữ lưu trữ tất cả dữ liệu lịch sử trên toàn thế giới. EthStorage có kế hoạch lấp đầy khoảng trống này trong hệ sinh thái Ethereum và giúp Lớp 2 thiết lập các nút cố định dữ liệu chuyên dụng của nó.

Các cuộc thảo luận ban đầu về tính sẵn có của dữ liệu của Ethereum Foundation có thể được nhìn thấy trong các tài liệu tweet và GitHub của Vitalik Buterin vào năm 2017. Vào thời điểm đó, ông tin rằng để đảm bảo khả năng mở rộng và hiệu quả của blockchain, cần phải tăng cấu hình phần cứng của các nút đầy đủ (các nút đầy đủ là những nút tải xuống khối hoàn chỉnh và xác minh tính hợp lệ của nó, và Người xác thực, những người tham gia vào sự đồng thuận, là một tập hợp con của các nút đầy đủ). Tuy nhiên, việc tăng yêu cầu phần cứng cho các nút đầy đủ cũng sẽ làm tăng chi phí vận hành, dẫn đến việc tập trung hóa blockchain.

Về vấn đề này, Vitalik đề xuất thiết kế một kế hoạch nhằm giải quyết các rủi ro bảo mật do xu hướng tập trung hóa của các nút đầy đủ hiệu suất cao mang lại. Anh ấy dự định giới thiệu mã xóa và lấy mẫu ngẫu nhiên dữ liệu để thiết kế một giao thức cho phép các nút nhẹ có khả năng phần cứng thấp hơn xác minh rằng một khối không có vấn đề mà không cần biết khối hoàn chỉnh.

Ý tưởng ban đầu của anh ấy thực sự có liên quan đến một ý tưởng được đề cập trong sách trắng Bitcoin, trong đó nói rằng các nút nhẹ không cần nhận khối hoàn chỉnh nhưng sẽ được cảnh báo bởi các nút đầy đủ trung thực nếu có vấn đề với khối. Khái niệm này có thể được mở rộng cho các bằng chứng gian lận sau này nhưng không đảm bảo rằng các nút đầy đủ trung thực luôn có thể thu được đủ dữ liệu và cũng không thể đánh giá sau thực tế liệu người đề xuất khối có giữ lại một số dữ liệu được xuất bản hay không.

Ví dụ: nút A có thể xuất bản bằng chứng gian lận tuyên bố rằng nó đã nhận được khối chưa hoàn chỉnh từ nút B. Tuy nhiên, không thể xác định liệu khối chưa hoàn chỉnh là do A tạo ra hay do B gửi. Vitalik chỉ ra rằng vấn đề này có thể được giải quyết bằng cách Lấy mẫu sẵn có dữ liệu (DAS), rõ ràng liên quan đến các vấn đề về xuất bản dữ liệu.

Vitalik đã thảo luận ngắn gọn về những vấn đề này và giải pháp của chúng trong bài viết “Ghi chú về tính khả dụng của dữ liệu và mã hóa xóa”. Ông chỉ ra rằng bằng chứng DA (Tính khả dụng của dữ liệu) về cơ bản là “sự bổ sung” cho các bằng chứng gian lận.

Lấy mẫu tính sẵn có của dữ liệu

Tuy nhiên, khái niệm DA không quá dễ giải thích, bằng chứng là tài liệu GitHub của Vitalik đã trải qua 18 lần chỉnh sửa, với lần chỉnh sửa cuối cùng được gửi vào ngày 25 tháng 9 năm 2018. Chỉ một ngày trước đó, vào ngày 24 tháng 9 năm 2018, người sáng lập Celestia Mustafa và Vitalik là đồng tác giả của bài báo nổi tiếng sau này “Bằng chứng gian lận và tính sẵn có của dữ liệu: Tối đa hóa bảo mật khách hàng nhẹ và mở rộng quy mô chuỗi khối với đa số không trung thực”.

Điều thú vị là Mustafa được liệt kê là tác giả đầu tiên của bài báo chứ không phải Vitalik (một tác giả khác hiện là nhà nghiên cứu tại chuỗi khối công cộng Sui). Bài viết đề cập đến khái niệm Bằng chứng gian lận và giải thích nguyên tắc Lấy mẫu sẵn có dữ liệu (DAS), thiết kế đại khái một giao thức hỗn hợp DAS + mã hóa xóa hai chiều + bằng chứng gian lận. Bài viết đề cập cụ thể rằng hệ thống chứng minh DA là sự bổ sung cần thiết cho các bằng chứng gian lận.

Từ quan điểm của Vitalik, giao thức hoạt động như sau:

Giả sử một blockchain công khai có N nút đồng thuận (Trình xác thực) với phần cứng dung lượng cao, cho phép thông lượng và hiệu quả dữ liệu cao. Mặc dù một chuỗi khối như vậy có thể có TPS (Giao dịch mỗi giây) cao, nhưng số lượng nút đồng thuận, N, tương đối nhỏ, khiến nó trở nên tập trung hơn với xác suất thông đồng giữa các nút cao hơn.

Tuy nhiên, người ta giả định rằng ít nhất một trong số N nút đồng thuận là trung thực. Miễn là có ít nhất 1/N Trình xác thực trung thực, có thể phát hiện và phát bằng chứng gian lận khi một khối không hợp lệ, các máy khách nhẹ hoặc Trình xác thực trung thực có thể nhận biết các vấn đề bảo mật trong mạng và có thể sử dụng các cơ chế như cắt các nút độc hại và sự đồng thuận xã hội sẽ giúp khôi phục mạng trở lại bình thường.

Như Vitalik đã đề cập trước đây, nếu một nút đầy đủ trung thực nhận được một khối và thấy nó thiếu một số phần và xuất bản bằng chứng gian lận, thì rất khó để xác định liệu người đề xuất khối có không xuất bản phần đó hay không, nó đã bị các nút khác giữ lại trong quá trình truyền, hoặc nếu đó là cờ giả do nút xuất bản bằng chứng gian lận. Hơn nữa, nếu phần lớn các nút âm mưu, Trình xác thực trung thực 1/N có thể bị cô lập, không thể nhận các khối mới, đây là một kịch bản tấn công giữ lại dữ liệu. Trong những trường hợp như vậy, nút trung thực không thể xác định liệu đó là do điều kiện mạng kém hay do người khác cố tình che giấu âm mưu, cũng như không thể biết liệu các nút khác có bị cô lập hay không, khiến việc đánh giá liệu đa số có âm mưu giữ lại dữ liệu hay không.

Do đó, cần phải có cách để đảm bảo, với xác suất rất cao, Người xác thực trung thực có thể lấy được dữ liệu cần thiết để xác thực các khối; và để xác định ai đứng sau cuộc tấn công che giấu dữ liệu—cho dù đó là người đề xuất khối không xuất bản đủ dữ liệu, dữ liệu đó đã bị các nút khác giữ lại hay đó là một âm mưu của đa số. Rõ ràng, mô hình bảo mật này cung cấp khả năng bảo vệ cao hơn nhiều so với “giả định đa số trung thực” phổ biến trong các chuỗi PoS điển hình và Lấy mẫu tính khả dụng của dữ liệu (DAS) là phương pháp triển khai cụ thể.

Giả sử có nhiều nút nhẹ trong mạng, có thể là 10 lần N, mỗi nút được kết nối với nhiều Trình xác thực (để đơn giản, giả sử mỗi nút nhẹ được kết nối với tất cả N Trình xác thực). Các nút ánh sáng này sẽ tiến hành lấy mẫu nhiều dữ liệu từ Trình xác thực, mỗi lần yêu cầu ngẫu nhiên một phần dữ liệu nhỏ (giả sử đó chỉ là 1% của một khối). Sau đó, họ sẽ truyền bá các mảnh thu được tới Người xác thực thiếu dữ liệu này. Miễn là có đủ nút ánh sáng và tần suất lấy mẫu dữ liệu đủ cao, ngay cả khi một số yêu cầu bị từ chối, miễn là hầu hết đều được phản hồi, thì có thể đảm bảo rằng tất cả Người xác thực cuối cùng có thể thu được lượng dữ liệu cần thiết để xác thực một khối. Điều này có thể phủ nhận tác động của việc giữ lại dữ liệu bởi các nút không phải là người đề xuất khối.

(Nguồn ảnh: W3 Hitchhiker)

Nếu phần lớn Người xác thực âm mưu và từ chối phản hồi hầu hết các yêu cầu từ các nút nhẹ, thì mọi người sẽ dễ dàng nhận ra rằng có vấn đề với chuỗi (vì ngay cả khi một số người có kết nối Internet kém, điều đó sẽ không dẫn đến hầu hết các nút nhẹ). yêu cầu bị từ chối). Do đó, kế hoạch nói trên rất có thể xác định hành vi âm mưu của đa số, mặc dù bản thân những tình huống như vậy rất hiếm. Với cách tiếp cận này, những điều không chắc chắn từ các nguồn khác ngoài người đề xuất khối có thể được giải quyết. Nếu người đề xuất khối giữ lại dữ liệu, chẳng hạn như không xuất bản đủ dữ liệu trong khối để xác thực nó (sau khi giới thiệu mã hóa xóa hai chiều, một khối chứa các đoạn 2k2k và việc khôi phục dữ liệu gốc của khối yêu cầu ít nhất khoảng kk đoạn, hoặc 1/4. Để ngăn người khác khôi phục dữ liệu gốc, người đề xuất cần giữ lại ít nhất k+1*k+1 đoạn), cuối cùng chúng sẽ bị Người xác thực trung thực phát hiện, sau đó họ sẽ phát đi bằng chứng gian lận để cảnh báo người khác.


Theo Vitalik và Mustafa, những gì họ làm về cơ bản là kết hợp những ý tưởng đã được người khác đề xuất và thêm vào đó những đổi mới của riêng họ. Khi xem xét toàn bộ khái niệm và phương pháp triển khai, rõ ràng là “tính khả dụng của dữ liệu” đề cập đến việc liệu dữ liệu cần thiết để xác minh khối mới nhất đã được người đề xuất khối xuất bản hay chưa và liệu người xác minh có thể nhận được dữ liệu đó hay không. Đây là vấn đề liệu dữ liệu có được “xuất bản đầy đủ” hay không chứ không phải là liệu “dữ liệu lịch sử có thể được truy xuất” hay không.

Cách triển khai tính khả dụng của dữ liệu (DA) của Ethereum Rollup

Với khẳng định ở trên, chúng ta hãy xem cách Triển khai tính khả dụng của dữ liệu (DA) trong Ethereum Rollups, điều này trở nên khá rõ ràng: Trình đề xuất khối trong Rollup được gọi là Sequencer, công cụ xuất bản dữ liệu cần thiết để xác minh chuyển đổi trạng thái Lớp 2 trên Ethereum trong khoảng thời gian. Cụ thể, nó bắt đầu giao dịch với một hợp đồng được chỉ định, nhồi dữ liệu liên quan đến DA vào các tham số đầu vào tùy chỉnh, sau đó được ghi lại trong khối Ethereum. Với mức độ phân quyền cao của Ethereum, có thể yên tâm rằng dữ liệu do trình sắp xếp trình tự gửi sẽ được “người xác minh” tiếp nhận một cách suôn sẻ. Tuy nhiên, các thực thể đóng vai trò “người xác minh” khác nhau trên các mạng Tổng hợp khác nhau.

Ví dụ: trong trường hợp của Arbitrum, trình sắp xếp thứ tự đăng các lô giao dịch lên một hợp đồng nhất định trên Ethereum. Bản thân hợp đồng không xác minh dữ liệu này nhưng phát ra một sự kiện để các nút đầy đủ L2 lắng nghe, cho họ biết rằng trình sắp xếp chuỗi đã xuất bản một loạt giao dịch. Cụ thể, ZK Rollups sử dụng hợp đồng Người xác minh trên Ethereum làm “người xác minh”. Bản tổng hợp ZK chỉ cần xuất bản Bằng chứng về sự khác biệt trạng thái + tính hợp lệ, tức là thông tin về các thay đổi trạng thái cộng với bằng chứng về tính hợp lệ. Hợp đồng Người xác minh kiểm tra bằng chứng hợp lệ để xem liệu nó có khớp với State Diff hay không. Nếu quá trình xác thực thành công, Khối/Lô L2 do trình sắp xếp chuỗi xuất bản được coi là hợp lệ.

(Nguồn: Sách trắng đa giác Hermez trước đây)

Optimistic Rollups yêu cầu xuất bản nhiều dữ liệu hơn trên Ethereum vì chúng chỉ dựa vào các nút đầy đủ L2 để tải xuống dữ liệu và xác minh tính hợp lệ của các khối. Điều này có nghĩa là, ở mức tối thiểu, chữ ký số của mỗi giao dịch L2 (hiện nay thường sử dụng chữ ký tổng hợp) phải được tiết lộ. Nếu các lệnh gọi hợp đồng được thực hiện, các tham số đầu vào cũng phải được tiết lộ, ngoài địa chỉ chuyển giao giao dịch, các giá trị nonce để ngăn chặn các cuộc tấn công lặp lại, v.v. Tuy nhiên, so với dữ liệu giao dịch đầy đủ, vẫn còn một số phần bị cắt bớt.

So với ZK Rollups, chi phí DA (Data Availability) của Optimistic Rollups cao hơn vì ZK Rollups chỉ cần tiết lộ những thay đổi trạng thái cuối cùng sau khi một loạt giao dịch được thực hiện, kèm theo bằng chứng hợp lệ, tận dụng tính ngắn gọn của ZK SNARK/STARK ; trong khi Optimistic Rollups chỉ có thể sử dụng phương pháp phức tạp nhất, yêu cầu tất cả các giao dịch phải được thực hiện lại bởi các nút đầy đủ L2 khác.

Trước đây, W3hitchhiker ước tính sơ bộ rằng nếu không xem xét sự phát triển trong tương lai của EIP-4844 và các đốm màu, hiệu ứng mở rộng của ZKR (Zero-Knowledge Rollups) có thể đạt tới nhiều lần so với OPR (Optimistic Rollups). Nếu xem xét các ví thông minh liên quan đến EIP-4337 (sử dụng dấu vân tay, dữ liệu mống mắt thay vì chữ ký khóa riêng), lợi thế của ZKR sẽ càng rõ ràng hơn, vì nó không cần đăng dữ liệu nhị phân của dấu vân tay, mống mắt lên Ethereum, trong khi đó Optimistic Rollups thì có.

Đối với Validium và Plasma/Optimium, họ thực sự sử dụng lớp DA ngoài chuỗi của Ethereum để đạt được DA. Ví dụ: ImmutableX, áp dụng hệ thống chứng minh tính hợp lệ, đã thiết lập một tập hợp các nút DAC (Ủy ban sẵn có dữ liệu) dành riêng để xuất bản dữ liệu liên quan đến DA; Metis xuất bản dữ liệu DA trên Memlabs, còn Rooch và Manta sử dụng Celestia. Hiện tại, do sự tồn tại của DAS (Giải pháp sẵn có dữ liệu) và hệ thống chống gian lận, Celestia là một trong những dự án lớp DA đáng tin cậy nhất ngoài Ethereum.

Tuyên bố từ chối trách nhiệm:

  1. Bài viết này được in lại từ [Geek Web3]. Chuyển tiếp Tiêu đề gốc Những hiểu lầm về tính sẵn có của dữ liệu: DA = Xuất bản dữ liệu ≠ Truy xuất dữ liệu lịch sử, Mọi bản quyền thuộc về tác giả gốc [ Faust, Geek web3]. Nếu có ý kiến phản đối việc tái bản này, vui lòng liên hệ với nhóm Gate Learn , họ sẽ xử lý kịp thời.
  2. Tuyên bố miễn trừ trách nhiệm pháp lý: Các quan điểm và ý kiến trình bày trong bài viết này chỉ là của tác giả và không cấu thành bất kỳ lời khuyên đầu tư nào.
  3. Việc dịch bài viết sang các ngôn ngữ khác được thực hiện bởi nhóm Gate Learn. Trừ khi được đề cập, việc sao chép, phân phối hoặc đạo văn các bài viết đã dịch đều bị cấm.
เริ่มตอนนี้
สมัครและรับรางวัล
$100
ลงทะเบียนทันที