DeSci, các phòng thí nghiệm độc lập và khoa học dữ liệu quy mô lớn
Juan Benet nói về cách phong trào khoa học phi tập trung (desci) có thể tài trợ, tổ chức và mở rộng khoa học bằng các công cụ Web3, bao gồm các cơ chế tài trợ, quyền truy cập mở, các thí nghiệm có thể tái tạo và các quy trình khoa học dữ liệu quy mô lớn.
Date published: 30 tháng 6, 2022
Một bài thuyết trình của Juan Benet, nhà sáng lập Protocol Labs và người phát minh ra IPFS cùng Filecoin, tại EthCC về cách phong trào khoa học phi tập trung (desci) có thể sử dụng các công cụ Web3 để tài trợ cho khoa học, tổ chức các nhà nghiên cứu và xây dựng cơ sở hạ tầng nghiên cứu có thể tái tạo và truy cập mở.
Bản ghi lời thoại này là một bản sao dễ tiếp cận của bản ghi lời thoại video gốc (opens in a new tab) do EthCC xuất bản. Nó đã được chỉnh sửa đôi chút để dễ đọc hơn.
Giới thiệu về khoa học và sự tiến bộ (0:10)
Xin chào mọi người. Tên tôi là Juan. Tôi ở đây để nói về DeSci. Tôi muốn nói về cách chúng ta có thể sử dụng DeSci để tài trợ, tổ chức và mở rộng khoa học. Đầu tiên, đây là những gì chúng ta sẽ thảo luận: Tôi sẽ nói về khoa học nói chung một chút, sau đó tôi sẽ nói về phong trào DeSci là gì, tiếp theo là cách chúng ta có thể tài trợ cho tài sản chung của khoa học. Sau đó là cách DeSci đang tổ chức con người, các dự án và các công việc xoay quanh khoa học. Tiếp đến, tôi muốn nói một chút về quyền truy cập mở và khoa học có thể tái tạo, và tôi muốn kết thúc bằng một lời kêu gọi hành động. Vì vậy, phần này sẽ khá nhanh. Chúng ta có rất nhiều điều cần đề cập, nên tôi sẽ đi nhanh.
Đầu tiên, tôi muốn bắt đầu bằng việc khẳng định rằng đã có một lượng lớn sự tiến bộ trong vài thế kỷ qua. Hầu như mọi chỉ số của con người đều đang được cải thiện. Theo hầu hết mọi thước đo mà chúng ta có thể nghĩ đến, điều kiện sống của con người đã được cải thiện đáng kể, và một phần lớn trong việc đạt được sự tiến bộ này là nhờ vào nỗ lực khoa học. Bằng cách mở rộng những gì chúng ta biết, bằng cách có thể biến những gì chúng ta biết thành các công nghệ và giải pháp cho nhiều vấn đề khác nhau, chúng ta đã có thể đưa một phần lớn thế giới thoát khỏi cảnh nghèo đói. Chúng ta đã có thể cung cấp thức ăn cho vô số người, mang lại nơi trú ẩn cho mọi người, chữa khỏi mọi loại bệnh tật, v.v. Một lượng lớn sự tiến bộ đã đạt được là nhờ vào khoa học.
Khoa học là một nỗ lực khổng lồ với rất nhiều phân ngành khác nhau và nhiều lĩnh vực kiến thức khác nhau. Bạn có thể nghĩ đến bất kỳ lĩnh vực cụ thể nào và bất kỳ lĩnh vực nghiên cứu nào, và khoa học là một phần lớn trong đó. Suy cho cùng, bản chất của khoa học là quá trình tìm ra mọi thứ. Quá trình tạo ra kiến thức mới và kết hợp các khái niệm mới. Hãy nghĩ về phương pháp khoa học. Có một câu nói nổi tiếng của Feynman: "Nếu nó không khớp với thực nghiệm, thì nó sai." Và đó là chìa khóa của khoa học.
Bạn có thể coi khoa học là một nỗ lực quy mô lớn liên quan đến con người trên toàn hành tinh. Có đủ loại nỗ lực và hệ thống. Bạn nghĩ đến mọi thứ từ các trường đại học khác nhau trên hành tinh, các nhóm nghiên cứu khác nhau, các lĩnh vực và tạp chí khác nhau. Có rất nhiều hoạt động khác nhau xoay quanh quá trình tổng hợp những gì chúng ta biết, đưa ra những ý tưởng mới, biến những ý tưởng đó thành các dự án nghiên cứu, biến chúng thành việc kiểm tra các giả thuyết thực tế và thu thập dữ liệu để có thể kiểm tra xem một giả thuyết có đúng hay không. Xuyên suốt cho đến việc viết các kết quả đó thành một loại bài báo nào đó, sau đó được cộng đồng khoa học đánh giá, được thêm vào cây kiến thức và sau đó mở rộng những gì chúng ta biết.
Có thể câu chuyện dừng lại ở đó, hoặc có thể sau này hóa ra là, thực ra, điều đó không thể tái tạo được, và chúng ta phải gỡ bỏ nó. Hoặc thực ra, điều đó là đúng, nhưng nó đã mở ra cánh cửa cho vô số kiến thức mới khác. Vì vậy, đây là một lĩnh vực có tính năng động cao với rất nhiều hoạt động khác nhau.
Hiện nay, khoa học có vô số vấn đề. Có đủ loại vấn đề với nỗ lực khoa học. Mặc dù nó đã là một động cơ to lớn cho sự tiến bộ, nhưng có đủ loại điều đã và đang đi sai hướng với nó. Cụ thể, có sự thiếu hụt tài trợ trên nhiều lĩnh vực. Đồng thời, mặc dù thiếu hụt tài trợ, nhưng nhìn chung vẫn có rất nhiều tiền đổ vào khoa học. Có một cảm giác rằng số tiền đó không mang lại hiệu quả như trước đây, rằng khoa học không còn thu được nhiều giá trị tương xứng với số tiền bỏ ra nữa. Có nhiều lĩnh vực trên diện rộng đang cạnh tranh quá mức trong việc nhận các khoản tài trợ.
Một khi các nghiên cứu được hoàn thành và công bố, chỉ một phần nhỏ trong số đó có thể được tái tạo. Vì vậy, có đủ loại nghiên cứu khoa học đã được xuất bản, được chấp nhận và được cho là đúng, chỉ để sau này phát hiện ra rằng một phần lớn trong số đó thực sự không thể tái tạo được. Do đó, có một cuộc khủng hoảng tái tạo khổng lồ. Và thậm chí có những khám phá khoa học mà các hiện vật của chúng đang bị thất lạc. Hãy nghĩ đến các bài báo, mã nguồn hoặc dữ liệu thực tế liên quan đến một kết quả nào đó đang biến mất khỏi kho tàng kiến thức của chúng ta. Vì vậy, có đủ loại vấn đề xoay quanh khoa học cần được khắc phục, và đây là một phần của những gì DeSci hướng tới. Điều này đang giải quyết một loạt các vấn đề này, không phải toàn bộ, không phải hoàn toàn, nhưng cộng đồng DeSci đang cố gắng giải quyết một số vấn đề trong đó.
Phong trào DeSci (5:11)
Vậy DeSci là gì? Khoa học phi tập trung (desci) là một phong trào nhằm cải thiện khoa học bằng cách sử dụng công nghệ và công cụ Web3. Hãy nghĩ đến việc có thể sử dụng tất cả sự kỳ diệu của liên kết mã băm, blockchain và hợp đồng thông minh để tạo ra các hệ thống và cấu trúc có thể cải thiện cách chúng ta làm khoa học trên các lĩnh vực trên toàn cầu.
Có một số lĩnh vực trọng tâm khác nhau. Hãy nghĩ đến việc có thể có các bài báo truy cập mở và tài sản dữ liệu chung, có các thí nghiệm có thể tái tạo tốt hơn và có thể tổ chức các phòng thí nghiệm và nhóm tốt hơn. Hãy nghĩ đến việc tạo ra các cấu trúc như DAO có thể cho phép các nhóm nghiên cứu hình thành và tổ chức, huy động vốn và phân phối phần thưởng cho những người tham gia. Có những cấu trúc tài trợ hoàn toàn mới, chẳng hạn như IPNFT. Có các giao thức cho việc bình duyệt ngang hàng kèm theo phần thưởng. Trong lịch sử, bình duyệt ngang hàng là một tình trạng bóc lột, nơi các học giả bỏ ra một lượng lớn thời gian và công sức để bình duyệt tất cả các công việc, và các tạp chí thực sự không trả tiền cho bất kỳ ai cho sức lao động đó. Có đủ loại cấu trúc khuyến khích mới đang được thử nghiệm.
Đây là một phong trào khá mới. Nó đã đồng hành cùng chúng ta một thời gian. Khi tôi bắt đầu IPFS, nó giống như một phong trào DeSci trước khi DeSci thực sự tồn tại. Tôi đã bắt đầu IPFS với mục tiêu cho phép mọi người phân phối dữ liệu tốt hơn nhiều cho mục đích làm khoa học. Vì vậy, rất nhiều ý tưởng trong số này là một phần cốt lõi của dự án. Tuy nhiên, phong trào này đã thu hút được rất nhiều sự chú ý trong một hoặc hai năm qua, và rất nhiều tổ chức mới đã xuất hiện. Bản đồ này đã tăng gấp đôi hoặc gấp ba kích thước trong năm qua, điều này thực sự tuyệt vời để chứng kiến.
Hiện có một số nhóm đang thực hiện tài trợ công nghệ sinh học phi tập trung, các nhóm như VitaDAO, Molecule và những nhóm khác. Có nhiều tổ chức đang cố gắng đưa ra các cấu trúc mới để tài trợ cho khoa học. Có một số DAO bản thân chúng là các tổ chức khoa học đang cố gắng thực hiện R&D. Có một số quỹ và tổ chức đang hỗ trợ rất nhiều cho công việc của DeSci, hoặc liên kết với DeSci theo cách này hay cách khác. Có nhiều nhóm đang khám phá các cách xuất bản khác nhau, nhiều NFT khoa học, v.v. Cộng đồng này đã phát triển rất nhiều trong một hoặc hai năm qua.
Hiện cũng có rất nhiều buổi gặp gỡ và hội nghị khác nhau đang tập hợp các cộng đồng này. Những sự kiện như DeSci Day, DeSci Berlin, Schelling Point từ cộng đồng Gitcoin và Funding the Commons. Những hội nghị này đang tập hợp rất nhiều cuộc thảo luận xoay quanh DeSci.
Tài trợ cho tài sản chung (10:40)
Hãy nói về việc tài trợ cho tài sản chung. Có thể một số bạn đã thấy biểu đồ này mà tôi từng sử dụng trong quá khứ về hố sâu đổi mới (innovation chasm). Trong quá trình chuyển đổi từ khoa học sang công nghệ, phần DeSci chủ yếu tập trung vào phần bên trái—chỉ phần khoa học—cố gắng nghĩ ra các cấu trúc khuyến khích tốt hơn và các cách tốt hơn để điều phối các nhóm nhằm tạo ra kết quả khoa học tốt hơn. Đáng chú ý là tổng tài trợ R&D toàn cầu, từ một góc độ nào đó, là khá lớn, nhưng từ một góc độ khác, lại không lớn đến thế và không thay đổi nhiều trong vài thập kỷ qua, mặc dù thông lượng và kết quả của công nghệ mà chúng ta đang xây dựng đã phát triển vô cùng mạnh mẽ.
Những quy mô tài trợ này không nằm ngoài tầm với của các blockchain. Hãy nghĩ đến R&D phi quốc phòng của Hoa Kỳ, ở mức khoảng 70 tỷ đô la một năm. Chắc chắn đó là một con số lớn, nhưng nó không phải là khổng lồ. Nếu tách riêng NSF, khoảng 10 tỷ đô la một năm, điều đó hoàn toàn có thể đạt được thông qua các blockchain. Hãy nghĩ đến không gian tiền mã hóa có quy mô từ 1 đến 3 nghìn tỷ đô la tùy thuộc vào thời điểm bạn xem xét.
Hãy tưởng tượng nếu các blockchain dành một phần nguồn cung của chúng cho R&D hàng năm. Hãy tưởng tượng lấy một phần trăm của Filecoin, Ethereum hoặc Bitcoin và đổ vào R&D mỗi năm. Bạn bắt đầu chạm đến những con số nằm trong phạm vi tài trợ cho khoa học ở cấp độ quốc gia. Nếu tiền mã hóa tăng trưởng thêm một hoặc hai bậc độ lớn nữa, tiền mã hóa sẽ có thể tài trợ cho R&D và khoa học ở quy mô của các quốc gia, điều này khá điên rồ khi nghĩ đến. Vì vậy, sẽ rất tuyệt nếu tìm ra các cấu trúc và tìm ra các lộ trình tài trợ tốt trước khi chúng ta đạt đến mức đó.
Khi bạn bắt đầu phân tích nguồn tài trợ từ các cơ quan đó, bạn sẽ gặp phải đủ loại vấn đề. Một số lĩnh vực nhận được quá ít sự chú ý, hoặc bản thân các chương trình có những động cơ sai lệch hoặc cạnh tranh quá mức, dẫn đến tình trạng các nhà khoa học đang dành một lượng lớn thời gian của họ chỉ để viết các đề xuất xin tài trợ. Đã có một nỗ lực mang tên Fast Grants xoay quanh COVID, và hiệu ứng tương tự đã được nhân rộng trong Impetus Grants, nơi các chương trình này cấu trúc một chương trình tài trợ rất nhanh chóng. Họ đã có thể trao các khoản tài trợ ở mức 20k đến 200k với một phần rất nhỏ thời gian mà các nhà khoa học phải bỏ ra.
Trong một cuộc khảo sát từ các nhà khoa học nộp đơn xin các khoản tài trợ đó, họ đã chỉ ra lượng thời gian họ thường dành để xin tài trợ. Hãy nghĩ đến việc 25 đến 50 phần trăm thời gian của một nhà khoa học chỉ dành cho việc trình bày chi tiết những gì họ đang làm và nộp đơn xin các khoản tài trợ khác nhau. Điều này khá là điên rồ. Lý tưởng nhất là bạn muốn các nhà khoa học dành phần lớn thời gian của họ để suy nghĩ về công việc của mình, đưa ra những ý tưởng mới và phân tích công việc. Cũng có một hiệu ứng là các chương trình tài trợ hạn chế những gì mọi người cuối cùng sẽ khám phá. Nhiều nhà khoa học có những nghiên cứu tham vọng hơn nhiều mà họ muốn theo đuổi, nhưng cuối cùng họ lại mắc kẹt trong việc theo đuổi những công việc khác không có tác động lớn bằng vì họ phải tuân theo các ràng buộc của chương trình tài trợ.
Hàng hóa công cộng Web3 sẽ là giải pháp! Có rất nhiều nhóm khác nhau. Tất nhiên, điều này vẫn còn rất nhỏ bé; phong trào Web3 rất nhỏ so với tài trợ R&D khoa học toàn cầu, nhưng nếu chúng ta có thể thiết lập các cấu trúc đúng đắn, điều chỉnh các ưu đãi tốt và chứng minh rằng nó hoạt động hiệu quả, thì chúng ta có thể mở rộng quy mô của nó lên nhiều lần cùng với tiền mã hóa. Chúng ta nên khám phá nhiều loại hình tài trợ khác nhau cho các quy trình khoa học: các chương trình tài trợ khác nhau, chứng chỉ tác động, thị trường tác động, v.v. Cộng đồng Funding the Commons đã và đang thử nghiệm một loạt các cơ chế khác nhau.
Ví dụ, các nhóm như VitaDAO đang tạo ra một cấu trúc dữ liệu trao các khoản tài trợ cho các nhóm để đổi lấy dữ liệu, kiến thức và IP (sở hữu trí tuệ). Sau đó, họ đóng gói IP đó thành các IPNFT mang tính pháp lý, cấp quyền IP cho các công ty công nghệ sinh học và tài trợ cho các công ty công nghệ sinh học đó với mục đích thu hồi vốn đầu tư thông qua sự thành công của họ. Tôi thường gọi đây là một quỹ phát triển nền tảng, thực hiện các công việc quan trọng thông qua các phòng thí nghiệm bản thân không phải là công ty, tạo ra IP để sau đó tài trợ cho các công ty. Các nhóm như Molecule đang tạo ra các thị trường để công việc đó diễn ra.
Chứng chỉ tác động là một cấu trúc hấp dẫn khác đại diện cho tài trợ hồi tố. Chúng cho phép những người tham gia, một khi họ đạt được một số tác động, có thể đúc một chứng chỉ xoay quanh tác động đó và bán nó trên thị trường cho bất kỳ ai muốn yêu cầu nhận tác động đó. Điều đó cho phép một thị trường đầu cơ xuất hiện, khép kín một vòng lặp xuyên thời gian để tài trợ hồi tố cho những công việc cực kỳ quan trọng. Điều này rất quan trọng vì nhiều khi bạn chỉ nhận ra giá trị của một thứ gì đó rất lâu sau khi công việc đã được hoàn thành.
Tổ chức con người và Data DAO (15:28)
Bây giờ là một vài suy nghĩ nhanh về việc tổ chức con người. Trong quá khứ, GitHub đã cực kỳ thành công trong việc giúp tổ chức khám phá khoa học. Toàn bộ sách giáo khoa và các lĩnh vực đã phát triển thông qua GitHub. Nhiều nhóm đã sử dụng các nguyên thủy cơ bản của GitHub xoay quanh các vấn đề (issues), cộng tác mã nguồn và kiểm soát phiên bản để tổ chức các cộng đồng thực hành và khoa học. Nhưng điều chưa hoàn thiện ở đó là bạn không có cách nào để tạo ra các tổ chức thực hiện nghiên cứu, xử lý vốn hoặc trả tiền cho những người đóng góp.
Có những thử nghiệm thú vị như LabDAO, tạo ra các đội ngũ phòng thí nghiệm nơi các nhóm có thể hình thành, huy động vốn và phân phối nó. Bạn có thể mã hóa các mức độ đóng góp khác nhau của những người tham gia để trao phần thưởng cho họ một cách công bằng. Có những dự án tham vọng hơn xoay quanh việc phân bổ tín nhiệm giữa những người tham gia trong một mạng lưới lớn hơn, lan truyền phần thưởng qua các nhóm liên kết khác nhau.
Có những nhóm đang thử nghiệm các giao thức bình duyệt ngang hàng, quan sát tính kinh tế và động lực học của hệ thống bình duyệt ngang hàng để vừa khuyến khích công việc vừa trao phần thưởng xứng đáng cho việc nó đang diễn ra. Một giao thức có tên là Ants Review đã và đang làm điều này, mà bạn có thể sử dụng với MetaMask. Gitcoin Grants đã tiên phong trong rất nhiều công việc có thể được sử dụng ở đây và hiện đang hỗ trợ các công cụ cho những người tham gia muốn tổ chức theo những cách này.
Một trong những thành phần thực sự quan trọng ở đây là liên kết nội dung bằng mã băm. Bạn có thể đóng băng một gói thông tin, nhận một liên kết mã băm được định địa chỉ theo nội dung và tham chiếu mọi thứ. Đây là nguyên thủy cốt lõi mà bạn muốn có trong tài liệu. Khi bạn có một trích dẫn từ bài báo này sang bài báo khác, hoặc từ một bài báo đến dữ liệu hoặc mã nguồn của nó, CID chính xác là thứ bạn muốn. Hãy tưởng tượng việc có thể đóng băng toàn bộ tài liệu bằng kiểm soát phiên bản và đóng băng tất cả các tập dữ liệu và mã nguồn quan trọng cần thiết để chạy lại các thí nghiệm đó. Nhiều nhóm đang khám phá điều này, đề xuất các cách khác nhau để thực hiện bình duyệt ngang hàng và phát triển khoa học thông qua IPFS.
Bạn có thể nghĩ đến việc đóng gói loại hoạt động và việc tạo dữ liệu đó với một thứ gọi là Data DAO. Không giống như các DAO mà tôi đã đề cập trước đây vốn đã bắt đầu hoạt động, Data DAO còn rất mới. Hãy nghĩ đến một nhóm có khả năng thu thập, quản lý, chuyển đổi và tính toán trên dữ liệu, đồng thời quản trị cách dữ liệu đó được sử dụng theo thời gian, cách nó được kiếm tiền và cách nó được chia sẻ.
Một vài lưu ý cuối cùng về quyền truy cập mở và khoa học có thể tái tạo. IPFS đã được sử dụng rất nhiều cho nhiều loại công việc khoa học mở. Nó đã và đang hiện thực hóa giấc mơ mở rộng quyền truy cập vào rất nhiều kiến thức khoa học, hỗ trợ các bản sao Wikipedia phân tán, các kho lưu trữ bài báo và tập dữ liệu khổng lồ.
Quyền truy cập mở, khoa học có thể tái tạo và lời kêu gọi hành động (20:40)
Chúng ta vẫn chưa hoàn toàn đạt được khả năng tái tạo đầy đủ. Đây là một lĩnh vực cần nhiều nỗ lực hơn, nhưng rất nhiều người đã suy nghĩ về nó. Có những thông số kỹ thuật và ý tưởng thực sự tốt xoay quanh việc sử dụng khả năng tái tạo tiêu chuẩn với IPFS để đóng băng tất cả các tài sản và xây dựng một quy trình có thể tái tạo hoàn toàn. Bạn có thể gọi lại các thí nghiệm cụ thể từ quá khứ, mang lại các máy ảo (VM) hoặc container đã bị đóng băng hoàn toàn, chạy lại tất cả các quy trình dữ liệu và xác minh các thí nghiệm là chính xác.
Cũng có một góc độ hoàn toàn khác xoay quanh việc thực hiện chính khoa học dữ liệu theo định hướng DeSci, nơi các sổ tay (notebook), phân tích dữ liệu và hiện vật đang sử dụng các ứng dụng được hỗ trợ bởi Web3. Những thứ như Jupyter notebook, IPython notebook và Wolfram notebook đã kết hợp với CID. Tôi nghĩ điều đó sẽ được tăng cường mạnh mẽ trong tương lai khi mạng lưới Filecoin phát triển vượt bậc. Mạng lưới Filecoin có rất nhiều dung lượng lưu trữ kết hợp với khả năng tính toán—các nhà cung cấp dịch vụ lưu trữ có vô số GPU ngay cạnh dữ liệu. Chúng sẽ được kết nối trong năm tới với khả năng phát hành các quy trình tính toán xoay quanh dữ liệu đó. Hãy nghĩ đến việc tạo ra một nền tảng cho các nhà khoa học thực hiện khoa học dữ liệu ở quy mô khổng lồ, tận dụng các nền tảng điện toán Web3 cho cả việc định địa chỉ và lưu trữ thông tin, cũng như tính toán, tạo ra một quy trình khoa học dữ liệu đầu cuối hoàn chỉnh.
Cuối cùng, một lời kêu gọi hành động nhanh chóng. Khoa học là động cơ của sự tiến bộ. Bằng cách mở rộng những gì chúng ta biết, chúng ta có thể tạo ra nhiều công nghệ hơn và cải thiện cuộc sống của mình. Nếu chúng ta có thể cải thiện cuộc sống của các nhà khoa học, làm cho công việc của họ dễ dàng hơn, đẩy nhanh sự phát triển của họ, cắt giảm chi phí của họ và cho phép họ dành nhiều thời gian hơn để tìm ra các vấn đề thay vì viết các đề xuất xin tài trợ, thì tất cả chúng ta đều có thể thúc đẩy xã hội tiến lên nhanh hơn rất nhiều.
Phong trào DeSci cần bạn. Hãy nghĩ đến việc thử nghiệm các cơ chế tài trợ mới, xây dựng các công cụ truy cập mở và khoa học mở, hoặc thử nghiệm với các tập dữ liệu công khai. Hãy nghĩ đến việc tham gia một nhóm DeSci hoặc một DAO. Hãy khám phá những cộng đồng này, và tôi hy vọng sẽ gặp bạn trong phong trào này. Cảm ơn các bạn rất nhiều, và hẹn gặp lại.
(Vỗ tay)