본문으로 건너뛰기

DeSci, 독립 연구소 및 대규모 데이터 과학

후안 베넷(Juan Benet)이 자금 조달 메커니즘, 오픈 액세스, 재현 가능한 실험 및 대규모 데이터 과학 파이프라인을 다루며, 탈중앙화 과학(DeSci) 운동이 Web3 도구를 사용하여 어떻게 과학에 자금을 지원하고, 조직하며, 개방할 수 있는지에 대해 이야기합니다.

Date published: 2022년 6월 30일

프로토콜 랩스(Protocol Labs)의 창립자이자 IPFS 및 파일코인(Filecoin)의 발명가인 후안 베넷(Juan Benet)이 이더씨씨(EthCC)에서 탈중앙화 과학(DeSci) 운동이 Web3 도구를 사용하여 어떻게 과학에 자금을 지원하고, 연구자를 조직하며, 오픈 액세스 및 재현 가능한 연구 인프라를 구축할 수 있는지에 대해 발표한 내용입니다.

이 스크립트는 이더씨씨에서 게시한 원본 비디오 스크립트 (opens in a new tab)의 접근성 향상 버전입니다. 가독성을 위해 약간의 편집을 거쳤습니다.

과학과 진보 소개 (0:10)

네, 여러분 안녕하세요. 제 이름은 후안입니다. 저는 탈중앙화 과학(DeSci)에 대해 이야기하고자 이 자리에 섰습니다. 우리가 DeSci를 사용하여 어떻게 과학에 자금을 지원하고, 조직하며, 개방할 수 있는지에 대해 말씀드리고 싶습니다. 먼저, 오늘 다룰 내용은 다음과 같습니다. 잠시 전반적인 과학에 대해 이야기한 다음, DeSci 운동이 무엇인지, 그리고 과학 공공재에 어떻게 자금을 지원할 수 있는지에 대해 이야기하겠습니다. 그런 다음 DeSci가 과학을 둘러싼 사람, 프로젝트, 작업을 어떻게 조직하고 있는지 살펴보겠습니다. 이어서 오픈 액세스와 재현 가능한 과학에 대해 조금 말씀드리고, 행동 촉구로 마무리하고자 합니다. 다룰 내용이 많기 때문에 꽤 빠르게 진행하겠습니다.

먼저, 지난 몇 세기 동안 엄청난 진보가 있었다는 점을 말씀드리며 시작하고 싶습니다. 거의 모든 인류의 지표가 개선되고 있습니다. 우리가 생각할 수 있는 거의 모든 척도에서 인류의 조건은 극적으로 개선되어 왔으며, 이러한 진보를 달성하는 데 있어 과학적 활동이 큰 역할을 했습니다. 우리가 아는 것을 확장하고, 그 지식을 다양한 문제에 대한 기술과 솔루션으로 변환할 수 있게 됨으로써, 우리는 전 세계의 수많은 사람들을 빈곤에서 구제할 수 있었습니다. 수많은 사람들을 먹여 살리고, 모두에게 안식처를 제공하며, 온갖 질병을 치료하는 등 많은 일을 해냈습니다. 과학 덕분에 엄청난 진보를 이룩할 수 있었습니다.

과학은 수많은 하위 분야와 다양한 지식 영역을 가진 거대한 활동입니다. 어떤 특정 분야나 연구 영역을 떠올려 보더라도 과학은 그중 큰 부분을 차지합니다. 결국 과학이란 무언가를 알아내는 과정입니다. 새로운 지식을 창출하고 새로운 개념을 결합하는 과정이죠. 과학적 방법론을 생각해 보십시오. 파인만(Feynman)의 유명한 명언이 있습니다. "실험과 일치하지 않는다면, 그것은 틀린 것이다." 그리고 그것이 바로 과학의 핵심입니다.

과학은 전 세계의 인류가 참여하는 대규모 활동이라고 생각할 수 있습니다. 온갖 종류의 노력과 시스템이 존재합니다. 지구상의 다양한 대학, 여러 연구 그룹, 다양한 분야, 그리고 저널에 이르기까지 모든 것을 떠올려 보십시오. 우리가 아는 것을 종합하고, 새로운 아이디어를 도출하며, 그 아이디어를 연구 프로젝트로 변환하고, 이를 실제 가설 검증으로 연결하며, 가설이 맞는지 테스트하기 위해 데이터를 수집하는 과정 전반에 걸쳐 수많은 활동이 일어납니다. 이러한 결과를 논문으로 작성하여 과학 커뮤니티의 동료 평가를 받고, 지식의 나무에 추가되어 우리가 아는 것을 확장하는 모든 과정이 포함됩니다.

어쩌면 이야기는 거기서 끝날 수도 있고, 나중에 알고 보니 사실 재현이 불가능해서 그 결과를 철회해야 할 수도 있습니다. 아니면 그 결과가 맞았고, 수많은 다른 새로운 지식의 문을 열어줄 수도 있습니다. 이처럼 과학은 매우 역동적이며 다양한 활동이 일어나는 분야입니다.

하지만 현재 과학에는 수많은 문제가 있습니다. 과학적 활동에는 온갖 종류의 이슈가 존재합니다. 과학이 진보를 위한 엄청난 원동력이었음에도 불구하고, 여러 가지 잘못된 방향으로 흘러가는 부분들이 있습니다. 특히 다양한 분야에 걸쳐 자금 조달이 부족합니다. 동시에 자금이 부족함에도 불구하고 전반적으로 과학에 투입되는 돈은 많습니다. 예전만큼 돈이 제 역할을 하지 못하고 있으며, 과학이 더 이상 투자 대비 효율을 내지 못하고 있다는 느낌이 듭니다. 전반적으로 연구비를 받기 위해 지나치게 경쟁해야 하는 분야가 많습니다.

연구가 완료되고 결과가 도출되더라도, 그중 일부만이 재현됩니다. 출판되고 인정받아 옳다고 여겨졌던 수많은 과학적 결과들이 나중에 알고 보면 상당 부분 실제로 재현될 수 없다는 사실이 밝혀지곤 합니다. 즉, 거대한 재현성 위기가 존재합니다. 심지어 과학적 발견의 산출물이 유실되는 경우도 있습니다. 어떤 결과와 관련된 실제 논문, 코드 또는 데이터가 우리의 지식 저장소에서 사라지는 것을 생각해 보십시오. 이처럼 과학을 둘러싸고 해결해야 할 온갖 문제들이 있으며, 이것이 바로 DeSci가 다루고자 하는 부분입니다. 모든 것을 완벽하게 해결할 수는 없겠지만, DeSci 커뮤니티는 이러한 여러 문제들을 해결하기 위해 노력하고 있습니다.

DeSci 운동 (5:11)

그렇다면 탈중앙화 과학(DeSci)이란 무엇일까요? DeSci는 Web3 기술과 도구를 사용하여 과학을 개선하려는 운동입니다. 해시 링크, 블록체인, 스마트 컨트랙트의 모든 마법을 사용하여 전 세계 다양한 분야에서 우리가 과학을 수행하는 방식을 개선할 수 있는 시스템과 구조를 만든다고 생각해 보십시오.

여러 가지 다양한 집중 분야가 있습니다. 오픈 액세스 논문과 데이터 공공재를 확보하고, 더 나은 재현 가능한 실험을 수행하며, 연구소와 그룹을 더 잘 조직할 수 있다고 생각해 보십시오. 연구 그룹이 형성 및 조직되고, 자본을 조달하며, 참여자에게 보상을 분배할 수 있도록 하는 DAO와 같은 구조를 만드는 것을 떠올려 보십시오. IPNFT와 같은 완전히 새로운 자금 조달 구조도 있습니다. 보상이 따르는 동료 평가 프로토콜도 존재합니다. 역사적으로 동료 평가는 학자들이 모든 연구를 검토하는 데 엄청난 시간과 노력을 들이지만, 저널은 그 노동에 대해 누구에게도 비용을 지불하지 않는 착취적인 상황이었습니다. 현재 온갖 종류의 새로운 인센티브 구조가 실험되고 있습니다.

이것은 꽤 새로운 운동입니다. 물론 우리 곁에 존재한 지는 꽤 되었습니다. 제가 IPFS를 시작했을 때, 그것은 DeSci라는 개념이 생기기 전의 일종의 DeSci 운동이었습니다. 저는 사람들이 과학을 수행할 목적으로 데이터를 훨씬 더 잘 배포할 수 있도록 하겠다는 목표로 IPFS를 시작했습니다. 따라서 이러한 아이디어의 상당수는 프로젝트의 핵심을 이룹니다. 하지만 이 운동은 지난 1~2년 동안 큰 탄력을 받았고, 많은 새로운 조직들이 등장하고 있습니다. 이 생태계 지도는 작년에 비해 두세 배로 커졌으며, 이는 정말 보기 좋은 현상입니다.

현재 VitaDAO, Molecule 등과 같이 탈중앙화된 생명공학 자금 조달을 수행하는 여러 그룹이 있습니다. 과학에 자금을 지원하기 위한 새로운 구조를 고안하려는 많은 조직들이 있습니다. R&D를 수행하려는 과학 조직 그 자체인 DAO도 여럿 있습니다. 많은 DeSci 작업을 지원하거나 어떤 식으로든 DeSci와 연관된 여러 재단과 기관도 있습니다. 다양한 출판 방식을 탐구하는 많은 그룹, 수많은 과학 NFT 등이 존재합니다. 이 커뮤니티는 지난 1~2년 동안 크게 성장했습니다.

또한 이제 이러한 커뮤니티를 모으는 다양하고 많은 밋업과 컨퍼런스가 열리고 있습니다. DeSci Day, DeSci 베를린, 깃코인 커뮤니티의 Schelling Point, 그리고 Funding the Commons와 같은 행사들이 있습니다. 이러한 컨퍼런스들은 DeSci를 둘러싼 많은 대화의 장을 마련하고 있습니다.

공공재 자금 조달 (10:40)

공공재 자금 조달에 대해 이야기해 보겠습니다. 아마 여러분 중 일부는 제가 과거에 혁신의 캐즘과 관련하여 사용했던 이 다이어그램을 보셨을 것입니다. 과학에서 기술로의 전환 과정에서 DeSci 부분은 주로 왼쪽 부분, 즉 순수 과학 부분에 초점을 맞추고 있으며, 더 나은 과학적 결과물을 생산하기 위해 더 나은 인센티브 구조와 그룹을 조정하는 더 나은 방법을 고민합니다. 전 세계 총 R&D 자금 규모는 한편으로는 엄청나게 크지만, 다른 한편으로는 그렇게 크지 않으며, 우리가 구축하고 있는 기술의 처리량과 결과물이 엄청나게 성장했음에도 불구하고 지난 수십 년 동안 크게 변하지 않았다는 점은 주목할 만합니다.

이러한 자금 규모는 블록체인의 도달 범위를 벗어나지 않습니다. 연간 약 700억 달러 규모인 미국의 비국방 R&D를 생각해 보십시오. 확실히 많은 금액이지만, 엄청나게 거대한 규모는 아닙니다. 연간 약 100억 달러 규모인 NSF(미국 국립과학재단)만 떼어놓고 보면, 이는 블록체인을 통해 충분히 달성할 수 있는 수준입니다. 시기에 따라 다르지만 암호화폐 시장의 규모가 1조에서 3조 달러에 달한다는 점을 생각해 보십시오.

블록체인이 매년 공급량의 일부를 R&D에 할당한다고 상상해 보십시오. 파일코인, 이더리움 또는 비트코인의 1%를 가져와 매년 R&D에 쏟아붓는다고 상상해 보십시오. 국가 수준의 과학 자금 조달 범위에 해당하는 수치에 도달하기 시작합니다. 암호화폐가 한두 자릿수 더 성장한다면, 암호화폐는 국가 규모로 R&D와 과학에 자금을 지원할 수 있게 될 것이며, 이는 생각만 해도 꽤 놀라운 일입니다. 따라서 우리가 그 단계에 도달하기 전에 미리 구조를 파악하고 좋은 자금 조달 경로를 찾아내는 것이 매우 중요할 것입니다.

이러한 기관들의 자금 조달 내역을 분석하기 시작하면 온갖 종류의 문제에 직면하게 됩니다. 특정 분야는 너무 적은 관심을 받거나, 프로그램 자체에 왜곡된 인센티브가 있거나 경쟁이 너무 치열하여, 과학자들이 연구비 지원서를 작성하는 데만 엄청난 시간을 쏟는 상황이 발생합니다. 코로나19 당시 Fast Grants라는 이니셔티브가 있었고, Impetus Grants에서도 동일한 효과가 재현되었는데, 이 프로그램들은 매우 신속한 연구비 지원 프로그램을 구축했습니다. 그들은 과학자들이 투입하는 시간의 아주 작은 부분만으로도 2만 달러에서 20만 달러 규모의 연구비를 지급할 수 있었습니다.

해당 연구비에 지원한 과학자들을 대상으로 한 설문조사에서, 그들은 평소 연구비 지원에 얼마나 많은 시간을 할애하는지 밝혔습니다. 과학자 시간의 25~50%가 자신이 하고 있는 일을 설명하고 다양한 연구비에 지원하는 데 쓰인다고 생각해 보십시오. 이건 좀 미친 짓입니다. 이상적으로는 과학자들이 대부분의 시간을 자신의 연구에 대해 생각하고, 새로운 아이디어를 도출하며, 연구를 분석하는 데 사용하기를 바랄 것입니다. 또한 연구비 프로그램이 사람들이 결국 탐구하게 될 내용을 제한하는 효과도 있습니다. 많은 과학자들이 훨씬 더 야심 찬 연구를 추구하고 싶어 하지만, 연구비 프로그램의 제약에 맞추다 보니 그만큼 영향력이 없는 다른 연구를 억지로 수행하게 됩니다.

Web3 공공재가 구원투수로 나섰습니다! 아주 다양한 그룹들이 있습니다. 물론 아직은 미미한 수준입니다. Web3 운동은 전 세계 과학 R&D 자금 규모에 비하면 매우 작지만, 구조를 제대로 잡고 인센티브를 잘 조정하여 이것이 효과가 있다는 것을 증명할 수 있다면, 암호화폐와 함께 기하급수적으로 확장할 수 있습니다. 우리는 과학적 프로세스를 위한 다양한 종류의 자금 조달 방식을 탐구해야 합니다. 다양한 연구비 프로그램, 임팩트 인증서, 임팩트 시장 등을 말이죠. Funding the Commons 커뮤니티는 여러 가지 다양한 메커니즘을 시도해 오고 있습니다.

예를 들어, VitaDAO와 같은 그룹은 데이터, 지식 및 IP(지식재산권)를 대가로 그룹에 연구비를 지급하는 데이터 구조를 만들고 있습니다. 그런 다음 해당 IP를 법적 효력을 지닌 IPNFT로 묶어 생명공학 기업에 IP 권리를 부여하고, 그들의 성공을 통해 투자금을 회수할 목적으로 해당 기업에 자금을 지원합니다. 저는 이를 근본적인 개발 펀드라고 부르곤 하는데, 기업이 아닌 연구소를 통해 중요한 작업을 수행하고 IP를 생성하여 기업에 자금을 지원하는 방식입니다. Molecule과 같은 그룹은 이러한 작업이 이루어질 수 있는 마켓플레이스를 만들고 있습니다.

임팩트 인증서는 소급적 자금 조달을 나타내는 또 다른 매력적인 구조입니다. 참여자가 어떤 임팩트를 달성하면, 그 임팩트에 대한 인증서를 발행하여 그 임팩트를 청구하고자 하는 누구에게나 시장에서 판매할 수 있게 해줍니다. 이를 통해 투기적 시장이 형성될 수 있으며, 시간을 초월한 선순환 고리를 만들어 매우 중요한 작업에 소급하여 자금을 지원할 수 있습니다. 작업이 완료된 지 한참 후에야 그것이 얼마나 가치 있는지 깨닫는 경우가 많기 때문에 이는 매우 중요합니다.

사람 조직화 및 데이터 DAO (15:28)

이제 사람들을 조직하는 것에 대해 간단히 생각해 보겠습니다. 과거에 깃허브(GitHub)는 과학적 디스커버리를 조직하는 데 엄청난 성공을 거두었습니다. 전체 교과서와 분야가 GitHub를 통해 발전했습니다. 많은 그룹이 이슈, 코드 협업, 버전 관리와 같은 GitHub의 기본 요소들을 사용하여 실무 및 과학 커뮤니티를 조직해 왔습니다. 하지만 거기서 불완전한 점은 연구를 수행하고, 자본을 다루거나, 기여자에게 보상을 지급하는 조직을 만들 방법이 없다는 것입니다.

그룹을 형성하고, 자금을 조달하며, 이를 분배할 수 있는 연구소 팀을 만드는 LabDAO와 같은 흥미로운 실험들이 있습니다. 참여자들의 다양한 기여 수준을 인코딩하여 그들에게 공정하게 보상할 수 있습니다. 더 큰 네트워크의 참여자들 전반에 걸쳐 크레딧을 할당하고, 서로 연결된 다양한 팀에 보상을 전파하는 더 야심 찬 프로젝트들도 있습니다.

동료 평가 프로토콜을 실험하는 그룹들도 있는데, 이들은 동료 평가 시스템의 경제학과 역학을 관찰하여 작업에 인센티브를 제공하고 그 과정이 일어나는 것에 대해 적절히 보상합니다. Ants Review라는 프로토콜이 이미 이 작업을 수행하고 있으며, 메타마스크와 함께 사용할 수 있습니다. Gitcoin Grants는 여기서 사용할 수 있는 수많은 작업을 개척해 왔으며, 이러한 방식으로 조직하고자 하는 참여자들을 위한 도구를 이미 지원하고 있습니다.

여기서 정말 핵심적인 요소 중 하나는 해시로 콘텐츠를 연결하는 것입니다. 정보 묶음을 동결하고, 콘텐츠 주소 기반의 해시 링크를 얻어, 항목들을 참조할 수 있습니다. 이것이 바로 문헌에서 원하는 핵심 기본 요소입니다. 한 논문에서 다른 논문으로, 또는 논문에서 해당 데이터나 코드로 인용할 때, CID(콘텐츠 식별자)가 바로 여러분이 원하는 것입니다. 버전 관리를 통해 전체 문헌을 동결하고, 해당 실험을 다시 실행하는 데 필요한 모든 중요한 데이터 세트와 코드를 동결할 수 있다고 상상해 보십시오. 많은 그룹이 이를 탐구하고 있으며, IPFS를 통해 동료 평가 및 과학 발전을 수행하는 다양한 방법을 제안하고 있습니다.

이러한 종류의 활동과 데이터 생성을 데이터 DAO라는 것과 묶는다고 생각할 수 있습니다. 제가 앞서 언급했던 이미 시작된 DAO들과 달리, 데이터 DAO는 매우 새롭습니다. 데이터를 수집, 큐레이션, 변환 및 연산할 수 있고, 시간이 지남에 따라 해당 데이터가 어떻게 사용되고, 어떻게 수익화되며, 어떻게 공유되는지 관리할 수 있는 그룹을 생각해 보십시오.

오픈 액세스와 재현 가능한 과학에 대한 마지막 참고 사항입니다. IPFS는 이미 많은 종류의 오픈 사이언스 작업에 엄청나게 사용되고 있습니다. 분산된 위키백과 사본, 방대한 논문 아카이브 및 데이터 세트를 지원하며, 많은 과학에 대한 접근성을 개방한다는 꿈을 이미 실현하고 있습니다.

오픈 액세스, 재현 가능한 과학, 그리고 행동 촉구 (20:40)

아직 완전한 재현성에 도달하지는 못했습니다. 이 부분은 더 많은 작업이 필요한 영역이지만, 이미 많은 사람들이 고민을 해왔습니다. IPFS와 함께 표준 재현성을 사용하여 모든 자산을 동결하고 완전히 재현 가능한 파이프라인을 구축하는 것에 대한 정말 훌륭한 사양과 아이디어들이 있습니다. 과거의 특정 실험을 다시 불러오고, 완전히 동결된 VM이나 컨테이너를 가져와 모든 데이터 파이프라인을 다시 실행하며, 실험이 올바른지 검증할 수 있습니다.

노트북, 데이터 분석 및 산출물이 Web3 기반 애플리케이션을 사용하는 DeSci 지향적인 방식으로 데이터 과학 자체를 수행하는 완전히 다른 관점도 있습니다. 주피터(Jupyter) 노트북, IPython 노트북, 울프럼(Wolfram) 노트북과 같은 것들은 이미 CID와 결합되어 있습니다. 저는 파일코인 네트워크가 엄청나게 성장함에 따라 미래에 이것이 더욱 강력해질 것이라고 생각합니다. 파일코인 네트워크는 연산과 결합된 많은 스토리지를 보유하고 있습니다. 스토리지 제공자들은 데이터 바로 옆에 수많은 GPU를 가지고 있습니다. 내년에는 해당 데이터를 중심으로 연산 파이프라인을 발행할 수 있는 기능과 함께 이들이 연결될 것입니다. 정보의 주소 지정 및 저장뿐만 아니라 연산에도 Web3 컴퓨팅 플랫폼을 활용하여 데이터 과학의 완전한 엔드투엔드 파이프라인을 생성함으로써, 과학자들이 대규모로 데이터 과학을 수행할 수 있는 플랫폼을 구축한다고 생각해 보십시오.

마지막으로, 간단한 행동 촉구입니다. 과학은 진보의 원동력입니다. 우리가 아는 것을 확장함으로써 우리는 더 많은 기술을 생산하고 삶을 개선할 수 있습니다. 과학자들의 삶을 개선하고, 그들의 작업을 더 쉽게 만들며, 개발을 가속화하고, 비용을 절감하며, 연구비 지원서를 작성하는 대신 문제를 파악하는 데 더 많은 시간을 할애할 수 있게 한다면, 우리 모두는 사회를 훨씬 더 빠르게 발전시킬 수 있습니다.

DeSci 운동은 여러분을 필요로 합니다. 새로운 자금 조달 메커니즘을 실험하거나, 오픈 액세스 및 오픈 사이언스 도구를 구축하거나, 공개 데이터 세트를 다루는 것을 생각해 보십시오. DeSci 팀이나 DAO에 합류하는 것을 고려해 보십시오. 이러한 커뮤니티를 탐색해 보시길 바라며, 이 운동에서 여러분을 뵐 수 있기를 희망합니다. 대단히 감사합니다. 다음에 또 뵙겠습니다.

(박수)

이 페이지가 도움이 되었나요?