分散型科学 (DeSci)、独立系ラボ、および大規模データサイエンス
フアン・ベネット (Juan Benet) が、分散型科学 (DeSci) ムーブメントがWeb3ツールを使用してどのように科学に資金を提供し、組織化し、オープンにできるかについて語ります。資金調達メカニズム、オープンアクセス、再現可能な実験、大規模なデータサイエンスパイプラインなどを取り上げます。
Date published: 2022年6月30日
Protocol Labsの創設者であり、IPFSとFilecoinの発明者である**フアン・ベネット (Juan Benet)**によるEthCCでのプレゼンテーション。分散型科学 (DeSci) ムーブメントがWeb3ツールを使用して、どのように科学に資金を提供し、研究者を組織し、オープンアクセスで再現可能な研究インフラを構築できるかについて解説します。
このトランスクリプトは、EthCCが公開した元のビデオトランスクリプト (opens in a new tab)のアクセシブルなコピーです。読みやすさを考慮して軽く編集されています。
科学と進歩の紹介 (0:10)
皆さん、こんにちは。私の名前はフアンです。本日は分散型科学 (DeSci) についてお話しします。DeSciを利用して、どのように科学に資金を提供し、組織化し、オープンにできるかについてお話ししたいと思います。まず、本日のアジェンダは以下の通りです。最初に科学全般について少し触れ、次にDeSciムーブメントとは何か、そして科学のコモンズ(共有財産)にどのように資金を提供できるかについて説明します。その後、DeSciが科学に関わる人々、プロジェクト、そして研究をどのように組織化しているかについてお話しします。さらに、オープンアクセスと再現可能な科学について少し触れ、最後に行動喚起(コールトゥアクション)で締めくくりたいと思います。カバーする内容が多いので、駆け足で進めていきます。
まず初めに、過去数世紀の間に驚異的な進歩があったことをお伝えしたいと思います。人類に関するほぼすべての指標が向上しています。私たちが考え得るほぼすべての基準において、人間の状況は劇的に改善されており、この進歩を達成する上で大きな役割を果たしてきたのが科学的事業です。私たちの知識を拡張し、その知識を技術やさまざまな問題の解決策へと変換することで、世界中の多くの人々を貧困から救い出すことができました。多くの人々に食糧を供給し、すべての人に住居を提供し、あらゆる種類の病気を治療するなど、科学のおかげで膨大な進歩が達成されてきました。
科学は、多くの異なるサブ分野や多様な知識領域を持つ巨大な事業です。特定の分野や研究領域を思い浮かべても、科学はその大部分を占めています。結局のところ、科学とは物事を解明するプロセスのことです。新しい知識を生み出し、新しい概念を結びつけるプロセスです。科学的手法を思い浮かべてみてください。ファインマンの有名な言葉に「実験と一致しなければ、それは間違っている」というものがあります。そして、それこそが科学の鍵なのです。
科学は、地球上の人々を巻き込む大規模な事業と考えることができます。そこにはあらゆる種類の取り組みやシステムが存在します。世界中のさまざまな大学、多様な研究グループ、異なる分野、そして学術誌など、あらゆるものを思い浮かべてみてください。私たちが知っていることを統合し、新しいアイデアを思いつき、そのアイデアを研究プロジェクトに変換し、それを実際の仮説検証へと進め、仮説が正しいかどうかをテストするためのデータを収集するプロセスには、多くの異なる活動が伴います。そして、それらの結果を論文としてまとめ、科学コミュニティによる査読を受け、知識の木に追加され、私たちの知識を拡張していくという一連の流れがあります。
もしかすると、物語はそこで終わるかもしれませんし、後になって実はそれが再現不可能であることが判明し、白紙に戻さなければならないかもしれません。あるいは、それが正しかっただけでなく、他の多くの新しい知識への扉を開くことになるかもしれません。このように、科学は多くの異なる活動が行われる非常にダイナミックな分野なのです。
しかし現在、科学には多くの問題があります。科学的事業にはあらゆる種類の課題が存在します。科学が進歩のための巨大なエンジンであったにもかかわらず、さまざまなことがうまくいかなくなっています。特に、さまざまな分野で資金調達が不足しています。同時に、資金が不足しているとはいえ、全体として科学には多額の資金が投入されています。しかし、以前ほど資金が有効に使われておらず、科学が費用対効果を得られなくなっているという感覚があります。助成金を獲得する競争が激しすぎる分野が全体的に多く存在しています。
研究が完了し発表されても、再現できるのはそのほんの一部にすぎません。発表され、受け入れられ、正しいと考えられていた科学の多くが、後になって実はその大部分が再現できないことが判明するのです。つまり、深刻な再現性の危機が存在しています。さらに、科学的発見の成果物が失われているケースさえあります。ある結果に関連する実際の論文、コード、またはデータが、私たちの知識バンクから失われている状況を想像してみてください。このように、科学の周辺には解決すべきあらゆる種類の問題があり、これがDeSciの目的の一部でもあります。DeSciコミュニティは、これらの問題のすべてを完全に解決するわけではありませんが、その多くに取り組もうとしています。
分散型科学 (DeSci) ムーブメント (5:11)
では、DeSciとは何でしょうか?DeSciは、Web3の技術とツールを使用して科学を改善するためのムーブメントです。ハッシュリンク、ブロックチェーン、スマートコントラクトのすべての魔法を利用して、世界中のあらゆる分野で科学の進め方を改善できるシステムや構造を構築することを想像してみてください。
焦点を当てている分野はたくさんあります。オープンアクセスの論文やデータのコモンズを持ち、より優れた再現可能な実験を行い、ラボやグループをより良く組織化できることを考えてみてください。研究グループを形成・組織化し、資金を調達し、参加者に報酬を分配できるDAO(分散型自律組織)のような構造を作成することを想像してください。IPNFTのような全く新しい資金調達構造もあります。報酬を伴う査読のためのプロトコルも存在します。歴史的に、査読は研究者が膨大な時間と労力を費やしてすべての研究を査読する一方で、学術誌はその労働に対して誰にも支払いをしないという搾取的な状況にありました。現在、あらゆる種類の新しいインセンティブ構造が実験されています。
これはかなり新しいムーブメントです。しばらく前から存在はしていました。私がIPFSを始めたとき、それはDeSciという言葉が存在する前のDeSciムーブメントのようなものでした。私は、科学を行う目的で人々がデータをはるかにうまく分散できるようにすることを目指してIPFSを始めました。そのため、これらのアイデアの多くはプロジェクトの核心部分となっています。しかし、このムーブメントは過去1〜2年で大きな勢いを増しており、多くの新しい組織が登場しています。このマップ(エコシステム)の規模は昨年で2倍から3倍に拡大しており、これは本当に素晴らしいことです。
現在、VitaDAOやMoleculeなど、分散型のバイオテクノロジー資金調達を行っているグループがいくつかあります。科学に資金を提供するための新しい構造を考案しようとしている組織も多数存在します。自らが科学的組織として研究開発(R&D)を行おうとしているDAOもいくつかあります。DeSciの取り組みの多くを支援したり、何らかの形でDeSciと関わりを持ったりしている財団や機関もいくつか存在します。出版のさまざまな方法を模索しているグループや、多くの科学NFTなどもあります。このコミュニティは過去1〜2年で大きく成長しています。
また現在では、これらのコミュニティを集めるさまざまなミートアップやカンファレンスも多数開催されています。DeSci Day、DeSci ベルリン、GitcoinコミュニティによるSchelling Point、そしてFunding the Commonsなどです。これらのカンファレンスでは、DeSciに関する多くの議論が交わされています。
コモンズへの資金提供 (10:40)
コモンズへの資金提供についてお話ししましょう。私が過去にイノベーションのキャズムについて説明する際に使用した図を見たことがある方もいるかもしれません。科学から技術への変換において、DeSciの部分は主に左側、つまり科学の部分に焦点を当てており、より良い科学的成果を生み出すためのより良いインセンティブ構造やグループの調整方法を考えようとしています。注目すべきは、世界全体でのR&D資金の総額は、ある視点から見れば巨大ですが、別の視点から見ればそれほど大きくなく、私たちが構築している技術のスループットと成果が飛躍的に成長しているにもかかわらず、過去数十年間であまり変わっていないということです。
これらの資金規模は、ブロックチェーンの手の届かないものではありません。米国の非国防R&Dを考えてみてください。これは年間約700億ドルの規模です。確かに大金ですが、途方もない額というわけではありません。年間約100億ドルのNSF(米国国立科学財団)だけを取り上げれば、ブロックチェーンを通じて十分に達成可能な額です。暗号資産の分野は、時期にもよりますが、1兆ドルから3兆ドル規模の市場を持っていることを考えてみてください。
もしブロックチェーンが毎年、その供給量の一部をR&Dに割り当てるとしたらどうなるか想像してみてください。Filecoin、イーサリアム、またはビットコインの1パーセントを取り出し、毎年R&Dに注ぎ込むことを想像してください。国家レベルで科学に資金を提供する範囲の数字に到達し始めます。もし暗号資産がさらに1桁か2桁成長すれば、暗号資産は国家規模でR&Dや科学に資金を提供できるようになるでしょう。これは考えるとかなりすごいことです。ですから、その段階に到達する前に、構造を解明し、優れた資金調達の経路を見つけ出すことができれば素晴らしいと思います。
これらの機関からの資金提供を分析し始めると、あらゆる種類の問題に直面します。特定の分野がほとんど注目されなかったり、プログラム自体に歪んだインセンティブがあったり、競争が激しすぎたりして、科学者が助成金の申請書を書くことだけに膨大な時間を費やしている状況が生み出されています。COVIDの際にはFast Grantsと呼ばれる取り組みがあり、Impetus Grantsでも同じ効果が再現されました。これらのプログラムは非常に迅速な助成金プログラムを構築しました。科学者が費やす時間のほんの一部で、2万ドルから20万ドル規模の助成金を提供することができたのです。
これらの助成金に応募した科学者を対象としたある調査では、彼らが普段助成金の申請にどれだけの時間を費やしているかが示されました。科学者の時間の25〜50パーセントが、自分たちの活動内容を説明し、さまざまな助成金に申請するためだけに費やされていると考えてみてください。これはある意味、異常なことです。理想的には、科学者には仕事について考え、新しいアイデアを思いつき、研究を分析することに大半の時間を費やしてほしいはずです。また、助成金プログラムが人々の探求内容を制限してしまうという影響もあります。多くの科学者は追求したいはるかに野心的な研究を持っていますが、助成金プログラムの制約に従うため、結果としてそれほど影響力のない他の研究を追求することに縛られてしまうのです。
そこでWeb3の公共財の出番です!多くの異なるグループが存在します。もちろん、これはまだ小規模です。Web3ムーブメントは世界の科学R&D資金に比べれば非常に小さいですが、構造を正しく構築し、インセンティブをうまく調整し、それが機能することを証明できれば、暗号資産とともに桁違いにスケールさせることができます。私たちは科学的プロセスのためのさまざまな種類の資金調達を模索すべきです。異なる助成金プログラム、インパクト証明書、インパクト市場などです。Funding the Commonsコミュニティは、さまざまなメカニズムを試行してきました。
例えば、VitaDAOのようなグループは、データ、知識、IP(知的財産)と引き換えにグループに助成金を提供するデータ構造を作成しています。そして、そのIPを法的効力を持つIPNFTにバンドルし、バイオテクノロジー企業にIP権を付与し、その成功を通じて投資を回収することを目指してそれらの企業に資金を提供しています。私はこれを基礎開発ファンドと呼ぶことが多く、企業ではないラボを通じて重要な作業を行い、IPを生み出して企業に資金を提供しています。Moleculeのようなグループは、その作業が行われるためのマーケットプレイスを作成しています。
インパクト証明書は、遡及的資金調達を表すもう一つの魅力的な構造です。これにより、参加者は何らかのインパクトを達成した際に、そのインパクトに関する証明書をミントし、そのインパクトを請求したい人に市場で販売することができます。これにより投機的な市場が形成され、時間を超えたループが閉じることで、極めて重要な作業に遡及的に資金を提供できるようになります。多くの場合、何かの価値に気づくのは作業が完了してからずっと後になるため、これは非常に重要です。
人々の組織化とデータDAO (15:28)
次に、人々を組織化することについて少し考えてみましょう。過去において、GitHubは科学的発見の組織化を支援する上で非常に大きな成功を収めてきました。教科書全体や分野全体がGitHubを通じて発展してきました。多くのグループが、イシュー、コードのコラボレーション、バージョン管理といったGitHubの基本的な機能を使用して、実践や科学のコミュニティを組織してきました。しかし、そこで不完全なのは、研究を行う組織を作成したり、資本を扱ったり、貢献者に報酬を支払ったりする方法がないことです。
LabDAOのような興味深い実験があり、グループを形成し、資金を調達し、それを分配できるラボチームを作成しています。参加者のさまざまな貢献レベルをエンコードして、公平に報酬を与えることができます。より大規模なネットワーク内の参加者間でのクレジット割り当てや、異なる連携チーム間で報酬を伝播させるという、より野心的なプロジェクトもあります。
査読プロトコルを実験しているグループもあり、査読システムの経済性とダイナミクスを観察して、作業にインセンティブを与え、それが行われていることに適切に報酬を与えようとしています。Ants Reviewと呼ばれるプロトコルはすでにこれを行っており、メタマスクで使用することができます。Gitcoin Grantsはここで使用できる多くの作業を開拓しており、このような方法で組織化したい参加者のためのツールをすでにサポートしています。
ここで本当に重要なコンポーネントの1つは、ハッシュによるコンテンツのリンクです。情報の束を凍結し、コンテンツアドレス指定されたハッシュリンクを取得し、物事を参照することができます。これは、文献において求められる中核的な機能です。ある論文から別の論文へ、あるいは論文からそのデータやコードへの引用がある場合、CID(コンテンツ識別子)こそがまさに必要なものです。バージョン管理によって文献全体を凍結し、それらの実験を再度実行するために必要なすべての重要なデータセットとコードを凍結できることを想像してみてください。多くのグループがこれを模索しており、IPFSを通じた査読や科学的発展のさまざまな方法を提案しています。
そのような活動やデータ生成を、データDAOと呼ばれるものとバンドルすることを考えることができます。先ほど言及したすでに始動しているDAOとは異なり、データDAOは非常に新しいものです。データを収集、キュレーション、変換、計算し、そのデータが長期的にどのように使用され、どのように収益化され、どのように共有されるかをガバナンスできるグループを想像してみてください。
最後に、オープンアクセスと再現可能な科学について少し触れておきます。IPFSはすでに、多くの種類のオープンサイエンスの取り組みで大量に使用されています。分散型のWikipediaのコピー、論文の巨大なアーカイブ、データセットをサポートし、多くの科学へのアクセスを開放するという夢をすでに実現しています。
オープンアクセス、再現可能な科学、そして行動喚起 (20:40)
完全な再現性については、まだそこまで到達していません。これはさらなる取り組みが必要な分野ですが、すでに多くの人々が考察を重ねています。IPFSを用いた標準的な再現性を使用してすべてのアセットを凍結し、完全に再現可能なパイプラインを構築することに関する、非常に優れた仕様やアイデアが存在します。過去の特定の実験を呼び戻し、完全に凍結されたVMやコンテナを復元し、すべてのデータパイプラインを再実行して、実験が正しいことを検証することができます。
また、データサイエンス自体をDeSci指向の方法で行うという全く別の角度もあります。ここでは、ノートブック、データ分析、および成果物がWeb3を活用したアプリケーションを使用します。Jupyterノートブック、IPythonノートブック、WolframノートブックなどはすでにCIDと連携しています。Filecoinネットワークが飛躍的に成長するにつれて、これは将来さらに強化されると思います。Filecoinネットワークには計算機能と結びついた多くのストレージがあり、ストレージプロバイダーはデータのすぐそばに大量のGPUを持っています。これらは来年には、そのデータ周辺で計算パイプラインを発行する機能と結びつく予定です。情報の指定と保存、そして計算の両方にWeb3コンピューティングプラットフォームを活用し、データサイエンスの完全なエンドツーエンドのパイプラインを作成して、科学者が大規模なデータサイエンスを行うためのプラットフォームを構築することを想像してみてください。
最後に、簡単な行動喚起(コールトゥアクション)です。科学は進歩のエンジンです。私たちの知識を拡張することで、より多くの技術を生み出し、生活を向上させることができます。もし私たちが科学者の生活を向上させ、彼らの仕事をより簡単にし、開発を加速させ、コストを削減し、助成金の申請書を書く代わりに問題を解明するためにより多くの時間を費やせるようにできれば、私たちは皆、社会をはるかに速く前進させることができるでしょう。
DeSciムーブメントはあなたを必要としています。新しい資金調達メカニズムの実験、オープンアクセスやオープンサイエンスのツールの構築、または公開データセットの活用を考えてみてください。DeSciチームやDAOへの参加を検討してみてください。これらのコミュニティを探索し、このムーブメントで皆さんにお会いできることを願っています。ありがとうございました。それではまた。
(拍手)