Passer au contenu principal

DeSci, laboratoires indépendants et science des données à grande échelle

Juan Benet explique comment le mouvement de la science décentralisée (DeSci) peut financer, organiser et ouvrir la science à l'aide des outils du Web3, en abordant les mécanismes de financement, le libre accès, les expériences reproductibles et les pipelines de science des données à grande échelle.

Date published: 30 juin 2022

Une présentation de Juan Benet, fondateur de Protocol Labs et inventeur d'IPFS et de Filecoin, à l'EthCC sur la façon dont le mouvement DeSci peut utiliser les outils du Web3 pour financer la science, organiser les chercheurs et construire une infrastructure de recherche en libre accès et reproductible.

Cette transcription est une copie accessible de la transcription originale de la vidéo (opens in a new tab) publiée par l'EthCC. Elle a été légèrement modifiée pour en faciliter la lecture.

Introduction à la science et au progrès (0:10)

Très bien, bonjour à tous. Je m'appelle Juan. Je suis ici pour parler de la DeSci. Je veux parler de la façon dont nous pouvons utiliser la DeSci pour financer, organiser et ouvrir la science. Tout d'abord, voici ce dont nous allons discuter : je vais parler de la science en général pendant un moment, puis je vais parler de ce qu'est le mouvement DeSci, et ensuite de la façon dont nous pouvons financer les biens communs scientifiques. Ensuite, comment la DeSci organise les personnes, les projets et les travaux autour de la science. Puis je veux parler un peu du libre accès et de la science reproductible, et je veux terminer par un appel à l'action. Ce sera donc assez rapide. Nous avons beaucoup de choses à couvrir, alors je vais aller vite.

Tout d'abord, je tiens à commencer par dire qu'il y a eu énormément de progrès au cours des derniers siècles. Presque toutes les mesures humaines se sont améliorées. Selon presque tous les critères auxquels nous pouvons penser, la condition humaine s'est considérablement améliorée, et l'entreprise scientifique a joué un rôle majeur dans la réalisation de ces progrès. En élargissant ce que nous savons, en étant capables de transformer nos connaissances en technologies et en solutions à divers problèmes, nous avons pu sortir une grande partie du monde de la pauvreté. Nous avons pu nourrir des tonnes de personnes, offrir un abri à tous, guérir toutes sortes de maladies, etc. D'énormes progrès ont été réalisés grâce à la science.

La science est une entreprise massive avec de nombreux sous-domaines différents et de nombreux domaines de connaissances différents. Vous pouvez penser à n'importe quel domaine particulier et à n'importe quel domaine d'étude, et la science en occupe une grande partie. En fin de compte, la science est le processus de découverte. Le processus de création de nouvelles connaissances et d'association de nouveaux concepts. Pensez à la méthode scientifique. Il y a une citation célèbre de Feynman : « Si cela ne concorde pas avec l'expérience, c'est faux. » Et c'est la clé de la science.

Vous pouvez considérer la science comme une entreprise à grande échelle qui implique des humains sur toute la planète. Il y a toutes sortes d'efforts et de systèmes. Pensez à tout, des diverses universités de la planète aux divers groupes de recherche, en passant par les différents domaines et revues. Il y a beaucoup d'activités différentes autour du processus de synthèse de ce que nous savons, de la proposition de nouvelles idées, de la transformation de ces idées en projets de recherche, de leur transformation en tests réels d'hypothèses et de la collecte de données pour pouvoir tester si une hypothèse est correcte. Jusqu'à la rédaction de ces résultats dans une sorte d'article qui est ensuite examiné par une communauté scientifique, ajouté à l'arbre des connaissances, puis qui élargit ce que nous savons.

Peut-être que l'histoire s'arrête là, ou peut-être que plus tard, il s'avère qu'en fait, ce n'était pas reproductible, et nous devons faire marche arrière. Ou en fait, c'était correct, mais cela a ouvert la porte à des tonnes d'autres nouvelles connaissances. C'est donc un domaine très dynamique avec beaucoup d'activités différentes.

Maintenant, la science a une tonne de problèmes. Il y a toutes sortes de problèmes avec l'entreprise scientifique. Même si elle a été un énorme moteur de progrès, il y a toutes sortes de choses qui ont mal tourné. En particulier, il y a un manque de financement dans divers domaines. En même temps, même s'il y a un manque de financement, il y a beaucoup d'argent au total qui va à la science. On a le sentiment que l'argent ne va plus aussi loin qu'avant, que la science n'en a plus autant pour son argent. Il y a de nombreux domaines à tous les niveaux qui sont beaucoup trop compétitifs en termes d'obtention de subventions.

Une fois les études terminées et produites, seule une fraction d'entre elles se reproduit. Il y a donc toutes sortes de travaux scientifiques qui ont été publiés, acceptés et considérés comme corrects, pour découvrir plus tard qu'une grande partie d'entre eux ne peut pas être reproduite. Il y a donc une énorme crise de reproductibilité. Et il y a même des découvertes scientifiques dont les artefacts disparaissent. Pensez aux articles, au code ou aux données réels associés à un résultat qui disparaissent de nos banques de connaissances. Il y a donc toutes sortes de problèmes autour de la science qui doivent être résolus, et c'est en partie ce dont traite la DeSci. Il s'agit de s'attaquer à une série de ces problèmes, pas en bloc, pas complètement, mais la communauté DeSci essaie de s'attaquer à un certain nombre de ces problèmes.

Le mouvement DeSci (5:11)

Alors, qu'est-ce que la DeSci ? La science décentralisée (DeSci) est un mouvement visant à améliorer la science en utilisant les technologies et les outils du Web3. Imaginez pouvoir utiliser toute la magie des liens de hash, des blockchains et des contrats intelligents pour créer des systèmes et des structures qui peuvent améliorer la façon dont nous faisons de la science dans tous les domaines à travers le monde.

Il y a un tas de domaines d'intervention différents. Pensez à la possibilité d'avoir des articles en libre accès et des biens communs de données, d'avoir de meilleures expériences reproductibles et de pouvoir mieux organiser les laboratoires et les groupes. Pensez à la création de structures comme les DAO qui peuvent permettre aux groupes de recherche de se former et de s'organiser, de lever des capitaux et de distribuer des récompenses aux participants. Il existe des structures de financement entièrement nouvelles, comme les IPNFT. Il existe des protocoles d'évaluation par les pairs avec des récompenses. Historiquement, l'évaluation par les pairs a été cette situation prédatrice où les universitaires consacrent énormément de temps et d'efforts à évaluer l'ensemble du travail, et les revues ne paient en fait personne pour ce travail. Toutes sortes de nouvelles structures d'incitation sont expérimentées.

C'est un mouvement assez nouveau. Il est avec nous depuis un certain temps. Quand j'ai lancé IPFS, c'était en quelque sorte un mouvement DeSci avant que la DeSci n'existe. J'ai lancé IPFS dans le but de permettre aux gens de distribuer des données beaucoup mieux dans le but de faire de la science. Beaucoup de ces idées font donc partie du cœur du projet. Cependant, le mouvement a pris beaucoup d'ampleur au cours des deux dernières années, et de nombreuses nouvelles organisations sont apparues. Cette carte a doublé ou triplé de taille au cours de la dernière année, ce qui est vraiment formidable à voir.

Il y a maintenant plusieurs groupes qui font du financement décentralisé de la biotechnologie, des groupes comme VitaDAO, Molecule et d'autres. De nombreuses organisations essaient de trouver de nouvelles structures pour financer la science. Il y a plusieurs DAO qui sont elles-mêmes des organisations scientifiques essayant de faire de la R&D. Il y a plusieurs fondations et institutions qui soutiennent une grande partie du travail de la DeSci, ou qui s'associent à la DeSci d'une manière ou d'une autre. De nombreux groupes explorent différentes façons de publier, de nombreux NFT scientifiques, etc. Cette communauté s'est beaucoup développée au cours des deux dernières années.

Il y a aussi maintenant beaucoup de rencontres et de conférences différentes qui rassemblent ces communautés. Des événements comme le DeSci Day, DeSci Berlin, Schelling Point de la communauté Gitcoin et Funding the Commons. Ces conférences rassemblent une grande partie des conversations autour de la DeSci.

Financer les biens communs (10:40)

Parlons du financement des biens publics. Peut-être que certains d'entre vous ont vu ce diagramme que j'ai utilisé dans le passé concernant le gouffre de l'innovation. Dans le passage de la science à la technologie, la partie DeSci se concentre principalement sur la partie gauche — juste la partie scientifique — en essayant de penser à de meilleures structures d'incitation et à de meilleures façons de coordonner les groupes pour produire de meilleurs résultats scientifiques. Il convient de noter que le financement mondial total de la R&D est, d'un certain point de vue, assez massif, mais d'un autre point de vue, pas si important et n'a pas beaucoup changé au cours des dernières décennies, même si le débit et les résultats de la technologie que nous construisons ont considérablement augmenté.

Ces échelles de financement ne sont pas hors de portée des blockchains. Pensez à la R&D non liée à la défense aux États-Unis, qui est de l'ordre de 70 milliards de dollars par an. C'est beaucoup, bien sûr, mais ce n'est pas massif. Si l'on isole la NSF, qui représente environ 10 milliards de dollars par an, c'est tout à fait réalisable grâce aux blockchains. Pensez à l'espace crypto qui pèse de l'ordre de 1 à 3 billions de dollars selon le moment où vous le regardez.

Imaginez si les blockchains devaient consacrer une fraction de leur offre à la R&D sur une base annuelle. Imaginez prendre un pour cent de Filecoin, d'Ethereum ou de Bitcoin, et l'injecter dans la R&D chaque année. Vous commencez à atteindre des chiffres qui sont de l'ordre du financement de la science au niveau d'un État-nation. Si la crypto croît d'un autre ordre de grandeur ou deux, la crypto sera capable de financer la R&D et la science à l'échelle des États-nations, ce qui est assez fou à imaginer. Il serait donc formidable de déterminer les structures et de trouver de bonnes voies de financement avant d'y arriver.

Lorsque vous commencez à analyser le financement de ces agences, vous rencontrez toutes sortes de problèmes. Certains domaines reçoivent trop peu d'attention, ou les programmes eux-mêmes ont des incitations perverses ou sont beaucoup trop compétitifs, créant une situation où les scientifiques passent énormément de temps à simplement rédiger des demandes de subventions. Il y a eu une initiative appelée Fast Grants autour du COVID, et le même effet a été reproduit dans les Impetus Grants, où ces programmes ont structuré un programme de subventions très rapide. Ils ont pu accorder des subventions de l'ordre de 20 000 à 200 000 dollars avec une infime fraction du temps que les scientifiques y consacraient.

Dans une enquête menée auprès de scientifiques postulant à ces subventions, ils ont indiqué combien de temps ils passent normalement à demander des subventions. Pensez à 25 à 50 pour cent du temps d'un scientifique consacré uniquement à expliquer ce qu'il fait et à postuler à diverses subventions. C'est un peu insensé. Idéalement, vous voudriez que les scientifiques passent la grande majorité de leur temps à réfléchir à leur travail, à trouver de nouvelles idées et à analyser le travail. Il y a aussi cet effet où les programmes de subventions limitent ce que les gens finissent par explorer. De nombreux scientifiques ont des recherches beaucoup plus ambitieuses qu'ils souhaitent poursuivre, mais ils se retrouvent coincés à poursuivre d'autres travaux qui n'ont pas autant d'impact parce qu'ils se conforment aux contraintes du programme de subventions.

Les biens publics du Web3 à la rescousse ! Il y a beaucoup de groupes différents. Bien sûr, c'est encore minuscule ; le mouvement Web3 est très petit par rapport au financement mondial de la R&D scientifique, mais si nous pouvons mettre en place les bonnes structures, bien aligner les incitations et démontrer que cela fonctionne, alors nous pourrons le faire évoluer de plusieurs ordres de grandeur avec la crypto. Nous devrions explorer de nombreux types de financement différents pour les processus scientifiques : différents programmes de subventions, des certificats d'impact, des marchés d'impact, etc. La communauté Funding the Commons a testé un tas de mécanismes différents.

Par exemple, des groupes comme VitaDAO créent une structure de données accordant des subventions à des groupes en échange de données, de connaissances et de propriété intellectuelle (PI). Ensuite, ils regroupent cette PI dans des IPNFT qui ont un poids juridique, accordant des droits de PI aux entreprises de biotechnologie et finançant ces entreprises dans le but de rentabiliser l'investissement grâce à leur succès. J'ai tendance à appeler cela un fonds de développement fondamental, qui accomplit un travail important par l'intermédiaire de laboratoires qui ne sont pas eux-mêmes des entreprises, générant de la PI pour ensuite financer les entreprises. Des groupes comme Molecule créent des places de marché pour que ce travail ait lieu.

Les certificats d'impact sont une autre structure fascinante représentant un financement rétroactif. Ils permettent aux participants, une fois qu'ils ont obtenu un certain impact, de frapper un certificat autour de cet impact et de le vendre sur le marché à quiconque souhaite réclamer cet impact. Cela permet l'émergence d'un marché spéculatif, bouclant la boucle dans le temps pour financer rétroactivement des travaux extrêmement importants. C'est crucial car bien souvent, on ne se rend compte de la valeur d'une chose que bien après que le travail a été accompli.

Organiser les personnes et les Data DAO (15:28)

Maintenant, quelques réflexions rapides sur l'organisation des personnes. Dans le passé, GitHub a connu un énorme succès en aidant à organiser la découverte scientifique. Des manuels et des domaines entiers se sont développés grâce à GitHub. De nombreux groupes ont utilisé les primitives de base de GitHub autour des tickets, de la collaboration sur le code et du contrôle de version pour organiser des communautés de pratique et de science. Mais ce qui n'est pas complet là-bas, c'est que vous n'avez pas de moyen de créer des organisations qui font de la recherche, de gérer des capitaux ou de payer des contributeurs.

Il y a des expériences intéressantes comme LabDAO, qui crée des équipes de laboratoire où des groupes peuvent se former, lever des fonds et les distribuer. Vous êtes en mesure d'encoder les différents niveaux de contribution des participants pour les récompenser équitablement. Il existe des projets plus ambitieux autour de l'attribution de crédits entre les participants d'un réseau plus vaste, propageant la récompense à travers différentes équipes couplées.

Il y a des groupes qui expérimentent des protocoles d'évaluation par les pairs, observant l'économie et la dynamique du système d'évaluation par les pairs pour à la fois inciter le travail et récompenser correctement sa réalisation. Un protocole appelé Ants Review le fait déjà, que vous pouvez utiliser avec MetaMask. Gitcoin Grants a été le pionnier d'une tonne de travaux qui peuvent être utilisés ici et prend déjà en charge les outils pour les participants qui souhaitent s'organiser de cette manière.

L'un des composants vraiment clés ici est la liaison du contenu par hash. Vous pouvez figer un ensemble d'informations, obtenir un lien de hash adressé par le contenu et référencer des éléments. C'est la primitive de base que vous voulez dans la littérature. Lorsque vous avez une citation d'un article à un autre, ou d'un article à ses données ou à son code, un CID est précisément ce que vous voulez. Imaginez pouvoir figer l'ensemble de la littérature avec un contrôle de version et figer tous les ensembles de données et le code importants nécessaires pour exécuter à nouveau ces expériences. De nombreux groupes explorent cela, proposant différentes manières de faire de l'évaluation par les pairs et du développement scientifique via IPFS.

Vous pouvez envisager de regrouper ce type d'activité et de génération de données avec ce qu'on appelle une Data DAO. Contrairement aux DAO que j'ai mentionnées précédemment et qui démarrent déjà, les Data DAO sont très nouvelles. Pensez à un groupe capable de collecter, de conserver, de transformer et de calculer des données, et de gouverner la façon dont ces données sont utilisées au fil du temps, comment elles sont monétisées et comment elles sont partagées.

Quelques notes finales sur le libre accès et la science reproductible. IPFS a déjà été énormément utilisé pour de nombreux types de travaux de science ouverte. Il vit déjà le rêve d'ouvrir l'accès à une grande partie de la science, en prenant en charge des copies distribuées de Wikipédia, des archives massives d'articles et des ensembles de données.

Libre accès, science reproductible et appel à l'action (20:40)

Nous n'y sommes pas encore tout à fait avec une reproductibilité totale. C'est un domaine qui nécessite plus de travail, mais beaucoup de gens y ont déjà réfléchi. Il y a de très bonnes spécifications et idées autour de l'utilisation de la reproductibilité standard avec IPFS pour figer tous les actifs et construire un pipeline entièrement reproductible. Vous pouvez rappeler des expériences spécifiques du passé, ramener des machines virtuelles (VM) ou des conteneurs totalement figés, réexécuter tous les pipelines de données et vérifier que les expériences sont correctes.

Il y a aussi un tout autre angle autour de la réalisation de la science des données elle-même d'une manière orientée DeSci, où les notebooks, l'analyse des données et les artefacts utilisent des applications propulsées par le Web3. Des outils comme les notebooks Jupyter, les notebooks IPython et les notebooks Wolfram se couplent déjà avec des CID. Je pense que cela va être décuplé à l'avenir à mesure que le réseau Filecoin se développera considérablement. Le réseau Filecoin dispose de beaucoup de stockage couplé au calcul — les fournisseurs de stockage ont des tonnes de GPU juste à côté des données. Ceux-ci vont être connectés l'année prochaine avec la capacité d'émettre des pipelines de calcul autour de ces données. Pensez à générer une plateforme permettant aux scientifiques de faire de la science des données à grande échelle, en tirant parti des plateformes de calcul Web3 à la fois pour l'adressage et le stockage des informations, ainsi que pour le calcul, créant ainsi un pipeline complet de science des données de bout en bout.

Enfin, un appel rapide à l'action. La science est le moteur du progrès. En élargissant ce que nous savons, nous sommes capables de produire plus de technologie et d'améliorer nos vies. Si nous pouvons améliorer la vie des scientifiques, faciliter leur travail, accélérer leur développement, réduire leurs coûts et leur permettre de passer plus de temps à résoudre des problèmes au lieu de rédiger des demandes de subventions, alors nous pourrons tous faire progresser la société beaucoup plus rapidement.

Le mouvement DeSci a besoin de vous. Pensez à expérimenter de nouveaux mécanismes de financement, à créer des outils en libre accès et de science ouverte, ou à jouer avec des ensembles de données publics. Pensez à rejoindre une équipe DeSci ou une DAO. Explorez ces communautés, et j'espère vous voir dans le mouvement. Merci beaucoup, et à bientôt.

(Applaudissements)

Cette page vous a-t-elle été utile ?