DeSci, laboratorios independientes y ciencia de datos a gran escala
Juan Benet habla sobre cómo el movimiento de la ciencia descentralizada (DeSci) puede financiar, organizar y abrir la ciencia utilizando herramientas de la Web3, abarcando mecanismos de financiación, acceso abierto, experimentos reproducibles y canales de ciencia de datos a gran escala.
Date published: 30 de junio de 2022
Una presentación de Juan Benet, fundador de Protocol Labs e inventor de IPFS y Filecoin, en EthCC sobre cómo el movimiento DeSci puede utilizar herramientas de la Web3 para financiar la ciencia, organizar a los investigadores y construir una infraestructura de investigación de acceso abierto y reproducible.
Esta transcripción es una copia accesible de la transcripción original del video (opens in a new tab) publicada por EthCC. Ha sido ligeramente editada para facilitar su lectura.
Introducción a la ciencia y el progreso (0:10)
Muy bien, hola a todos. Mi nombre es Juan. Estoy aquí para hablar sobre DeSci. Quiero hablar sobre cómo podemos usar DeSci para financiar, organizar y abrir la ciencia. En primer lugar, esto es de lo que vamos a hablar: voy a hablar sobre la ciencia en general por un momento, luego voy a hablar sobre qué es el movimiento DeSci, y después sobre cómo podemos financiar los bienes comunes de la ciencia. Luego, cómo DeSci está organizando a las personas, los proyectos y los trabajos en torno a la ciencia. Después quiero hablar un poco sobre el acceso abierto y la ciencia reproducible, y quiero terminar con un llamado a la acción. Así que esto será bastante rápido. Tenemos mucho que cubrir, así que avanzaré rápido.
En primer lugar, quiero empezar diciendo que ha habido una enorme cantidad de progreso en los últimos siglos. Casi todas las métricas humanas han estado mejorando. En casi cualquier medida que podamos pensar, la condición humana ha estado mejorando drásticamente, y una gran parte de lograr este progreso ha sido la empresa científica. Al ampliar lo que sabemos, al ser capaces de transformar lo que sabemos en tecnologías y soluciones a diversos problemas, hemos podido sacar a una gran parte del mundo de la pobreza. Hemos podido alimentar a muchísimas personas, dar refugio a todos, curar todo tipo de enfermedades, y así sucesivamente. Se ha logrado una enorme cantidad de progreso gracias a la ciencia.
La ciencia es una empresa masiva con muchos subcampos diferentes y muchas áreas de conocimiento distintas. Puedes pensar en cualquier campo en particular y en cualquier área de estudio, y la ciencia es una gran parte de ello. Al final del día, de lo que trata la ciencia es del proceso de descubrir cosas. El proceso de crear nuevo conocimiento y acoplar nuevos conceptos. Piensa en el método científico. Hay una famosa cita de Feynman: "Si no concuerda con el experimento, está mal". Y esa es la clave de la ciencia.
Puedes pensar en la ciencia como una empresa a gran escala que involucra a humanos en todo el planeta. Hay todo tipo de esfuerzos y sistemas. Piensas en todo, desde varias universidades en el planeta, varios grupos de investigación, diferentes campos y revistas. Hay mucha actividad diferente en torno al proceso de sintetizar lo que sabemos, proponer nuevas ideas, transformar esas ideas en proyectos de investigación, convertirlos en pruebas reales de hipótesis y recopilar datos para poder probar si una hipótesis es correcta. Todo el camino hasta redactar esos resultados en algún tipo de artículo que luego es revisado por una comunidad científica, se agrega al árbol del conocimiento y luego amplía lo que sabemos.
Tal vez la historia se detenga ahí, o tal vez más tarde resulte que, en realidad, eso no era reproducible, y tenemos que deshacerlo. O en realidad, eso era correcto, pero abrió la puerta a muchísimo otro conocimiento nuevo. Así que es un campo altamente dinámico con mucha actividad diferente.
Ahora bien, la ciencia tiene un montón de problemas. Hay todo tipo de problemas con la empresa científica. Aunque ha sido un enorme motor para el progreso, hay todo tipo de cosas que han estado saliendo mal. En particular, hay una falta de financiación en una variedad de campos. Al mismo tiempo, aunque hay una falta de financiación, hay mucho dinero en general destinado a la ciencia. Existe la sensación de que el dinero no rinde tanto como antes, que la ciencia ya no obtiene tanto por su dinero. Hay muchos campos en general que son demasiado competitivos en términos de obtener subvenciones.
Una vez que los estudios están hechos y producidos, solo una fracción de ellos se replica. Así que hay todo tipo de ciencia que ha sido publicada, aceptada y considerada correcta, solo para descubrir más tarde que una gran fracción de ella en realidad no puede ser reproducida. Así que hay una enorme crisis de reproducibilidad. E incluso hay descubrimientos científicos cuyos artefactos están desapareciendo. Piensa en los artículos reales, el código o los datos asociados con algún resultado que desaparecen de nuestros bancos de conocimiento. Así que hay todo tipo de problemas en torno a la ciencia que necesitan ser solucionados, y de esto trata en parte DeSci. Esto es abordar una serie de estos problemas, no a gran escala, no completamente, pero la comunidad DeSci está intentando abordar varios de estos problemas.
El movimiento DeSci (5:11)
Entonces, ¿qué es DeSci? DeSci es un movimiento para mejorar la ciencia utilizando tecnología y herramientas de la Web3. Piensa en poder usar toda la magia de la vinculación de hash, las cadenas de bloques y los contratos inteligentes para crear sistemas y estructuras que puedan mejorar cómo hacemos ciencia en todos los campos alrededor del mundo.
Hay un montón de áreas de enfoque diferentes. Piensa en poder tener artículos de acceso abierto y bienes comunes de datos, tener mejores experimentos reproducibles y poder organizar mejor los laboratorios y grupos. Piensa en crear estructuras como las DAO que puedan permitir a los grupos de investigación formarse y organizarse, recaudar capital y distribuir recompensas a los participantes. Hay estructuras de financiación completamente nuevas, cosas como los IPNFT. Hay protocolos para la revisión por pares con recompensas. Históricamente, la revisión por pares ha sido esta situación depredadora donde los académicos invierten una enorme cantidad de tiempo y esfuerzo para revisar por pares todo el trabajo, y las revistas en realidad no le pagan a nadie por esa labor. Se están experimentando todo tipo de nuevas estructuras de incentivos.
Este es un movimiento bastante nuevo. Ha estado con nosotros por un tiempo. Cuando comencé IPFS, era una especie de movimiento DeSci antes de que DeSci existiera. Comencé IPFS con el objetivo de permitir a las personas distribuir datos mucho mejor con el propósito de hacer ciencia. Así que muchas de estas ideas son parte del núcleo del proyecto. Sin embargo, el movimiento ha estado ganando mucho impulso durante el último año o dos, y han estado apareciendo muchas organizaciones nuevas. Este mapa ha duplicado o triplicado su tamaño en el último año, lo cual es realmente genial de ver.
Ahora hay varios grupos haciendo financiación biotecnológica descentralizada, grupos como VitaDAO, Molecule y otros. Hay muchas organizaciones intentando idear nuevas estructuras para financiar la ciencia. Hay varias DAO que son organizaciones científicas en sí mismas intentando hacer I+D. Hay varias fundaciones e instituciones que están apoyando gran parte del trabajo de DeSci, o que se asocian con DeSci de una forma u otra. Hay muchos grupos explorando diferentes formas de publicación, muchos NFT científicos, y así sucesivamente. Esta comunidad ha estado creciendo mucho durante el último año o dos.
Ahora también hay muchos encuentros y conferencias diferentes que están reuniendo a estas comunidades. Cosas como DeSci Day, DeSci Berlín, Schelling Point de la comunidad de Gitcoin y Funding the Commons. Estas conferencias están reuniendo muchas de las conversaciones en torno a DeSci.
Financiación de los bienes comunes (10:40)
Hablemos sobre la financiación de los bienes comunes. Tal vez algunos de ustedes hayan visto este diagrama que he usado en el pasado sobre el abismo de la innovación. En la traducción de la ciencia a la tecnología, la parte de DeSci se centra principalmente en la parte izquierda —solo la parte de la ciencia— intentando pensar en mejores estructuras de incentivos y mejores formas de coordinar grupos para producir mejores resultados científicos. Vale la pena señalar que la financiación global total de I+D es, desde una perspectiva, algo masiva, pero desde otra perspectiva, no tan grande y no ha cambiado tanto en las últimas décadas, a pesar de que la capacidad de procesamiento y el resultado de la tecnología que estamos construyendo han crecido enormemente.
Estas escalas de financiación no están fuera del alcance de las cadenas de bloques. Piensa en la I+D no relacionada con la defensa de EE. UU., que es del orden de 70 mil millones de dólares al año. Eso es mucho, sin duda, pero no es masivo. Aislando a la NSF, que ronda los 10 mil millones de dólares al año, eso es totalmente alcanzable a través de las cadenas de bloques. Piensa en el espacio cripto que tiene del orden de 1 a 3 billones de dólares dependiendo de cuándo lo mires.
Imagina si las cadenas de bloques dedicaran una fracción de su suministro a I+D anualmente. Imagina tomar el uno por ciento de Filecoin, Ethereum o Bitcoin, y verterlo en I+D cada año. Empiezas a alcanzar los números que están en el rango de financiar la ciencia a nivel de estado-nación. Si las cripto crecen en otro orden de magnitud o dos, las cripto van a ser capaces de financiar la I+D y la ciencia a la escala de los estados-nación, lo cual es bastante loco de pensar. Así que sería genial descubrir las estructuras y encontrar buenas vías de financiación antes de que lleguemos allí.
Cuando empiezas a desglosar la financiación de esas agencias, te encuentras con todo tipo de problemas. Ciertos campos reciben muy poca atención, o los programas en sí tienen incentivos perversos o son demasiado competitivos, produciendo una condición en la que los científicos pasan una enorme cantidad de su tiempo solo escribiendo solicitudes de subvenciones. Hubo un esfuerzo llamado Fast Grants en torno al COVID, y el mismo efecto se replicó en las Impetus Grants, donde estos programas estructuraron un programa de subvenciones que era muy rápido. Pudieron otorgar subvenciones del orden de 20k a 200k con una pequeña fracción de la cantidad de tiempo que los científicos estaban invirtiendo.
En una encuesta a científicos que solicitaban esas subvenciones, indicaron cuánto tiempo pasan normalmente solicitando subvenciones. Piensa en el 25 al 50 por ciento del tiempo de un científico destinado solo a detallar lo que están haciendo y a solicitar varias subvenciones. Esto es una locura. Idealmente, querrías que los científicos pasaran la gran mayoría de su tiempo pensando en su trabajo, proponiendo nuevas ideas y analizando el trabajo. También existe este efecto donde los programas de subvenciones limitan lo que las personas terminan explorando. Muchos científicos tienen investigaciones mucho más ambiciosas que quieren llevar a cabo, pero terminan atrapados realizando otros trabajos que no son ni de lejos tan impactantes porque se ajustan a las limitaciones del programa de subvenciones.
¡Los bienes públicos de la Web3 al rescate! Hay muchos grupos diferentes. Por supuesto, esto todavía es minúsculo; el movimiento de la Web3 es muy pequeño en comparación con la financiación global de I+D en ciencia, pero si podemos hacer bien las estructuras, alinear bien los incentivos y demostrar que funciona, entonces podemos escalarlo en órdenes de magnitud junto con las cripto. Deberíamos explorar muchos tipos diferentes de financiación para los procesos científicos: diferentes programas de subvenciones, certificados de impacto, mercados de impacto, y así sucesivamente. La comunidad de Funding the Commons ha estado probando un montón de mecanismos diferentes.
Por ejemplo, grupos como VitaDAO están creando una estructura de datos que otorga subvenciones a grupos a cambio de datos, conocimiento y propiedad intelectual (IP). Luego están agrupando esa IP en IPNFT que tienen peso legal, otorgando derechos de IP a empresas biotecnológicas y financiando a esas empresas biotecnológicas con el objetivo de retornar la inversión a través de su éxito. Suelo llamar a esto un fondo de desarrollo fundamental, que realiza un trabajo importante a través de laboratorios que no son empresas en sí mismos, generando IP para luego financiar a las empresas. Grupos como Molecule están creando mercados para que ese trabajo se lleve a cabo.
Los certificados de impacto son otra estructura fascinante que representa la financiación retroactiva. Permiten a los participantes, una vez que logran algún impacto, acuñar un certificado en torno a ese impacto y venderlo en el mercado a cualquiera que quiera hacer un reclamo sobre ese impacto. Eso permite que surja un mercado especulativo, cerrando un ciclo a través del tiempo para financiar retroactivamente un trabajo extremadamente importante. Esto es crucial porque muchas veces solo te das cuenta de lo valioso que es algo mucho después de que el trabajo se ha realizado.
Organizando a las personas y las DAO de datos (15:28)
Ahora algunas reflexiones rápidas sobre la organización de las personas. En el pasado, GitHub ha tenido un éxito tremendo ayudando a organizar el descubrimiento científico. Libros de texto y campos enteros se han desarrollado a través de GitHub. Muchos grupos han utilizado las primitivas básicas de GitHub en torno a problemas (issues), colaboración de código y control de versiones para organizar comunidades de práctica y ciencia. Pero lo que no está completo ahí es que no tienes una forma de crear organizaciones que hagan investigación, manejen capital o paguen a los contribuyentes.
Hay experimentos interesantes como LabDAO, creando equipos de laboratorio donde los grupos pueden formarse, recaudar fondos y distribuirlos. Eres capaz de codificar los diferentes niveles de contribución de los participantes para darles una recompensa de manera justa. Hay proyectos más ambiciosos en torno a la asignación de crédito entre los participantes en una red más grande, propagando la recompensa a través de diferentes equipos acoplados.
Hay grupos experimentando con protocolos de revisión por pares, observando la economía y la dinámica del sistema de revisión por pares para incentivar el trabajo y dar una recompensa adecuada por el hecho de que esté ocurriendo. Un protocolo llamado Ants Review ya está haciendo esto, el cual puedes usar con MetaMask. Gitcoin Grants ha sido pionero en gran parte del trabajo que se puede usar aquí y ya está apoyando herramientas para los participantes que quieren organizarse de estas maneras.
Uno de los componentes realmente clave aquí es la vinculación de contenido por hash. Puedes congelar un paquete de información, obtener un enlace hash direccionado por contenido y referenciar cosas. Esta es la primitiva central que deseas en la literatura. Cuando tienes una cita de un artículo a otro, o de un artículo a sus datos o código, un CID es precisamente lo que quieres. Imagina poder congelar toda la literatura con control de versiones y congelar todos los conjuntos de datos y códigos importantes requeridos para ejecutar esos experimentos nuevamente. Muchos grupos están explorando esto, proponiendo diferentes formas de hacer revisión por pares y desarrollo científico a través de IPFS.
Puedes pensar en agrupar ese tipo de actividad y generación de datos con algo llamado una DAO de datos (Data DAO). A diferencia de las DAO que mencioné antes que ya están comenzando, las DAO de datos son muy nuevas. Piensa en un grupo que es capaz de recopilar, curar, transformar y computar sobre datos, y gobernar cómo se usan esos datos a lo largo del tiempo, cómo se monetizan y cómo se comparten.
Algunas notas finales sobre el acceso abierto y la ciencia reproducible. IPFS ya se ha utilizado muchísimo para muchos tipos de trabajo de ciencia abierta. Ya está viviendo el sueño de abrir el acceso a mucha ciencia, apoyando copias distribuidas de Wikipedia, archivos masivos de artículos y conjuntos de datos.
Acceso abierto, ciencia reproducible y llamado a la acción (20:40)
Todavía no hemos llegado a la reproducibilidad total. Esta es un área que necesita más trabajo, pero muchas personas ya han reflexionado al respecto. Hay especificaciones e ideas realmente buenas en torno al uso de la reproducibilidad estándar con IPFS para congelar todos los activos y construir un canal completamente reproducible. Puedes invocar experimentos específicos del pasado, traer de vuelta máquinas virtuales (VM) o contenedores totalmente congelados, volver a ejecutar todos los canales de datos y verificar que los experimentos sean correctos.
También hay todo otro ángulo en torno a hacer la ciencia de datos en sí misma de una manera orientada a DeSci, donde los cuadernos (notebooks), el análisis de datos y los artefactos están utilizando aplicaciones impulsadas por la Web3. Cosas como los cuadernos de Jupyter, los cuadernos de IPython y los cuadernos de Wolfram ya se acoplan con los CID. Creo que eso se va a potenciar en el futuro a medida que la red de Filecoin crezca enormemente. La red de Filecoin tiene mucho almacenamiento acoplado con computación: los proveedores de almacenamiento tienen toneladas de GPU justo al lado de los datos. Esos se van a conectar en el próximo año con la capacidad de emitir canales computacionales en torno a esos datos. Piensa en generar una plataforma para que los científicos hagan ciencia de datos a escala masiva, aprovechando las plataformas de computación de la Web3 tanto para el direccionamiento y almacenamiento de información, como para la computación, creando un canal completo de extremo a extremo de ciencia de datos.
Finalmente, un rápido llamado a la acción. La ciencia es el motor del progreso. Al ampliar lo que sabemos, somos capaces de producir más tecnología y mejorar nuestras vidas. Si podemos mejorar las vidas de los científicos, facilitar su trabajo, acelerar su desarrollo, reducir sus costos y permitirles pasar más tiempo resolviendo problemas en lugar de escribir solicitudes de subvenciones, entonces todos podemos hacer avanzar a la sociedad de manera única y mucho más rápido.
El movimiento DeSci te necesita. Piensa en experimentar con nuevos mecanismos de financiación, construir herramientas de acceso abierto y ciencia abierta, o jugar con conjuntos de datos públicos. Piensa en unirte a un equipo DeSci o a una DAO. Explora estas comunidades, y espero verte en el movimiento. Muchas gracias, y nos vemos por ahí.
(Aplausos)