Pular para o conteúdo principal

DeSci, laboratórios independentes e ciência de dados em larga escala

Juan Benet fala sobre como o movimento de ciência descentralizada (desci) pode financiar, organizar e abrir a ciência usando ferramentas da Web3, cobrindo mecanismos de financiamento, acesso aberto, experimentos reprodutíveis e pipelines de ciência de dados em larga escala.

Date published: 30 de junho de 2022

Uma apresentação de Juan Benet, fundador da Protocol Labs e inventor do IPFS e da Filecoin, na EthCC sobre como o movimento de ciência descentralizada (desci) pode usar ferramentas da Web3 para financiar a ciência, organizar pesquisadores e construir infraestrutura de pesquisa de acesso aberto e reprodutível.

Esta transcrição é uma cópia acessível da transcrição original do vídeo (opens in a new tab) publicada pela EthCC. Ela foi levemente editada para facilitar a leitura.

Introdução à ciência e ao progresso (0:10)

Certo, olá a todos. Meu nome é Juan. Estou aqui para falar sobre a desci. Quero falar sobre como podemos usar a desci para financiar, organizar e abrir a ciência. Primeiramente, é sobre isso que vamos conversar: vou falar sobre a ciência em geral por um momento, depois vou falar sobre o que é o movimento desci, e então sobre como podemos financiar os bens comuns da ciência. Depois, como a desci está organizando as pessoas, os projetos e os trabalhos em torno da ciência. Em seguida, quero falar um pouco sobre acesso aberto e ciência reprodutível, e quero terminar com um chamado à ação. Então, isso será bem rápido. Temos muito a cobrir, então vou me mover rápido.

Primeiramente, quero começar dizendo que houve uma enorme quantidade de progresso nos últimos séculos. Quase todas as métricas humanas vêm melhorando. Por quase qualquer medida que possamos pensar, a condição humana tem melhorado drasticamente, e uma grande parte de alcançar esse progresso tem sido o empreendimento científico. Ao expandir o que sabemos, ao sermos capazes de transformar o que sabemos em tecnologias e soluções para vários problemas, conseguimos tirar uma enorme fração do mundo da pobreza. Conseguimos alimentar toneladas de pessoas, dar abrigo a todos, curar todos os tipos de doenças e assim por diante. Uma enorme quantidade de progresso foi alcançada graças à ciência.

A ciência é um empreendimento massivo com muitos subcampos diferentes e muitas áreas de conhecimento diferentes. Você pode pensar em qualquer campo específico e qualquer área de estudo, e a ciência é uma grande parte disso. No fim das contas, a ciência se trata do processo de descobrir as coisas. O processo de criar novos conhecimentos e unir novos conceitos. Pense no método científico. Há uma citação famosa de Feynman: "Se discorda do experimento, está errado." E essa é a chave para a ciência.

Você pode pensar na ciência como um empreendimento em larga escala que envolve humanos ao redor do planeta. Existem todos os tipos de esforços e sistemas. Você pensa em tudo, desde várias universidades no planeta, vários grupos de pesquisa, diferentes campos e periódicos. Há muita atividade diferente em torno do processo de sintetizar o que sabemos, ter novas ideias, transformar essas ideias em projetos de pesquisa, transformá-los em testes reais de hipóteses e coletar dados para poder testar se uma hipótese está correta. Até chegar a escrever esses resultados em algum tipo de artigo que então é revisado por uma comunidade científica, é adicionado à árvore do conhecimento e, em seguida, expande o que sabemos.

Talvez a história pare por aí, ou talvez mais tarde se descubra que, na verdade, aquilo não era reprodutível, e temos que desfazer isso. Ou, na verdade, aquilo estava correto, mas abriu a porta para toneladas de outros novos conhecimentos. Portanto, é um campo altamente dinâmico com muitas atividades diferentes.

Agora, a ciência tem uma tonelada de problemas. Existem todos os tipos de questões com o empreendimento científico. Embora tenha sido um enorme motor para o progresso, há todos os tipos de coisas que têm dado errado com ele. Em particular, há uma falta de financiamento em uma variedade de campos. Ao mesmo tempo, embora haja falta de financiamento, há muito dinheiro no geral indo para a ciência. Há um sentimento de que o dinheiro não está rendendo tanto quanto costumava, que a ciência não está mais obtendo tanto retorno pelo seu investimento. Existem muitos campos em geral que são competitivos demais em termos de obtenção de subsídios.

Uma vez que os estudos são concluídos e produzidos, apenas uma fração deles se replica. Então, há todos os tipos de ciência que foram publicados, aceitos e considerados corretos, apenas para descobrir mais tarde que uma enorme fração deles não pode ser realmente reproduzida. Portanto, há uma enorme crise de reprodutibilidade. E há até descobertas científicas cujos artefatos estão desaparecendo. Pense nos próprios artigos, códigos ou dados associados a algum resultado desaparecendo de nossos bancos de conhecimento. Então, há todos os tipos de problemas em torno da ciência que precisam ser corrigidos, e isso é parte do que a desci se trata. Isso é enfrentar uma série desses problemas, não no atacado, não completamente, mas a comunidade desci está tentando enfrentar várias dessas questões.

O movimento DeSci (5:11)

Então, o que é a desci? A desci é um movimento para melhorar a ciência usando tecnologia e ferramentas da Web3. Pense em ser capaz de usar toda a magia da vinculação de hash, blockchains e contratos inteligentes para criar sistemas e estruturas que podem melhorar como fazemos ciência em vários campos ao redor do globo.

Há um monte de áreas de foco diferentes. Pense em ser capaz de ter artigos de acesso aberto e bens comuns de dados, ter melhores experimentos reprodutíveis e ser capaz de organizar melhor laboratórios e grupos. Pense em criar estruturas como DAOs que podem permitir que grupos de pesquisa se formem e se organizem, levantem capital e distribuam recompensas aos participantes. Existem estruturas de financiamento inteiramente novas, coisas como IPNFTs. Existem protocolos para revisão por pares com recompensas. Historicamente, a revisão por pares tem sido essa situação predatória onde os acadêmicos investem uma enorme quantidade de tempo e esforço para revisar todo o trabalho, e os periódicos na verdade não pagam ninguém por esse trabalho. Existem todos os tipos de novas estruturas de incentivo sendo experimentadas.

Este é um movimento bastante novo. Ele está conosco há um tempo. Quando comecei o IPFS, era meio que um movimento desci antes da desci ser algo. Comecei o IPFS com o objetivo de permitir que as pessoas distribuíssem dados muito melhor com o propósito de fazer ciência. Então, muitas dessas ideias fazem parte do núcleo do projeto. No entanto, o movimento vem ganhando muita força no último ano ou dois, e muitas novas organizações têm aparecido. Este mapa dobrou ou triplicou de tamanho no último ano, o que é realmente ótimo de se ver.

Agora existem vários grupos fazendo financiamento descentralizado de biotecnologia, grupos como VitaDAO, Molecule e outros. Existem muitas organizações tentando criar novas estruturas para financiar a ciência. Existem várias DAOs que são organizações científicas em si tentando fazer P&D. Existem várias fundações e instituições que estão apoiando muito do trabalho da desci, ou que se associam à desci de uma forma ou de outra. Existem muitos grupos explorando diferentes formas de publicação, muitos NFTs de ciência e assim por diante. Esta comunidade tem crescido muito no último ano ou dois.

Agora também há muitos encontros e conferências diferentes que estão reunindo essas comunidades. Coisas como DeSci Day, DeSci Berlim, Schelling Point da comunidade Gitcoin e Funding the Commons. Essas conferências estão reunindo muitas das conversas em torno da desci.

Financiando os bens comuns (10:40)

Vamos falar sobre financiar os bens comuns. Talvez alguns de vocês tenham visto este diagrama que usei no passado sobre o abismo da inovação. Na tradução da ciência para a tecnologia, a parte da desci está focada principalmente na parte esquerda — apenas a parte da ciência — tentando pensar em melhores estruturas de incentivo e melhores maneiras de coordenar grupos para produzir melhores resultados científicos. Vale a pena notar que o financiamento global total de P&D é, de uma perspectiva, meio massivo, mas de outra perspectiva, não tão grande e não mudou muito nas últimas décadas, embora a vazão e o resultado da tecnologia que estamos construindo tenham crescido tremendamente.

Essas escalas de financiamento não estão fora do alcance das blockchains. Pense na P&D não relacionada à defesa dos EUA, que é da ordem de US$ 70 bilhões por ano. Isso é muito, com certeza, mas não é massivo. Isolando a NSF, que é de cerca de US$ 10 bilhões por ano, isso é totalmente alcançável através de blockchains. Pense no espaço cripto tendo na ordem de US$ 1 a US$ 3 trilhões, dependendo de quando você olha para ele.

Imagine se as blockchains dedicassem alguma fração de seu suprimento para P&D anualmente. Imagine pegar um por cento da Filecoin, Ethereum ou Bitcoin, e despejar em P&D todos os anos. Você começa a atingir os números que estão na faixa de financiamento da ciência em nível de estado-nação. Se cripto crescer mais uma ordem de magnitude ou duas, cripto será capaz de financiar P&D e ciência na escala de estados-nação, o que é muito louco de se pensar. Então, seria ótimo descobrir as estruturas e descobrir bons caminhos de financiamento antes de chegarmos lá.

Quando você começa a detalhar o financiamento dessas agências, você encontra todos os tipos de problemas. Certos campos recebem muito pouca atenção, ou os próprios programas têm incentivos perversos ou são competitivos demais, gerando uma condição em que os cientistas estão gastando uma enorme quantidade de seu tempo apenas escrevendo pedidos de subsídios. Houve um esforço chamado Fast Grants em torno da COVID, e o mesmo efeito foi replicado nos Impetus Grants, onde esses programas estruturaram um programa de subsídios que era muito rápido. Eles conseguiram distribuir subsídios na ordem de 20 mil a 200 mil com uma pequena fração da quantidade de tempo que os cientistas estavam investindo.

Em uma pesquisa com cientistas que se candidataram a esses subsídios, eles indicaram quanto tempo normalmente gastam se candidatando a subsídios. Pense em 25 a 50 por cento do tempo de um cientista indo apenas para detalhar o que eles estão fazendo e se candidatando a vários subsídios. Isso é meio insano. Idealmente, você gostaria que os cientistas passassem a grande maioria de seu tempo pensando sobre seu trabalho, tendo novas ideias e analisando o trabalho. Há também esse efeito onde os programas de subsídios restringem o que as pessoas acabam explorando. Muitos cientistas têm pesquisas muito mais ambiciosas que desejam seguir, mas acabam presos buscando outros trabalhos que não são tão impactantes porque se conformam às restrições do programa de subsídios.

Bens públicos da Web3 ao resgate! Existem muitos grupos diferentes. Claro, isso ainda é minúsculo; o movimento Web3 é muito pequeno em comparação com o financiamento global de P&D em ciência, mas se conseguirmos acertar as estruturas, alinhar bem os incentivos e demonstrar que funciona, então podemos escalá-lo em ordens de magnitude junto com cripto. Devemos explorar muitos tipos diferentes de financiamento para processos científicos: diferentes programas de subsídios, certificados de impacto, mercados de impacto e assim por diante. A comunidade Funding the Commons tem testado uma série de mecanismos diferentes.

Por exemplo, grupos como a VitaDAO estão criando uma estrutura de dados distribuindo subsídios para grupos em troca de dados, conhecimento e PI (propriedade intelectual). Então, eles estão agrupando essa PI em IPNFTs que carregam peso legal, concedendo direitos de PI a biotecnologias e financiando essas biotecnologias com o objetivo de retornar o investimento através de seu sucesso. Costumo chamar isso de fundo de desenvolvimento fundamental, fazendo um trabalho importante através de laboratórios que não são empresas em si, gerando PI para então financiar as empresas. Grupos como a Molecule estão criando mercados para que esse trabalho aconteça.

Certificados de impacto são outra estrutura fascinante que representa o financiamento retroativo. Eles permitem que os participantes, uma vez que alcancem algum impacto, possam cunhar um certificado em torno desse impacto e vendê-lo no mercado para qualquer um que queira reivindicar esse impacto. Isso permite que um mercado especulativo surja, fechando um ciclo ao longo do tempo para financiar retroativamente um trabalho extremamente importante. Isso é crucial porque muitas vezes você só percebe o quão valioso algo é muito tempo depois que o trabalho foi feito.

Organizando pessoas e Data DAOs (15:28)

Agora, alguns pensamentos rápidos sobre a organização de pessoas. No passado, o GitHub foi tremendamente bem-sucedido em ajudar a organizar a descoberta científica. Livros didáticos e campos inteiros se desenvolveram através do GitHub. Muitos grupos usaram as primitivas básicas do GitHub em torno de problemas (issues), colaboração de código e controle de versão para organizar comunidades de prática e ciência. Mas o que não está completo lá é que você não tem uma maneira de criar organizações que fazem pesquisa, lidam com capital ou pagam contribuidores.

Existem experimentos interessantes como a LabDAO, criando equipes de laboratório onde grupos podem se formar, levantar financiamento e distribuí-lo. Você é capaz de codificar os diferentes níveis de contribuição dos participantes para recompensá-los de forma justa. Existem projetos mais ambiciosos em torno da atribuição de crédito entre os participantes em uma rede maior, propagando a recompensa através de diferentes equipes acopladas.

Existem grupos experimentando protocolos de revisão por pares, observando a economia e a dinâmica do sistema de revisão por pares para tanto incentivar o trabalho quanto recompensar adequadamente que ele está acontecendo. Um protocolo chamado Ants Review já está fazendo isso, o qual você pode usar com a MetaMask. O Gitcoin Grants foi pioneiro em uma tonelada do trabalho que pode ser usado aqui e já está apoiando ferramentas para participantes que desejam se organizar dessas maneiras.

Um dos componentes realmente fundamentais aqui é a vinculação de conteúdo por hash. Você pode congelar um pacote de informações, obter um link de hash endereçado por conteúdo e referenciar coisas. Esta é a primitiva central que você deseja na literatura. Quando você tem uma citação de um artigo para outro, ou de um artigo para seus dados ou código, um CID é precisamente a coisa que você deseja. Imagine ser capaz de congelar toda a literatura com controle de versão e congelar todos os conjuntos de dados e códigos importantes necessários para executar esses experimentos novamente. Muitos grupos estão explorando isso, proponindo diferentes maneiras de fazer revisão por pares e desenvolvimento científico através do IPFS.

Você pode pensar em agrupar esse tipo de atividade e geração de dados com algo chamado Data DAO. Ao contrário das DAOs que mencionei antes que já estão começando, as Data DAOs são muito novas. Pense em um grupo que é capaz de coletar, curar, transformar e computar dados, e governar como esses dados são usados ao longo do tempo, como são monetizados e como são compartilhados.

Algumas notas finais sobre acesso aberto e ciência reprodutível. O IPFS já tem sido muito usado para muitos tipos de trabalho de ciência aberta. Ele já está vivendo o sonho de abrir o acesso a muita ciência, apoiando cópias distribuídas da Wikipedia, arquivos massivos de artigos e conjuntos de dados.

Acesso aberto, ciência reprodutível e chamado à ação (20:40)

Ainda não chegamos lá com a reprodutibilidade total. Esta é uma área que precisa de mais trabalho, mas muitas pessoas já pensaram sobre isso. Existem especificações e ideias muito boas em torno do uso de reprodutibilidade padrão com o IPFS para congelar todos os ativos e construir um pipeline totalmente reprodutível. Você pode invocar de volta experimentos específicos do passado, trazer de volta VMs ou contêineres totalmente congelados, reexecutar todos os pipelines de dados e verificar se os experimentos estão corretos.

Há também todo um outro ângulo em torno de fazer a própria ciência de dados de uma maneira orientada à desci, onde notebooks, análise de dados e artefatos estão usando aplicativos alimentados pela Web3. Coisas como notebooks Jupyter, notebooks IPython e notebooks Wolfram já se acoplam com CIDs. Acho que isso vai ser turbinado no futuro à medida que a rede Filecoin crescer tremendamente. A rede Filecoin tem muito armazenamento acoplado à computação — os provedores de armazenamento têm toneladas de GPUs bem ao lado dos dados. Eles serão conectados no próximo ano com a capacidade de emitir pipelines computacionais em torno desses dados. Pense em gerar uma plataforma para cientistas fazerem ciência de dados em escala massiva, aproveitando as plataformas de computação da Web3 tanto para o endereçamento e armazenamento de informações, quanto para a computação, criando um pipeline completo de ponta a ponta de ciência de dados.

Finalmente, um rápido chamado à ação. A ciência é o motor do progresso. Ao expandir o que sabemos, somos capazes de produzir mais tecnologia e melhorar nossas vidas. Se pudermos melhorar a vida dos cientistas, facilitar seu trabalho, acelerar seu desenvolvimento, reduzir seus custos e permitir que passem mais tempo descobrindo problemas em vez de escrever pedidos de subsídios, então todos nós poderemos avançar a sociedade de forma única e muito mais rápida.

O movimento desci precisa de você. Pense em experimentar novos mecanismos de financiamento, construir ferramentas de acesso aberto e ciência aberta, ou brincar com conjuntos de dados públicos. Pense em se juntar a uma equipe desci ou a uma DAO. Explore essas comunidades, e espero ver você no movimento. Muito obrigado, e nos vemos por aí.

(Aplausos)

Esta página foi útil?