Nem só inovação e democracia, nem só reforço de desigualdades: os dados precisam ser estudados a partir de seus métodos reais de produção e circulação. Esse é o ponto de partida do livro Le travail invisible des données: eléments pour une sociologie des infrastructures scripturales, de Jérôme Denis, professor de sociologia da MINES ParisTech, lançado em 2018. Para ele, é preciso ressaltar os processos produtivos por trás dos dados. Os dados não caem do céu e o trabalho por trás deles é invisibilizado.
Confira a entrevista de Jérôme Denis ao DigiLabour:
DIGILABOUR: O que é o trabalho de dados e por que esse trabalho é invisível?
JÉRÔME DENIS: O termo “trabalho de dados” enfatiza todas as operações que são executadas antes do uso dos dados: tudo o que permite, em um determinado momento e local, que os dados existam e sejam processados. Essas operações podem ser muito variadas: limpeza, formatação, apreensão, configuração, entre outras. É no final dessas operações que os dados são “obtidos”, como diz Latour sobre as práticas científicas. Na maioria dos casos, esse trabalho é invisível para quem usa os dados. Há muitas razões para isso. A principal encontra-se, provavelmente, no modo de existência dos dados. Na ciência, por exemplo, muitos sociólogos e historiadores têm mostrado que os dados têm estabelecido sua força ao preço de apagar as condições de sua produção. Supõe-se que os dados sejam o ponto de partida para a atividade de conhecimento, o primeiro material de informação. Isso é evidenciado por metáforas que têm surgido com a emergência de métodos de big data e programas de dados abertos. Os dados são apresentados como recursos ou elementos naturais: “o petróleo do século XXI” ou dados que aparecem como se fossem um “dilúvio”. Eles estão sempre “lá”. Essa invisibilidade não é obrigatória. Poderia ser de outra forma, mas ela está presente e contribui centralmente para as dificuldades enfrentadas pelos trabalhadores de dados, bem como seus usuários.
DIGILABOUR: Quais as principais diferenças no trabalho de dados em um banco e em uma startup?
DENIS: Eu uso esses dois estudos de casos para destacar dois aspectos centrais do trabalho de dados. No caso do banco, considera-se que os dados estejam presentes nos arquivos que os clientes preenchem nas agências, e que as pessoas responsáveis por verificar esses dados e inseri-los nos sistemas de informação estejam fazendo um trabalho simples e que pode ser automatizado em curto prazo. A suposição aqui é a de que os dados circulam de maneira fluida de um ponto a outro em uma organização. Nossa pesquisa etnográfica mostra que essa visão não só está em desacordo com a atividade dos caixas de banco como também impede operações de ajuste das situações. Mas é essa visão que dita os termos do gerenciamento do trabalho no banco. Já a startup procura obter o que imagina ser os dados das pessoas numa cidade. Isso ilustra outro pressuposto sobre os dados: sua disponibilidade e sua própria existência. O trabalho de dados aparece aqui como uma obrigação. As informações existentes nas prefeituras sobre infraestruturas de ciclovias não podem ser considerados como dados pelos responsáveis pela startup. Para fazer existir esses dados, temos que concordar em gerá-los, o que já está sendo feito em parte graças ao OpenStreetMap (projeto de mapeamento colaborativo).
DIGILABOUR: Você afirma que o fluxo de dados é um instrumento da organização. O que isso quer dizer?
DENIS: Um dos objetivos do livro “O trabalho invisível dos dados” era reconsiderar a afirmação recorrente de que vivemos na era dos dados, como se isso fosse uma coisa totalmente nova ou até mesmo uma revolução. Muitos livros de História mostram que as organizações modernas estruturam-se enrijecendo seus circuitos de comunicação e investindo na circulação de escrituras padronizadas dispostas em associações cada vez mais complexas. Os dados são parte de uma história antiga e formados há muito tempo. Tenho chamado isso de “infraestruturas escriturais”. A mecanização dessa circulação contribuiu para a invisibilização do trabalho que torna tudo isso possível.
DIGILABOUR: O que seria o neopositivismo de dados e quais suas características?
DENIS: O neopositivismo de dados consiste em dar aos dados valores intrínsecos de neutralidade e mesmo de evidência. Essa é uma expressão um tanto caricatural, mas que aponta para uma tendência recente de se esquecer que os dados são sempre produzidos sob condições específicas, em torno de problemas particulares e que seu compartilhamento e reuso sempre exigem transformações e ajustes. No final do livro, tento mostrar que, em contraponto a esse positivismo, podemos adotar uma definição transacional de dados. Eles não são “coisas” identificáveis de antemão, mas o resultado de um processo de produção e troca.
DIGILABOUR: E no que consiste essa definição transacional de dados?
DENIS: Adotar uma definição transacional de dados é substituir a questão abstrata “o que são dados?”, para a qual não há nenhuma resposta consensual, pela pergunta concreta: “quando é um dado?”. Isso quer dizer que, em alguns casos, os dados são “obtidos”, no sentido de Latour, mas também são “dados”, como ponto de partida, em outros casos. Isso ajuda a entender, por exemplo, que uma foto é um documento para alguns, enquanto pode ser um dado para outros. Essa é uma postura agnóstica, que se recusa a defender uma posição normativa em relação à natureza dos dados, mas permite, por outro lado, estar atento ao que conta como um “dado” em uma ou outra situação particular. E a ideia do livro é dizer que, em geral, o que conta como um dado é definido no mesmo movimento em relação ao que conta como trabalho.
DIGILABOUR: Quais os riscos da invisibilização do trabalho de dados?
DENIS: O apagamento do trabalho de dados tem dois riscos principais. Em primeiro lugar, reforça as dificuldades daqueles que trabalham com isso, como o caso do banco. Assumir que as operações necessárias para a existência e a circulação de dados são triviais e não envolvem trabalho real leva a situações muito delicadas em que os trabalhadores estão constantemente lutando para realizar seu trabalho, apesar dos constrangimentos. Isso, então, pesa na qualidade dos dados e na pertinência de sua utilização. Em segundo, considerar os dados como se tivessem caído do céu, não se dar ao luxo de entender as condições de sua fabricação e os ajustes necessários à sua circulação é fazer dos dados caixas pretas que não controlamos.
Você pode conferir outra entrevista do autor aqui (em francês) e outros textos em inglês aqui e aqui.