Mark Andrejevic: “O Big Data é a Era dos Sumos Sacerdotes e Seus Oráculos”

Mark Andrejevic, professor da Monash University, da Austrália, é um dos pesquisadores mais conhecidos na área de vigilância. É autor dos livros Reality TV: The work of being watched e iSpy: Surveillance and power in the interactive era. Entre os seus principais conceitos estão o trabalho de assistir e ser observado, em contextos de reality show e mídias digitais, a produtividade dos fãs nas mídias sociais, a vigilância lateral, a sociedade do sensor e a divisória do Big Data.

Em um de seus artigos mais recentes, Automating Surveillance, Andrejevic trata das lógicas da vigilância na era da coleta e do processamento automatizado de dados, resultando em formas de monitoramento pós-disciplinares não mais baseadas na internalização do olhar de monitoramento pelos sujeitos.

Confira entrevista ao DigiLabour:

 

DIGILABOUR: Qual o papel da vigilância no contexto do trabalho digital e da análise preditiva?

MARK ANDREJEVIC: No âmbito do consumidor, a vigilância tem sido como um meio para um fim definido: racionalizar o processo de consumo, melhorando alcance, distribuição e envio de mensagens. Embora haja alguma indicação de que a publicidade de target pode melhorar as vendas, o nível de vigilância ultrapassa muito o impacto sobre as vendas. Em parte, isso ocorre porque a vigilância se tornou relativamente barata, graças às possibilidades das mídias digitais e aos custos relativamente baixos de transmissão e armazenamento de dados. Isso ocorre, em alguma medida, porque grande parte da economia de vigilância é especulativa e baseada na promessa de que haverá uma recompensa maior quando as práticas de direcionamento forem aperfeiçoadas. Mas há outra tendência: o borrar de linhas entre eficiência econômica e poder. As empresas coletam informações porque acham que isso lhes proporcionará maior controle e, portanto, com menores margens de risco. Coletam dados porque isso é associado ao poder, mesmo que não esteja totalmente claro como isso se traduz em ganho econômico. A mesma coisa acontece com os aparatos de Estado: o enorme aumento na coleta de dados ainda não produziu ganhos comparáveis em eficiência e eficácia, mas ampliou muito a capacidade de monitorar e rastrear populações. Há suposição de que esses sistemas de monitoramento aumentarão seu poder. Isso nos deixa diante de três possibilidades. Uma, os coletores de dados estão corretos e os enormes dados que estão acumulando valerão para controle social e gerenciamento da população mais efetivos. Se esse for o caso, podemos esperar concentrações de poder econômico e político mais dramáticas. Uma segunda possibilidade é os coletores de dados estarem errados, e a economia baseada em dados entrar em colapso quando ficar claro que a análise preditiva não funciona conforme prometido e o envio de mensagens direcionadas é muito menos eficaz que o previsto. A terceira, talvez a mais provável, é que os coletores de dados estão errados, mas será tarde demais para perceber o quão errados estão porque executaremos sistemas empresariais e estatais como se a análise preditiva funcionasse como prometido, sem nunca desenvolver as ferramentas para avaliar com precisão suas reivindicações. Nesse cenário, a polícia usará dados para alocar forças, os profissionais de marketing imaginarão que qualquer aumento nas vendas tem a ver com as práticas de direcionamento e os empregadores contratarão de acordo com os serviços de inteligência artificial, e assim por diante. Haverá uma sociedade do controle sem nenhum referente porque não haverá vontade ou ferramentas para determinar se as previsões estão corretas, por exemplo, se os empregados que não foram contratados seriam mesmo superiores aqueles que foram rejeitados, se mais crimes teriam sido antecipados se a polícia tivesse sido enviada a outro lugar. Assim, nossas vidas serão moldadas por algoritmos que podem ou não ser eficazes naquilo que afirmam estar fazendo, mas nunca saberemos se esses algoritmos são realmente precisos, ou se tudo não passa de um grande golpe.

 

DIGILABOUR: O que significa considerar as tecnologias de Big Data como próteses analíticas?

ANDREJEVIC: Essas tecnologias são próteses disponíveis apenas para aqueles com recursos para acumular e processar grandes bancos de dados: assim, elas chegam a ser próteses analíticas apenas para um número relativamente pequeno de pessoas, aquelas que possuem, controlam e utilizam os bancos de dados. Além disso, a noção de uma prótese pode ser enganosa, pois próteses são extensões do “eu” que melhoram nossas capacidades. Como uma prótese analítica, o Big Data não aumenta a capacidade de gerar conhecimento, mas reconfigura essa capacidade e a transforma em uma forma de não conhecimento. O Big Data, se estiver funcionando de acordo com o planejado, gera insights que não estão disponíveis de outra forma e, portanto, não podem ser compartilhados. Em vez disso, o Big Data equivale a era dos sumos sacerdotes e seus oráculos. Suas proclamações não se baseiam em conhecimentos explicáveis e compartilháveis, mas em operações complexas que permanecem mistificadas, ou místicas, porque não podem ser submetidas à engenharia reversa ou, em alguns casos, melhoradas. Se as correlações orientadas por dados indicam que escrever seu nome em letras maiúsculas faz com que você tenha um risco de crédito maior do que alguém que faz isso de outra forma, não há explicação necessária para esse fato além de ser algo cuspido do sistema de processamento de dados.

 

DIGILABOUR: Após cinco anos da publicação do seu texto sobre a divisória do Big Data, como você define esse termo atualmente?

ANDREJEVIC: A divisória do Big Data  não se refere ao diferencial de poder criado por sistemas que privilegiam aqueles com acesso a conjuntos de dados em larga escala. O  meu foco recente em inteligência artificial destaca a dinâmica de poder invocada por essa noção de “divisória”. Minha preocupação era principalmente com a mudança epistêmica que resulta do uso de sistemas automatizados de processamento de informação, uma categoria que inclui inteligência artificial. Tais sistemas se baseiam em correlações emergentes que podem ser inexplicáveis e impossíveis de fazer engenharia reversa, ao mesmo tempo em que resultam em recomendações práticas. Em alguns casos, resultam em ações. Vimos recentemente que os sistemas automatizados da Amazon têm o poder de demitir funcionários. As interações complexas de milhares ou centenas de milhares de variáveis podem produzir uma previsão que resulta em alguém sendo contratado ou demitido, por exemplo. Em alguns casos, tais decisões não são passíveis de formas tradicionais de accountability. Elas não podem ser explicadas ou justificadas de forma diferente “porque foi isso que os dados disseram”. Isso cria uma divisão, a princípio, entre conhecimento disponível para aqueles com acesso a dados e aqueles que não têm. Isso significa que muitas categorias até então consideradas irrelevantes para determinados processos de tomada de decisão tornam-se relevantes de diferentes maneiras, até mesmo imprevisíveis. Vimos, por exemplo, empresas que dizem que as pessoas que escrevem seus nomes tudo em letra maiúscula em pedidos de empréstimo são considerados com maior risco de crédito, e que as pessoas que preenchem pedidos de emprego no Chrome ou no Firefox são consideradas melhores funcionários do que aqueles que usam Internet Explorer ou Safari. Esses são achados puramente correlacionais, e não há como explicá-los. Em alguns casos, eles podem servir como “entrada” para outras variáveis, como nível de formação e classe social. Em muitos casos, essas correlações podem ser espúrias, mas há uma suposta fé na objetividade e no poder das máquinas. Estamos entrando em um mundo no qual aqueles que têm acesso a grandes conjuntos de dados e a ferramentas para usá-los em processos de tomadas de decisão podem moldar cada aspecto de nossa existência: quais escolas frequentamos, se temos aprovação para empréstimos financeiros, quais vagas de empregos estão disponíveis para nós, e assim por diante. Fiquei intrigado ao ver que o Facebook anunciou recentemente quem terá acesso aos seus dados para checar como a rede tem sido usada para impactar eleições. No entanto, eles definem os termos de acesso para um número limitado de pesquisadores, com prazo e nível de acesso aos dados. Esta é uma tentativa limitada de superar a divisória, mas podemos ver como o controle é daqueles que detêm o poder sobre os bancos de dados. Nesse caso, construir uma ponte sobre a divisória significa obter algum acesso limitado ao conjunto de dados e trazê-lo para processamento das universidades. Mesmo quando se trata de questões cruciais para o destino dos sistemas democráticos, o Facebook tem o poder de definir os termos de acesso. Esta é, certamente, uma forma de divisória digital. Em muitos casos, no entanto, mesmo o acesso aos dados não possibilitará a engenharia reversa nas decisões tomadas em meus sistemas de inteligência artificial. Tudo o que podemos fazer para responsabilizar esses sistemas é tentar coletar as informações que podem ser usadas para avaliar preconceito, discriminação e outras potenciais patologias da tomada de decisão automatizada. Mas isso requer acesso público aos dados, bem como o poder de processamento para dar sentido a esses dados. Essa é uma luta contínua!

 

“Com um mercado rico em dados, nos concentraremos em tarefas realmente humanas” – Entrevista com Viktor Mayer-Schönberger

Professor de Governança e Regulação de Internet na Universidade de Oxford, Viktor Mayer-Schönberger é autor do premiado livro Delete: the virtue of forgetting in the digital age, com uma defesa do direito ao esquecimento. Também escreveu Big Data: como extrair volume, variedade, velocidade e valor da avalanche de informação cotidiana, traduzido para o português (leia em inglês aqui). Em seu livro mais recente, Reinventing Capitalism in the Age of Big Data, de 2018, Mayer-Schönberger, afirma que os dados estão substituindo o dinheiro como condutor do mercado e que um mercado rico em dados pode nos fazer concentrar em tarefas realmente humanas e deixar atividades repetitivas para decisões automatizadas. Confira a entrevista:

 

 

DIGILABOUR: O que significa realmente reinventar o capitalismo na era do Big Data?

VIKTOR MAYER-SCHÖNBERGER: O argumento principal do livro é o de que os mercados são mecanismos fenomenalmente capazes e resilientes de coordenação social. Mas, para que os mercados funcionem bem, muita informação precisa fluir. Na era analógica, isso era impossível, e por isso precisávamos diminuir a necessidade de fluxos de informação reduzindo todas as nossas preferências e necessidades em números únicos, o preço, para uma comparação simples e direta. Isso funcionou, mas somente até certo ponto – reduzir a complexidade do mundo a um único número obviamente omite detalhes e pode levar a decisões erradas. É por isso que os mercados nunca atingiram seu potencial. Mas na era dos dados, agora podemos trocar informações ricas e abrangentes sobre nossas preferências e traduzi-las em ações, graças à inteligência artificial, por exemplo. Isso leva a melhores combinações. Finalmente conseguimos o que realmente queremos, e não apenas o que é mais barato nos mercados. Como resultado, os mercados finalmente atingem todo o seu potencial de coordenação humana. Mas isso significa que preço e dinheiro se tornam menos importantes. Nós ainda pagamos com dinheiro, mas o pagamento é um negócio de commodities. Da mesma forma, as empresas sentirão a pressão porque sua eficiência não acompanhará a do mercado. Isso significa o fim da empresa tradicional e enorme que dominou o século XX.

 

DIGILABOUR: O que você tem a dizer sobre o Big Data no mundo do trabalho?

MAYER-SCHÖNBERGER: O Big Data nos permite fazer melhores decisões. Isso oferece uma enorme vantagem, porque a melhoria na tomada de decisões afeta muitos aspectos de nossas vidas cotidianas. Mas a tomada de decisões é algo que vemos como uma função profundamente humana. Afinal de contas, muito do trabalho manual já é automatizado há bastante tempo. Há um cálculo nisso tudo. Nós humanos acreditamos sermos imunes à automação em áreas de gestão, especialmente em relação à tomada de decisões. Se o Big Data e a inteligência artificial automatizarem a tomada de decisões também, isso colocará em risco as tarefas intermediárias de gestão, que se concentram em tomadas de decisão de rotina.

 

DIGILABOUR: Você fala em mercados ricos em dados. Como isso nos impacta?

MAYER-SCHÖNBERGER: Mercados ricos em dados são mercados em que informações ricas e abrangentes sobre preferências e necessidades podem ser trocadas e traduzidas a partir de decisões a baixo custo e com alta precisão. Os mercados ricos em dados são o oposto dos mercados baseados em preços, nos quais há pouca informação além do preço. Com mercados ricos em dados, poderemos escolher se queremos resolver um problema ou delegar uma decisão à inteligência artificial. Isso nos libera para nos concentrarmos nas decisões que realmente importam para nós seres humanos.

 

DIGILABOUR: Podemos dizer que você é um otimista em relação ao uso de dados e algoritmos em nossa vida cotidiana…

MAYER-SCHÖNBERGER: Não tenho certeza se sou otimista. Em Reinventing Capitalism in the Age of Big Data, eu pinto uma imagem muito obscura e sombria de um mundo que poderia ser dominado por poucas e grandes superstars mundiais, com uma ausência generalizada de inovação. É um mundo que é vulnerável e pode quebrar como um todo. Assim, há enormes desafios à medida que organizamos mercados ricos em dados e precisamos garantir que eles sejam descentralizados na estrutura. Mas, se acertarmos isso, sou um otimista mesmo: desta forma, o mundo se tornará mais humano, pois seremos capazes de nos concentrar em tarefas realmente humanas e deixaremos as repetitivas para as máquinas.

A Invisibilidade do Trabalho de Dados: entrevista com Jérôme Denis

Donnees.indd

Nem só inovação e democracia, nem só reforço de desigualdades: os dados precisam ser estudados a partir de seus métodos reais de produção e circulação. Esse é o ponto de partida do livro Le travail invisible des données: eléments pour une sociologie des infrastructures scripturales, de Jérôme Denis, professor de sociologia da MINES ParisTech, lançado em 2018. Para ele, é preciso ressaltar os processos produtivos por trás dos dados. Os dados não caem do céu e o trabalho por trás deles é invisibilizado.

Confira a entrevista de Jérôme Denis ao DigiLabour:

 

DIGILABOUR: O que é o trabalho de dados e por que esse trabalho é invisível?

JÉRÔME DENIS: O termo “trabalho de dados” enfatiza todas as operações que são executadas antes do uso dos dados: tudo o que permite, em um determinado momento e local, que os dados existam e sejam processados. Essas operações podem ser muito variadas: limpeza, formatação, apreensão, configuração, entre outras. É no final dessas operações que os dados são “obtidos”, como diz Latour sobre as práticas científicas. Na maioria dos casos, esse trabalho é invisível para quem usa os dados. Há muitas razões para isso. A principal encontra-se, provavelmente, no modo de existência dos dados. Na ciência, por exemplo, muitos sociólogos e historiadores têm mostrado que os dados têm estabelecido sua força ao preço de apagar as condições de sua produção. Supõe-se que os dados sejam o ponto de partida para a atividade de conhecimento, o primeiro material de informação. Isso é evidenciado por metáforas que têm surgido com a emergência de métodos de big data e programas de dados abertos. Os dados são apresentados como recursos ou elementos naturais: “o petróleo do século XXI” ou dados que aparecem como se fossem um “dilúvio”. Eles estão sempre “lá”. Essa invisibilidade não é obrigatória. Poderia ser de outra forma, mas ela está presente e contribui centralmente para as dificuldades enfrentadas pelos trabalhadores de dados, bem como seus usuários.

 

DIGILABOUR: Quais as principais diferenças no trabalho de dados em um banco e em uma startup?

DENIS: Eu uso esses dois estudos de casos para destacar dois aspectos centrais do trabalho de dados. No caso do banco, considera-se que os dados estejam presentes nos arquivos que os clientes preenchem nas agências, e que as pessoas responsáveis por verificar esses dados e inseri-los nos sistemas de informação estejam fazendo um trabalho simples e que pode ser automatizado em curto prazo. A suposição aqui é a de que os dados circulam de maneira fluida de um ponto a outro em uma organização. Nossa pesquisa etnográfica mostra que essa visão não só está em desacordo com a atividade dos caixas de banco como também impede operações de ajuste das situações. Mas é essa visão que dita os termos do gerenciamento do trabalho no banco. Já a startup procura obter o que imagina ser os dados das pessoas numa cidade. Isso ilustra outro pressuposto sobre os dados: sua disponibilidade e sua própria existência. O trabalho de dados aparece aqui como uma obrigação. As informações existentes nas prefeituras sobre infraestruturas de ciclovias não podem ser considerados como dados pelos responsáveis pela startup. Para fazer existir esses dados, temos que concordar em gerá-los, o que já está sendo feito em parte graças ao OpenStreetMap (projeto de mapeamento colaborativo).

 

DIGILABOUR: Você afirma que o fluxo de dados é um instrumento da organização. O que isso quer dizer?

DENIS: Um dos objetivos do livro “O trabalho invisível dos dados” era reconsiderar a afirmação recorrente de que vivemos na era dos dados, como se isso fosse uma coisa totalmente nova ou até mesmo uma revolução. Muitos livros de História mostram que as organizações modernas estruturam-se enrijecendo seus circuitos de comunicação e investindo na circulação de escrituras padronizadas dispostas em associações cada vez mais complexas. Os dados são parte de uma história antiga e formados há muito tempo. Tenho chamado isso de “infraestruturas escriturais”. A mecanização dessa circulação contribuiu para a invisibilização do trabalho que torna tudo isso possível.

 

DIGILABOUR: O que seria o neopositivismo de dados e quais suas características?

DENIS: O neopositivismo de dados consiste em dar aos dados valores intrínsecos de neutralidade e mesmo de evidência. Essa é uma expressão um tanto caricatural, mas que aponta para uma tendência recente de se esquecer que os dados são sempre produzidos sob condições específicas, em torno de problemas particulares e que seu compartilhamento e reuso sempre exigem transformações e ajustes. No final do livro, tento mostrar que, em contraponto a esse positivismo, podemos adotar uma definição transacional de dados. Eles não são “coisas” identificáveis de antemão, mas o resultado de um processo de produção e troca.

 

DIGILABOUR: E no que consiste essa definição transacional de dados?

DENIS: Adotar uma definição transacional de dados é substituir a questão abstrata “o que são dados?”, para a qual não há nenhuma resposta consensual, pela pergunta concreta: “quando é um dado?”. Isso quer dizer que, em alguns casos, os dados são “obtidos”, no sentido de Latour, mas também são “dados”, como ponto de partida, em outros casos. Isso ajuda a entender, por exemplo, que uma foto é um documento para alguns, enquanto pode ser um dado para outros. Essa é uma postura agnóstica, que se recusa a defender uma posição normativa em relação à natureza dos dados, mas permite, por outro lado, estar atento ao que conta como um “dado” em uma ou outra situação particular. E a ideia do livro é dizer que, em geral, o que conta como um dado é definido no mesmo movimento em relação ao que conta como trabalho.

DIGILABOUR: Quais os riscos da invisibilização do trabalho de dados?

DENIS: O apagamento do trabalho de dados tem dois riscos principais. Em primeiro lugar, reforça as dificuldades daqueles que trabalham com isso, como o caso do banco. Assumir que as operações necessárias para a existência e a circulação de dados são triviais e não envolvem trabalho real leva a situações muito delicadas em que os trabalhadores estão constantemente lutando para realizar seu trabalho, apesar dos constrangimentos. Isso, então, pesa na qualidade dos dados e na pertinência de sua utilização. Em segundo, considerar os dados como se tivessem caído do céu, não se dar ao luxo de entender as condições de sua fabricação e os ajustes necessários à sua circulação é fazer dos dados caixas pretas que não controlamos.

 

Você pode conferir outra entrevista do autor aqui (em francês) e outros textos em inglês aqui e aqui.