Nicholas Diakopoulos é diretor do Laboratório de Jornalismo Computacional da Universidade de Northwestern, nos Estados Unidos. Autor do livro Automating the News: how algorithms are rewriting the media, ele pesquisa automação na produção jornalística, accountability e transparênncia dos algoritmos. Diakopoulos conversou com DigiLabour e também fala sobre a importância de data literacy e pensamento computacional para os jornalistas.
DIGILABOUR: Há muitos mitos em torno do papel da automação e da inteligência artificial no jornalismo. Para alguns, um sonho. Para outros, um pesadelo. O que a sua pesquisa revela sobre a automação na produção jornalística?
NICHOLAS DIAKOPOULOS: No domínio do jornalismo, o que descobri é que a inteligência artificial é mais valiosa como complemento ao esforço humano. Isso não quer dizer que não possa substituir o esforço humano em alguns casos, ou criar novos potenciais com base em velocidade, escala ou personalização. Mas por causa de exigências de precisão e do desejo de manter alta qualidade, maior originalidade e o escopo do jornalismo, a tecnologia pode ser efetivamente implantada como um complemento para atingir esses objetivos. Em outros domínios, a IA e a tecnologia robótica podem estar mais aptas a substituir o trabalho humano e, portanto, pode haver motivos de preocupação. No entanto, na produção jornalística, muitos medos de destruição de empregos pela inteligência artificial são exagerados.
DIGILABOUR: Como os algoritmos já reescrevem as práticas jornalísticas?
DIAKOPOULOS: Praticamente todos os aspectos da produção jornalística estão evoluindo com relação a algoritmos, automação e inteligência artificial. Isso inclui produção automatizada de conteúdo, além de aplicativos na descoberta de narrativas computacionais, no desenvolvimento de newsbots e na otimização algorítmica de conteúdo para distribuição. Atualmente, estamos vendo muita automação usada em editorias como esportes, economia e eleições. Principalmente, essa é a automação baseada em regras que envolve modelos pré-estabelecidos por jornalistas de dados e depois preenchidos com dados pela máquina. Em termos de criação automatizada de conteúdo, ainda não há sistemas de aprendizado de máquina que estejam operando em produção de larga escala. Isso tem a ver principalmente com o fato de que os sistemas de geração de texto a partir de aprendizado de máquina produzem erros estatísticos que podem criar preocupações em relação à precisão na produção jornalística. Como o jornalismo tem um nível muito alto de precisão, pode levar algum tempo até vermos o aprendizado de máquina sendo usado para produção e publicação direta de matérias jornalísticas.
DIGILABOUR: Como isso tem desafiado organizações, jornalistas e universidades?
DIAKOPOULOS: Há vários desafios no uso da produção automatizada de notícias pelas organizações jornalísticas. Em primeiro lugar, isso exige um fluxo de dados limpo e constante. Portanto, se você estiver trabalhando em um domínio em que os dados não são abundantes ou muitas vezes estão sujos e exigem muita normalização e limpeza, isso limitará o uso da automação. Outro grande problema é que a automação tem algo de frágil –geralmente só funciona no domínio restrito onde foi projetada. Esse é um grande problema no jornalismo, pois o mundo é um lugar dinâmico e pode haver muitas situações que quebram os limites projetados para o sistema. Em termos de desafios mais amplos para jornalistas e universidades, acho que há muito aprendizado e desenvolvimento de habilidades que precisam acontecer para tirar proveito dessas novas ferramentas. A primeira área seria a data literacy; ser capaz de trabalhar com dados, poder criticar dados, saber de onde vêm, se têm qualidade e integridade, se estão atualizados, porque as ferramentas de automação dependem muito dos dados. Por exemplo, se você possui dados tendenciosos que chegam ao seu sistema de aprendizado de máquina, você está acabará trazendo um modelo estatístico tendencioso. A segunda área seria o pensamento computacional, entendendo como resolver problemas na área de programação. Não estou afirmando que todos os jornalistas precisam saber como programar, mas precisam entender o que pode ser realizado com os códigos e compreender como seu problema específico em uma reportagem pode ser formulado de forma a permitir que um colaborador codifique algo. A terceira área é o que você pode chamar de pensamento estatístico avançado. Novamente, eu definitivamente não diria que todos os jornalistas precisam saber disso, mas acho que um pequeno número de jornalistas computacionais de elite deve realmente dominar o aprendizado avançado de máquinas e a metodologia estatística, para que possam inovar e impulsionar projetos em direções totalmente novas.
DIGILABOUR: O que você chama de accountability algorítmica e como os jornalistas podem se envolver com isso?
DIAKOPOULOS: Os softwares e algoritmos passaram a governar e influenciar aspectos importantes de nossas vidas, incluindo tudo, desde personalização de mecanismos de pesquisa e sistemas de publicidade até avaliação de professores, bancos e finanças, campanhas políticas e vigilância policial. Mas esses algoritmos podem cometer erros. Eles têm preconceitos. No entanto, eles são tratados como caixas negras opacas, por seu funcionamento interno, seus “pensamentos” ocultos atrás de camadas de complexidade. Como jornalistas, precisamos entrar nessa caixa preta, entender como os algoritmos podem exercer poder sobre nós, entender onde eles podem estar cometendo erros injustos e identificar as pessoas nesse complexo sistema sociotécnico para que possam ser responsabilizadas. A accountability algorítmica tenta resolver esse problema, propondo métodos práticos que os jornalistas podem empregar com base em sistemas de auditoria e crítica para utilizar na investigação de algoritmos.