O que é o Crivo?



O produto chamado Crivo tem como objetivo investigar métodos de detecção automática de informações falsas na web, escritas em português, e usar os indícios encontrados para posterior checagem de textos por algoritmos (códigos de programação). Ele faz parte do Trabalho de Conclusão de Curso da graduanda Cristiane Schwinden, com orientação da professora Lia Seixas, na instituição FACOM - UFBA.

Um dos corpora que utilizamos para análise foi o corpus Fake.br (Monteiro et al., 2019), tanto em sua versão integral com 7.200 notícias, das quais exatamente 3.600 verdadeiras e 3.600 falsas, quanto o subcorpus gerado após tratamento de Ulisses Melo para sua dissertação em 2002, que o reduziu a 800 textos. O corpus Fake.br é resultado de uma coleta manual dos pesquisadores, incluindo seus títulos, no período de janeiro de 2016 a janeiro de 2018 em 4 sites: Diário do Brasil (3.338 notícias), A Folha do Brasil (190 notícias), O Jornal Brasil (65 notícias) e Top Five TV (7 notícias). Traz temas que estavam em discussão naquele período (Lava jato, Moro, Odebrecht, Dilma, Temer, Trump…). Por conta dessa defasagem temporal do corpus Fake.br (de 2016 a 2018), construímos um segundo corpus, com 50 textos consideradas falsos por sites de checagem em 2023, e também boatos encontrados em grupos de Telegram.

O início do projeto se deu na ideia de criar uma ferramenta que atribua pontuações à presença de determinados indícios/características nos textos e sua frequência multiplicativa (quantidade de ocorrências por texto vezes seu peso), esta pontuação seria uma indicação de possibilidade do texto se tratar de conteúdo enganoso ou não, dentro de um espectro definido (um ponteiro que simula um velocímetro, que vai de 0 a 100), ou seja, sem a taxação de verdadeiro ou falso, e sim um índice de probabilidade (score), numa escala definida. Este é o funcionamento da ferramenta antispam dos e-mails, de onde veio a inspiração para criação desta ferramenta.

Utilizar a ferramenta