Para aumentar ou diminuir a fonte:
DESKTOP: utilize os atalhos Ctrl+ (aumentar) e Ctrl- (diminuir) no seu teclado.
CELULAR: faça o movimento de pinça.
FECHAR
cores originais
mais contraste
A+
SOBRE
MEMÓRIAS
PROGRAMAÇÃO
PALESTRANTES
NOTÍCIAS
PATROCINADORES
FAQ
NEWS (EN)
INSCREVA-SE
LOGIN
Home > Notícias > Domingo de Dados 2025: Abraji recebe apoio do R Consortium e da Python Software Foundation

Domingo de Dados 2025: Abraji recebe apoio do R Consortium e da Python Software Foundation

O Domingo de Dados acontece no dia 13 de julho

undefined
Data de publicação: 01/07/2025
Autoria: Abraji

O Domingo de Dados – dia dedicado ao jornalismo de dados no Congresso Internacional de Jornalismo Investigativo da Abraji – receberá, em 2025, o apoio pela segunda vez do R Consortium e pela primeira vez da Python Software Foundation (PSF). Essas parcerias internacionais reforçam valores centrais das duas organizações, como inovação, diversidade, literacia em dados e acessibilidade. 

O R Consortium, por exemplo, estabelece Inclusão, Diversidade, Equidade e Acessibilidade (conhecido pela sigla IDEA) como valores fundamentais da comunidade R, reconhecendo que diversidade e inclusão são pilares cruciais para fomentar inovação e criatividade no ecossistema de código aberto. Já a PSF tem como missão promover e proteger a linguagem Python e “apoiar o crescimento de uma comunidade diversificada e internacional de programadores Python”, incentivando a participação de todos os perfis na comunidade global. Ambos os órgãos mantêm programas de grants que apoiam eventos, workshops e iniciativas educativas pelo mundo, buscando equidade geográfica e priorizando comunidades pouco atendidas – alinhamento perfeito com a proposta do Domingo de Dados no Brasil.



R e Python são linguagens de programação de código aberto que se tornaram pilares da análise de dados moderna: R, criada na década de 1990 por estatísticos da Universidade de Auckland, foi desenhada para estatística e visualização e hoje oferece ecossistemas robustos como tidyverse, ggplot2 e tidymodels; Python, lançada em 1991 por Guido?van?Rossum, é uma linguagem multiparadigma conhecida por sintaxe legível e vasto repositório de bibliotecas, liderando o desenvolvimento de IA com frameworks como pandas, scikit?learn, TensorFlow e PyTorch.


Juntas, elas impulsionam boa parte da infraestrutura tecnológica contemporânea — da ciência de dados em empresas e universidades à engenharia de machine learning em grandes plataformas — e, no jornalismo de dados, permitem raspagem de sites, limpeza e cruzamento de bases públicas, modelagem estatística, automação de reportagens e criação de visualizações interativas, fortalecendo investigações baseadas em evidências, transparência e reprodutibilidade nas redações.

Um dia para capacitação em dados com diversidade e alcance nacional

Realizado no último dia do congresso anual da Abraji, o Domingo de Dados é um dia inteiro dedicado exclusivamente a oficinas de jornalismo de dados, com atividades que abrangem ferramentas de programação (R, Python), estatística aplicada, visualização de dados, cobertura eleitoral e técnicas de Open Source Intelligence (OSINT). O objetivo desde a criação do evento é reunir a comunidade brasileira de jornalistas de dados e apresentar essa modalidade investigativa a todos os interessados, independentemente do nível de experiência. Em outras palavras, trata-se de promover literacia de dados nas redações brasileiras, tornando acessível o uso de códigos e análises avançadas até para profissionais sem bagagem técnica.

A cada edição, o Domingo de Dados vem crescendo em público e escopo. No congresso de 2024, por exemplo, a Abraji bateu recorde de público e ampliou a diversidade de temas e participantes; e a meta para 2025 é tornar o evento ainda mais inclusivo e acolhedor. Isso se reflete tanto na presença de convidados internacionais – em 2025 estarão no evento nomes como Jonathan Soma (Columbia Journalism School) e Fernanda Aguirre (The Examination), conectando o jornalismo brasileiro ao debate global sobre transparência e ciência de dados – quanto em iniciativas concretas de inclusão.


Este ano, com o aporte do R Consortium e da PSF, a Abraji poderá expandir seu programa de bolsas de diversidade, que patrocinará a vinda de ao menos 30 mulheres negras de todas as regiões do Brasil para participar dos quatro dias do congresso, fortalecendo a representatividade no público. Também foi atualizado o código de conduta do evento, reafirmando o compromisso com um ambiente respeitoso e seguro para todos os participantes.

Outro valor compartilhado pelos apoiadores e pela Abraji é a inovação. A programação do 20º Congresso (que acontece de 10 a 13 de julho de 2025, em São Paulo) foi desenhada para combinar conhecimento técnico de ponta, pensamento crítico e diversidade de perspectivas.


No Domingo de Dados (13 de julho de 2025, das 9h30 às 18h), os participantes encontrarão atividades para todos os níveis de experiência, dos iniciantes aos profissionais avançados. Serão sete laboratórios simultâneos com oficinas práticas e painéis, organizados em trilhas temáticas que facilitam a escolha conforme o interesse e o nível de conhecimento.


Essa estrutura garante que ninguém fique de fora: quem nunca codificou poderá dar os primeiros passos, enquanto quem já domina ferramentas de análise de dados encontrará oficinas desafiadoras para aprimorar suas habilidades. Conforme destaca Reinaldo Chaves, coordenador de projetos da Abraji, a proposta é apresentar novas técnicas e fortalecer a comunidade local de jornalismo de dados, trazendo para o Brasil ferramentas que “já são realidade em diversos países, contribuindo para a melhoria do jornalismo”.



Trilha R: do básico à investigação aprofundada

Por causa de sua proximidade com a estatística, a linguagem R tem sido uma das portas de entrada de jornalistas no universo da ciência de dados, permitindo elevar o nível das apurações investigativas com análises quantitativas mais robustas. Em 2025, o Domingo de Dados contará novamente com uma trilha integral dedicada ao R, graças ao apoio continuado do R Consortium. Após o sucesso do ano passado – quando mais de 30 jornalistas acompanharam o circuito completo de aprendizagem em R, do início ao fim – a Abraji repetirá e expandirá a experiência. Serão seis horas de imersão divididas em quatro módulos ao longo do dia, combinando teoria e prática com enfoque nas necessidades de uma redação.

A programação dedicada à linguagem R foi redesenhada para conduzir o participante de zero ao nível de produzir pautas baseadas em evidências em um único dia. O bootcamp R – do primeiro passo à primeira pauta (partes?1 e?2) abre a manhã com duas co-organizadoras do R-Ladies São Paulo, capítulo local de um movimento voluntário globa de inclusão de minorias de gênero na tecnologia: Ana?Carolina?Moreno, diretora da Abraji, e Jade?Maré, head de transformação digital do Greenpeace Brasil, mostram como instalar R e RStudio, entender lógica de programação e usar as funções essenciais do tidyverse para limpar, sumarizar e visualizar dados inspirados em reportagens já publicadas. Ao fim da primeira metade do dia, quem nunca codificou terá executado consultas simples e gerado tabelas ou gráficos prontos para entrar em uma matéria.

A tarde avança com reportagens de dados usando R: atalhos para acessar dados públicos (partes?1 e? 2). Jade?Maré retorna ao lado de Rafael?Pereira, pesquisador sênior e chefe de ciência de dados do Ipea, criador dos pacotes censobr (acesso ao Censo Demográfico do IBGE) e geobr (malhas geográficas oficiais). Eles mostram como baixar, tratar e juntar essas bases em segundos, revelando cases em que os pacotes serviram de base para grandes reportagens.


O grupo R?Ladies SP estará presente como mentoria de plantão, ajudando os participantes a testar hipóteses próprias e esboçar leads aproveitando os dados explorados. Essa sessão exige familiaridade básica com R — fornecida pela manhã — e fecha o ciclo apresentando um caminho completo: captura, análise, visualização e geração de story ideas a partir de dados públicos brasileiros. 

Além de um laboratório inteiramente dedicado à introdução ao R, participantes que já tiveram contato inicial com a linguagem poderão participar da oficina “Do QGIS para o R: respondendo perguntas cartográficas”. As jornalistas Cecilia?do?Lago e Cindy?Damasceno (Estadão) introduzem conceitos de raster e vetor, explicam as diferenças entre dados geoespaciais e demonstram, passo a passo, como migrar fluxos de trabalho do QGIS para o R — usando pacotes como sf e terra para cruzar bases territoriais, criar mapas temáticos e responder perguntas do tipo “quantos hectares de desmatamento ocorreram em unidades de conservação federais nos últimos cinco anos?”.

Além de demonstrar na prática o uso dessas ferramentas (por exemplo, para obter informações socioeconômicas de municípios ou mapear indicadores em regiões específicas), o instrutor compartilhará casos reais de reportagens que foram viabilizadas graças a análises com esses pacotes. Essa atividade final permitirá aos participantes vislumbrar o potencial do R em extrair histórias dos dados oficiais, reforçando por que investir na capacitação em R pode render frutos valiosos: não raramente, as habilidades adquiridas nessas oficinas se traduzem em matérias que exponham políticas públicas problemáticas, esquemas de fraude ou outros riscos à democracia, ajudando a fiscalizar o poder e reduzir desigualdades.

Programação diversificada em Python e outras tecnologias de dados

Em paralelo à trilha de R, o Domingo de Dados 2025 trará uma rica oferta de oficinas focadas em Python e no uso de tecnologias abertas para turbinar investigações jornalísticas. A Python Software Foundation, ao apoiar o evento pela primeira vez, contribui para ampliar essas atividades e reforçar a presença da linguagem Python como aliada das redações. A seguir, destacamos algumas das sessões programadas na trilha de Python e tecnologia de dados:



  • “Só o código salva: como o Python pode te ajudar a fazer investigações” (Partes 1 e 2) – Oficina introdutória, dividida em duas partes, voltada a participantes que nunca programaram. Ensina na prática os fundamentos da linguagem Python (variáveis, estruturas de repetição, condicionais) e técnicas básicas de análise e cruzamento de dados, sempre com exemplos reais. A atividade é toda construída em cima de um caso de uso verídico: o código utilizado em uma apuração jornalística que revelou que foragidos da Justiça se candidataram nas eleições de 2024. Os alunos verão, passo a passo, como o uso de Python pode ampliar as possibilidades de investigação e fortalecer o jornalismo de dados. Instrutora: Judite Cypreste, jornalista de dados no portal g1 e integrante do PyLadies, especialista em jornalismo investigativo pela Columbia University.
     

  • “Como rastrear aeronaves brasileiras usando dados da Anac, OSINT e Python” – Mostra como combinar dados públicos e programação para monitorar o tráfego aéreo de forma investigativa. A oficina explora metodologias de Open Source Intelligence (OSINT) desenvolvidas por pesquisadores como Logan Williams (Bellingcat) para facilitar o flight tracking de voos no mundo todo, e apresenta ferramentas em Python criadas pela própria instrutora para agilizar a análise desses dados. Os participantes aprenderão a usar a tecnologia ADS-B – um sistema de vigilância automática de aeronaves, sucessor dos radares convencionais – juntamente com dados abertos da Anac (Agência Nacional de Aviação Civil) para conseguir rastrear aeronaves do Brasil em tempo real. Instrutora: Fernanda Aguirre, jornalista de dados, The Examination.
     

  • “Como entrevistar os piores PDFs do planeta?” (Parte 1 e 2) – Em três horas de treinamento (divididas em duas partes), Jonathan Soma – programador, educador da Columbia Journalism School e pioneiro no uso de inteligência artificial no jornalismo – ensinará a lidar com um dos maiores pesadelos dos jornalistas de dados: os documentos em PDF de formato ruim. Usando uma biblioteca Python desenvolvida por ele chamada Natural PDF (baseada no pdfplumber), Soma mostrará como localizar e extrair conteúdo de PDFs complicados por meio de código simples. Além disso, o workshop demonstrará como técnicas de IA generativa podem ser aplicadas para analisar PDFs e outros documentos, automatizando parte do trabalho de extração e resumo de informações. Conhecimento intermediário de programação recomendado.
     

  • “Visualização de dados com bibliotecas Python” – Oficina voltada a visualização interativa de dados de forma rápida e eficaz, utilizando bibliotecas Python modernas. Na primeira parte, os participantes serão introduzidos ao framework Dash (baseado em Plotly) e à biblioteca Altair, aprendendo a construir gráficos dinâmicos e painéis interativos com poucas linhas de código. Em seguida, a oficina aborda princípios fundamentais de design em visualização de dados, mostrando como adaptar elementos visuais para comunicar informações com clareza, coerência e impacto, seguindo boas práticas da área. Os alunos sairão aptos a criar gráficos atraentes e dashboards básicos para uso jornalístico. Requisito: conhecimento básico de Python. Instrutora: Karina Custódio, Jornalista especializada em jornalismo de dados automação e data storytelling.
     

  • “Introdução à raspagem de dados: APIs e dicas para projetos iniciantes (com e sem programar em Python)” – Esta oficina oferece uma porta de entrada acessível ao ecossistema de tecnologia cívica e data journalism, combinando fundamentos de programação com aplicações concretas na coleta de dados públicos. Serão abordados tópicos como o uso de bibliotecas Python para web scraping (por ex: Beautiful Soup, requests e Pandas), boas práticas em requisições HTTP, criação de APIs simples com FastAPI, e estratégias para descobrir e utilizar APIs públicas já existentes. Para quem ainda não programa, também serão apresentadas ferramentas no-code e dicas de como começar pequenos projetos de raspagem. Além da parte técnica, a oficina discutirá aspectos éticos e desafios reais enfrentados em projetos de dados abertos, destacando aprendizados do projeto brasileiro Legisla.Tech. Instrutor: Henrique Rieger, desenvolvedor e ativista de dados cívicos, Núcleo Jornalismo.
     

  • “Codesinfo: inovação e código aberto no combate à desinformação” – Este painel mergulha na primeira edição do projeto Codesinfo, uma iniciativa do Projor (Instituto para o Desenvolvimento do Jornalismo) que desenvolveu cinco soluções inovadoras de código aberto para serem adotadas por redações de qualquer porte no enfrentamento da desinformação. Serão apresentadas as cinco ferramentas criadas pelo projeto: (1) um chatbot que fornece informações confiáveis sobre mudanças climáticas, para checagem de boatos ambientais; (2) uma ferramenta que detecta desinformação em anúncios publicitários de saúde; (3) uma biblioteca Python capaz de gerar vídeos curtos automaticamente a partir de textos (facilitando a criação de conteúdo audiovisual para redes sociais); (4) um plugin de WordPress que agrega e exibe dados detalhados sobre autores e fontes citados em notícias; e (5) um mini CMS para inserir “cartões contextuais” em sites jornalísticos, permitindo adicionar informações de contexto ou verificações diretamente nas páginas de notícias. Os participantes poderão conhecer de perto cada solução, entender seu desenvolvimento e avaliar como implementá-las em suas próprias organizações de mídia.
     

  • “Hackeando o PowerBI: truques para abrir dados de dashboards (com e sem programar em Python)” – Muitos órgãos públicos disponibilizam informações em painéis interativos online (como os desenvolvidos em PowerBI ou Tableau) que não oferecem opção de download dos dados brutos, limitando o acesso a informações detalhadas. Nesta oficina, Augusto Conconi (The Journalism Company) apresentará uma abordagem prática para contornar essas barreiras e extrair dados “invisíveis” que estão apenas apresentados nas visualizações. Com uma combinação de técnicas manuais e uso de scripts em Python, os participantes aprenderão a identificar as fontes de dados por trás de dashboards públicos e a transformar esses dados em bases utilizáveis para reportagens e investigações. A oficina traz exemplos reais de como driblar limitações técnicas e obter informações que, embora públicas, não estão facilmente acessíveis aos jornalistas.
     

  • “Classificação automática de texto e imagens com modelos de IA de código aberto” – Nesta atividade de caráter mais conceitual e exploratório, os jornalistas terão a oportunidade de conhecer os potenciais e limitações do uso de modelos de Inteligência Artificial abertos (disponibilizados pela comunidade) para tarefas de classificação automática. Serão apresentados exemplos de modelos de machine learning e deep learning que podem ser empregados para classificar textos ou identificar elementos em imagens, com destaque para ferramentas open-source que não dependem de APIs pagas ou proprietárias. A oficina oferecerá uma base teórica sobre como esses modelos funcionam e um guia prático para avaliar a adequação deles em projetos jornalísticos, discutindo casos de uso em que a IA ajudou (ou falhou) na automatização da análise de grandes volumes de conteúdo. Recomendado conhecimento básico em programação. Adriano Belisário (Jornalista e consultor do Joint Data Center on Forced Displacement).
     

  • “Investigando dados ambientais: compliance e anticorrupção” - Partindo do diagnóstico do relatório Dados Abertos e Combate a Crimes Ambientais (Transparência Internacional?Brasil, Abraji e ICV), que detectou grau médio de abertura de apenas 51?% em 41 bases ambientais, a oficina mostra como a falta de transparência favorece fraudes e lavagem verde. Divide?se em quatro blocos: (1) panorama sobre a conexão entre crimes ambientais, corrupção e ESG; (2) navegação guiada por portais como PRODES/DETER, DOF?Autex, SIGMINE e Lista Suja do Trabalho Escravo; (3) exercício prático, com ou sem programação, usando Python e ferramentas de IA para filtrar e cruzar dados, sempre alertando sobre limitações como viés e alucinações; (4) debate final sobre próximos passos de investigação. Instrutores: Renato?Morgado (Transparência Internacional?Brasil) e Reinaldo?Chaves (Abraji).


Fortalecendo a inovação e a diversidade no jornalismo brasileiro

Com o apoio do R Consortium e da Python Software Foundation, o Domingo de Dados 2025 consolida-se como um espaço de inovação e capacitação fundamental para o jornalismo brasileiro. A presença dessas entidades não apenas viabiliza financeiramente a realização de oficinas de alta qualidade, como também simboliza um reconhecimento internacional dos esforços da Abraji em espalhar a cultura de dados, código aberto e transparência nas redações. 
 




Em sua 20ª edição, o Congresso Internacional de Jornalismo Investigativo da Abraji já se firmou como um dos maiores eventos de jornalismo do mundo, e o Domingo de Dados, em particular, tornou-se um símbolo do avanço da reportagem guiada por dados (Data-Driven Journalism) no país. Ao proporcionar treinamento prático em R e Python – duas linguagens gratuitas e amplamente adotadas – para jornalistas de todos os cantos do Brasil, a Abraji ajuda a democratizar o acesso a ferramentas sofisticadas de apuração. Essa iniciativa ecoa diretamente os valores de diversidade e acessibilidade promovidos pelos patrocinadores: é a ideia de que qualquer jornalista, não importando sua origem ou redação, pode aprender novas habilidades e contribuir com pautas mais investigativas e embasadas em evidências.

Em última instância, investimentos em formação como o Domingo de Dados produzem benefícios que transbordam o âmbito individual. Cada repórter capacitado em dados passa a ter condições de revelar histórias antes escondidas em planilhas, bancos de dados ou códigos – seja desvendando irregularidades em políticas públicas, esquemas de corrupção, desigualdades sociais ocultas ou inúmeras outras pautas de alto impacto público.


Ao apoiar pelo segundo ano esse esforço, o R Consortium reforça sua missão de fortalecer a comunidade R global e local, enquanto a Python Software Foundation se junta como nova parceira alinhada à visão de um ecossistema Python mais diverso e espalhado pelo mundo. Para o público e a comunidade jornalística, o resultado tangível será um Domingo de Dados 2025 ainda mais rico em conteúdo, diverso em vozes e transformador na carreira de muitos profissionais. Em resumo, essa colaboração inédita entre Abraji e as fundações de R e Python mostra que inovação e inclusão andam de mãos dadas – e que, com os recursos certos, é possível empoderar jornalistas com conhecimentos de ponta para melhor cumprir a missão de informar e esclarecer a sociedade.

Serviço – 20º Congresso Internacional de Jornalismo Investigativo: O evento acontece de 10 a 13 de julho de 2025 em São Paulo (SP), no campus Álvaro Alvim da ESPM. O Domingo de Dados ocorre em 13 de julho (último dia), das 9h30 às 18h, com venda de ingressos separada. Inscrições e mais informações: site oficial do congresso.

Veja como se inscrever e mais detalhes de toda a programação em https://congresso.abraji.org.br/ 


Patrocinam o 20º Congresso: John S. Knight Fellowships, Google, Uber, World, Novo Nordisk, Cloudwalk, Transparência Internacional - Brasil, Grupo Globo, Jusbrasil, Abracom (Associação Brasileira das Agências de Comunicação), Alma Preta, Textual Comunicação, I'Max Communicate More, SBCBM (Sociedade Brasileira de Cirurgia Bariátrica e Metabólica), Itaú, AFD (Agende Française de Développement), Poder360, Projor (Instituto Para o Desenvolvimento do Jornalismo), R Consortium, ITS (Instituto de Tecnologia e Sociedade do Rio), RSF (Repórteres sem Fronteiras), Artigo 19, Python Software Foundation, Amado Mundo, Tokio Marine Seguradora, AMD (Associação dos Magistrados Brasileiros) e The Journalism Company.


São apoiadores de conteúdo: YouTube, Basília Rodrigues Comunicação, Forbidden Stories, UNAIDS, Pulitzer Center, Fundação Lemann e Revista Cenarium.


São parceiros institucionais: Fórum de Direito de Acesso a Informações Públicas, GBR Comunicação, Aberje (Associação Brasileira de Comunicação Empresarial), Coalizão em Defesa do Jornalismo (CDJor), Covering Climate Now, Chef Keila Aviano, Transmídia, Globo News, Folha de S. Paulo, Eficientes, Abert, SEJ (Society of Environmental Journalists), Agência Mural, Portal Imprensa, Jeduca (Associação de Jornalistas de Educação), Galápagos Newsmaking, DiversaCom, ANJ (Associação Nacional de Jornais), Pacto Pela Democracia e Oboré.

Capa da matéria sobre prorrogação da chamada de sugestões para o 20º Congresso da Abraji, onde se lê
Chamada de sugestões para o 20º Congresso da Abraji é prorrogada
O formulário para enviar sugestões de atividades fica aberto até o dia 28/02
undefined
Aberta a chamada de trabalhos para o XII Seminário de Pesquisa em Jornalismo Investigativo e para a Mostra Abraji de Jornalismo Investigativo para Estudantes de Jornalismo
Na 20ª edição do Congresso da Abraji, a mostra é a novidade para incentivar a produção de reportagens investigativas feitas por estudantes
undefined
20º Congresso recebe número recorde de sugestões do público para a programação
Foram 485 propostas de atividades para o evento, que acontece de 10 a 13 de julho
A imagem mostra uma palestra do 19º Congresso da Abraji, no Teatro ESPM. Ao fundo, se vê os palestrantes no palco e uma apresentação de slides que inclui um mapa e os logos dos patrocinadores e apoiadores do evento.
Inteligência Artificial e COP 30 serão destaques na programação do 20º Congresso
O evento terá atividades organizadas em trilhas temáticas, que também abordam assuntos como democracia, segurança de jornalistas, transparência e outros.
undefined
Chegou a hora! Inscrições abertas para o 20º Congresso da Abraji
Maior encontro de jornalistas do país será realizado na ESPM, em São Paulo, de 10 a 13 de julho
undefined
Inscrições abertas para bolsas destinadas a jornalistas que atuam em desertos de noticias no Congresso da Abraji
A iniciativa é inédita e as inscrições estão abertas até 18 de maio
Abraji começa a divulgar a programação do 20º Congresso
Abraji começa a divulgar a programação do 20º Congresso
Atividades confirmadas já estão disponíveis no site do evento. Confira!
undefined
Ministra Marina Silva será sabatinada no 20º Congresso da Abraji
Entrevista abordará expectativas para a COP30, políticas climáticas, entre outros temas sobre o meio ambiente
undefined
20º Congresso terá sabatina com ministro da Previdência
Entrevista com Wolney Queiroz tratará das fraudes bilionárias no INSS
Siga a Abraji nas redes sociais:
Este site usa cookies e dados pessoais de acordo com a nossa Política de Privacidade e, ao continuar navegando neste site, você declara estar ciente dessas condições.
OK