NÍVEL: Intermediário
Jonathan Soma, programador e educador do Columbia Journalism School e pioneiro no uso de inteligência artificial no jornalismo, vai mostrar como lidar com um terror dos jornalistas: PDFs com formatos ruins. Para isso ele vai usar uma biblioteca amigável em Python que desenvolveu, Natural PDF, para trabalhar com PDFs, desenvolvida com base no pdfplumber. O Natural PDF permite que você localize e extraia conteúdo de PDFs usando um código simples. Junto Soma também vai mostrar como a IA pode ser usada para analisar PDFs e outros documentos.