Skip to content

Fluxo de coleta

O fluxo do DiariosBR segue quatro etapas principais:

  1. Coleta: acesso a fontes oficiais por HTML, PDF ou API.
  2. Extracao: identificacao de links, datas e metadados minimos.
  3. Normalizacao: padronizacao de campos e nomes.
  4. Armazenamento: salvamento de arquivos e registros estruturados.

Veja mais detalhes em Metodologia e em Estrutura dos arquivos.