Fluxo de coleta
O fluxo do DiariosBR segue quatro etapas principais:
- Coleta: acesso a fontes oficiais por HTML, PDF ou API.
- Extracao: identificacao de links, datas e metadados minimos.
- Normalizacao: padronizacao de campos e nomes.
- Armazenamento: salvamento de arquivos e registros estruturados.
Veja mais detalhes em Metodologia e em Estrutura dos arquivos.