Normalizacao e formatos
Os registros coletados sao normalizados para garantir consistencia entre fontes.
Padroes tipicos:
- Identificacao da fonte e localidade.
- Data de publicacao e periodo.
- Link de origem e caminho do arquivo salvo.
Os formatos mais comuns de saida sao JSON, PDF e HTML.