Skip to content

Atividades Realizadas

Confira abaixo o registro completo das atividades de desenvolvimento, coleta e manutenção do projeto DiáriosBR.

DataAtividades RealizadasParticipantes
09/03/2023Planejamento para o primeiro semestre de 2023; inicio da indexação dos pdfsBruno, João Mateus e Rafael
14/12/2022Inclusão de São José da Boa vista e Ituverava; inicio coleta OrlândiaJoão Mateus e Rafael
06/12/2022Inicio da coleta de Buritizal e estruturação da tabela dos municípios do projetoJoão Mateus, Bruno Tebet e Rafael
08/11/2022Inicio da coleta do segundo conjunto de cidadesJoão Mateus, Maria Eduarda e Rafael
01/11/2022Revisão e reestruturação do readme e da documentaçãoMaria Eduarda e Rafael
25/10/2022Extração dos metadados do segundo conjunto de municípiosJoão Mateus, Maria Eduarda e Rafael
14/10/2022Inicio da extração do segundo conjunto de cidadesJoão Mateus, Bruno, Vitório e Rafael
04/10/2022Estruturação da coleta do segundo conjunto de municípiosVitório, Rafael, Bruno e João Mateus
27/09/2022Inicio da coleta do segundo grupo de municípiosJoão Mateus e Rafael
16/09/2022Inserção da extensão do coleta pdf, apontamento da quantidade de página de cada município, ajuste no update para upsert e inicio da coleta das cinco primeiras cidadesJoão Mateus, Rafael e Vitório
10/08/2022Coleta dos PDFs a partir das informações do banco jsonMateus, Rafael, Júlia, Bruno
02/08/2022Ajuste no script acessar_pagina_selenium e início da montagem do fluxogramaMateus, Rafael, Júlia e Vitório
05/07/2022Estruturação do script info_geral para acessar as informações gerais de cada municípioJoão Mateus, Rafael, Júlia e Bruno
30/06/2022Criação de json com informações gerais dos municípios a partir do código do ibgeJoão Mateus, Rafael, Júlia
28/06/2022Definição da utilização dos códigos dos municípios do ibge; criação da função codigo_ibge; criação das variáveis de ambienteRafael, Júlia
21/06/2022Estruturação das variáveis de ambiente e informações gerais de cada município coletadoJoão M., Rafael, Júlia e Bruno
14/06/2022Ajustes dos metadados coletados: numero da edição, categoria (ordinário e extraordinário); inserção de novos metadados (origem_lower e cod_tom_serpro)Júlia e Rafael
07/06/2022Reestruturação do código em que utilizamos o selenium para a coletaBruno, João M., Júlia e Rafael
21/05/2022Reestruturação do código de coleta - utilizar funções comuns para várias cidadesRafael, Júlia, Bruno
10/05/2022Ituverava - ajustes json e começando a coletar códigos das cidadesRafael, Júlia
02/05/2022Ajustes Selenium e organização das publicaçõesRafael, Júlia, João Ferreira, Bruno, Vitório
12/04/2022Revisão e Reestruturação do código de coletaRafael, Júlia, João Ferreira, Bruno
05/04/2022Orlândia - Inicio de ajuste das variáveis entre todas as cidadesRafael, Júlia, Vitório, João Ferreira, Bruno
05/04/2022Ituverava - Ajustes nos metadados e estruturação para coletar os arquivos pdfRafael, Júlia, Vitório, João Ferreira, Bruno
30/03/2022Orlândia - Início da documentação da coleta e da estruturação final para coleta completaVitório, Rafael, Júlia
23/03/2022SJoaquimdaBarra - Reestruturação do código e inicio da coleta dos metadadosRafael, Julia
16/03/2022Miguelópolis - Extração do numero da edição, data e pdfJoão M., Rafael, Vitório, Julia
09/03/2022Miguelópolis - inicio da extração da coleta de dadosJoão M., Rafael, Vitorio, Julia, Thiago, Bruno
16/02/2022Ituverava - Criação do banco json e início da coleta dos pdfsBruno, Rafael, João M., Thiago, Vitório
09/02/2022Ituverava- Finalização das extrações e inicio da inclusão dos dados no bancoBruno, Rafael, João M., Julia, Vitório
02/02/2022Igarapava - inicio da coletaThiago, Bruno, Rafael, João M., Julia
26/01/2022Ituverava - extração do link do pdf, data e número de ediçãoRafael, Bruno, João M.
19/01/2022Ituverava - busca por todos os arquivos concluídaRafael, Júlia, João M., Bruno, Vitório
12/01/2022Ituverava - início da coletaRafael, Júlia, João M., Bruno
08/12/2021Apresentando primeiros passos para novos membrosRafael, Júlia, Vitório, João F., João, Bruno
01/12/2021S.J.Barra - Inicio da coleta dos metadadosRafael, Júlia, Vitório, João Ferreira, Bruno
01/12/2021Orlândia - Resolução do problema de encoding; Inicio da coleta dos pdfsRafael, Júlia, Vitório, João Ferreira, Bruno
24/11/2021Orlândia - Inserção dos metadados em um banco jsonRafael, Júlia, Vitório, João Ferreira
17/11/2021Orlândia - Tratamento dos dados extraídos da pagina html do diário de Orlândia para inserção num banco jsonRafael, Júlia, Vitório
10/11/2021S.J.Barra - resolvendo problema de DOMRafael, Júlia
03/11/2021Orlândia - padronizando os nomes dos arquivos pdfsVitório, Rafael, Júlia
27/10/2021Orlândia - Coleta dos dados resolvida; lidando com a falta de padronização dos nomes dos arquivosVitório, Rafael
20/10/2021Continuidade da coleta de São Joaquim da BarraJúlia, Rafael
06/10/2021Início da coleta DO Legislativo do Estado de São Paulo (anterior à 06/2017)-
29/09/2021Início da coleta de Orlândia-
22/09/2021Início da coleta de Ituverava-
15/09/2021Revisão do banco de termos-
08/09/2021Início da coleta de São Joaquim da Barra-
25/08/2021Instalação das bibliotecas de Python para a realização da coleta e instruções iniciais-
18/08/2021Criação do documento de “como utilizar” no site aberto e criação do ambiente virtual conda-
28/07/2021Entendimento da indexação do recoll-
21/07/2021Organização da documentação e início do entendimento de indexação do recoll-