Dados e Metodologia

Conjuntos de Dados

NomeDescriçãoTamanhoFormatoDownload
Artigos CompletosTodos os artigos recolhidos com texto completo, metadados e classificação de tópicos.2.3 GB
JSON
Download
Metadados de ArtigosApenas metadados (título, data, autor, secção, URL) sem texto completo.340 MB
CSV
Download
Catálogo de JornaisLista de todos os jornais regionais identificados com informações de contacto e região.245 KB
CSV
Download
Classificação de TópicosResultados do topic modelling com probabilidades por artigo e por tópico.890 MB
Parquet
Download
Séries TemporaisAgregações temporais de publicação por jornal, distrito e categoria.12 MB
CSV
Download

Metodologia

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat. Duis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore eu fugiat nulla pariatur.

Excepteur sint occaecat cupidatat non proident, sunt in culpa qui officia deserunt mollit anim id est laborum. Sed ut perspiciatis unde omnis iste natus error sit voluptatem accusantium doloremque laudantium, totam rem aperiam, eaque ipsa quae ab illo inventore veritatis et quasi architecto beatae vitae dicta sunt explicabo.

Nemo enim ipsam voluptatem quia voluptas sit aspernatur aut odit aut fugit, sed quia consequuntur magni dolores eos qui ratione voluptatem sequi nesciunt. Neque porro quisquam est, qui dolorem ipsum quia dolor sit amet, consectetur, adipisci velit, sed quia non numquam eius modi tempora incidunt ut labore et dolore magnam aliquam quaerat voluptatem.

Ut enim ad minima veniam, quis nostrum exercitationem ullam corporis suscipit laboriosam, nisi ut aliquid ex ea commodi consequatur? Quis autem vel eum iure reprehenderit qui in ea voluptate velit esse quam nihil molestiae consequatur, vel illum qui dolorem eum fugiat quo voluptas nulla pariatur?

Código

Todo o código deste projeto é open-source e está disponível no GitHub. O projeto inclui ferramentas de scraping, processamento de dados, análise de tópicos (topic modelling) e esta aplicação web.

Ver no GitHub

Licença

Este projeto está licenciado sob a MIT License. Pode usar, copiar, modificar e distribuir o código livremente, desde que mantenha a atribuição original. Os dados recolhidos estão sujeitos aos termos de uso das fontes originais.

Autores

João Carvalho e Miguel Ramalho

Análise do jornalismo local em Portugal