Desequilíbrio de Género nas Fontes
Análise da representação de género nas fontes citadas pela imprensa regional portuguesa.
Contexto
Tendo acesso a notícias de todo o país, podemos investigar como os diferentes jornais regionais usam especialistas e fontes, especificamente qual o género dos nomes das pessoas citadas, em busca de padrões e desiquilíbrios.
Nesta análise, utilizamos uma deteção automática de género nas citações para medir a representação ao longo do tempo, entre regiões, e entre jornais.
Como extraímos as citações
Utilizamos processamento de linguagem natural para identificar automaticamente quem é citado em cada artigo e classificar o género do nome. Eis alguns exemplos:
Distribuição global
No total de todas as citações identificadas na imprensa regional, a proporção de fontes masculinas é esmagadoramente superior à feminina. Esta é a fotografia global do desequilíbrio.
Proporção global de citações por género
Evolução temporal
Ao visualizar a distribuição anual percebe-se que a disparidade é constante nos últimos 30 anos, com uma ligeira tendência de aproximação. Nos últimos 10 anos (2016–2025), a proporção feminina subiu de ~19% para ~24%, um ganho médio de +0,6 pontos percentuais por ano.
A este ritmo, seriam necessários cerca de 41 anos (até ~2066) para atingir a paridade de 50%. A evolução existe, mas é extremamente lenta.
Proporção de citações por género ao longo do tempo
Evolução excluindo os 500 mais citados
As figuras públicas mais mediáticas (autarcas, políticos) são maioritariamente homens e distorcem as proporções globais. Se excluirmos as 500 pessoas mais citadas, a proporção feminina sobe para ~32% em 2025 (vs. ~24% no total).
Neste cenário, com este ritmo de crescimento seriam necessários cerca de 25 anos (até ~2050) para atingir a paridade.
Proporção de género excluindo as 500 pessoas mais citadas
Variação geográfica ao longo do tempo
Existem diferenças regionais na representação de género? Usa o botão de play para ver a evolução ano a ano da distribuição de citações masculinas e femininas por distrito.
Top 10 jornais por género de citações
Quais os jornais que mais citam fontes masculinas e femininas? As barras mostram a proporção relativa M/F em cada jornal.
Relembramos que estas micro-análises são suscetíveis a distorções por causa do volume de citações, por exemplo: um jornal com poucas notícias ou poucas citações detetadas pode ter uma proporção muito desiquilibrada por não ser representativa.
Top 10 — mais citações masculinas
Top 10 — mais citações femininas
Pessoas mais citadas por género
Quem são as vozes mais presentes na imprensa regional? Os 10 homens e as 10 mulheres mais frequentemente citados.
Relembramos que estas micro-análises são suscetíveis a distorções como as resultantes de dado jornal referir muito regularmente a mesma pessoa, ou pelo nosso processamento não incluir desambiguação de homónimos, como 'Marta Temido' vs 'Ministra da Saúde'.
Top 10 homens mais citados
Top 10 mulheres mais citadas
Género por palavras-chave
Se escolhermos determinadas palavras conseguimos ainda ver a variação no desequilíbrio de género. Aqui podemos explorar a evolução temporal para notícias que contenham determinadas palavras-chave, focando nos últimos 10 anos (2015–2026). Seleciona as palavras-chave para ver os resultados.
Conclusão
Apesar desta análise se limitar à metodologia e processamentos automáticos do projeto, o padrão emergente de desequilíbrio na representação de género nas fontes citadas pela imprensa regional é claro: a predominância masculina é transversal ao longo do tempo.