O Jornalista e Professor em Ciência Política Fábio Vasconcelos publicou no Blog Na Base dos Dados uma rápida análise que fizemos sobre os discursos parlamentares da sessão de votação do Impeachment do dia 17 de Abril na Câmara dos Deputados.
Para quem ficou curioso, a base de dados foi o PDF (sim, acreditem) da Câmara dos Deputados. Tentei puxar os dados dos discursos via R utilizando o pacote bRasilLegis, mas descobri que os dados só serão liberados entre hoje (19) e amanhã. (Atualizado: os discursos já estão disponíveis)
Depois do tratamento do PDF eu utilizei o Iramuteq. Para quem não conhece, o Iramuteq é uma “interface visual ” para utilizar o R e produzir análise de texto. É um “filho/primo” de um conhecido software de análise de texto francês chamado Alceste. Suas técnicas, portanto, são fortemente baseadas na literatura francesa de análise textual.
Uma das técnicas mais interessantes do Iramuteq é o método Reinert de agrupamento de proximidade de palavras. De uma maneira bem simples, ela permite achar grandes grupos temáticos em um corpus de texto.
No exemplo que fizemos, encontramos quatro grandes grupos:
Termos

É fácil verificar a posição de cada grupo em relação aos termos vizinhos e em que medida cada grupo está próximo ao outro. Azul e Verde representam a turma do SIM,   vermelho a turma do Não e em cinza uma categoria um pouco mais residual (tem sim, não e também abstenção).
O Iramuteq utiliza um dicionário para tratar os termos, então o termo querida foi tratado como “querido”, observem na nuvem azul. As UFs com espaço no nome (Ex. “São Paulo”) foram substituídas no corpus por “são_paulo” para o Software não entender duas palavras distintas.
Outra saída super interessante é a AFC (Análise Fatorial de Correspondência) das variáveis ilustrativas. Ela permite analisar as variáveis de cada parlamentares em relação ao seu pronunciamento (UF, Voto e Partido)

No exemplo, a análise feita foi apenas dos partidos.Partidos

Alguns trabalhos super interessantes como o Atlas Político e o Radar Parlamentar utilizam técnicas “parecidas” para dar o posicionamento dos partidos com relação ao conjunto de votações nominais feitas em plenário.  Aqui o Iramuteq aproximou os partidos pelo conteúdo de seus discursos.

Um exemplo que não havia postado antes é a relação entre as UF:
afcf_col

---
Para quem quer se aprofundar mais no uso de dados na política, o Ibpad lançou uma Formação completa com quatro cursos incríveis, confira:

Dados & Mapas – Identifique regiões de eleitores leais utilizando bases geolocalizadas
Pesquisas Eleitorais – Para tomar decisões corretas utilizando pesquisas de opinião
Pesquisa Qualitativa – Para entender como os eleitores pensam utilizando grupos focais
Inteligência de Dados em Mídias Sociais – Para quem quer ser relevante nas redes monitorando e analisando dados online