Se você acompanha minimamente política e está no Twitter, muito provavelmente já se deparou com algum/alguma grafo/rede de grandes eventos. Embora a divulgação desses artifícios visuais que representam a repercussão de conversas/debates na e da própria plataforma não seja uma prática recente, é perceptível que, nos últimos meses, mais e mais usuários estão criando seus próprios grafos, ainda mais com o maior interesse em assuntos políticos hoje em dia.
A CPI da COVID-19, por exemplo, que virou uma verdadeira novela, com usuários assistindo ao vivo aos depoimentos e compartilhando na mídia social mais real-time que existe atualmente, intensificou bastante essa prática. Talvez o principal perfil que tenha ganhado notoriedade nesse período tenha sido o do pesquisador Pedro Barciela, do blog Essa tal rede social. No entanto, ele não é o único: na lista curada pelo pesquisador Janderson Toth, há pelo menos duas dúzias de usuários que comumente compartilham seus grafos na plataforma.
A pergunta que você – ou qualquer uma das milhares de pessoas às quais esses grafos podem ter alcançado – talvez tenha é: como eles fizeram essas redes (grafos)? E logo em seguida: o que eles representam? Ou ainda: por que alguns são de perfis, outros são nomes de páginas do Facebook, outros são títulos de vídeos/canais do YouTube, outros são simplesmente palavras? Caso você tenha interesse em fazê-las, pode também questionar: como eles coletaram esses dados? Com quais ferramentas? Como transformaram em “rede”? Ou seja, qual foi a metodologia empregada?
Neste post, vamos tentar responder todas essas perguntas do modo mais simples possível.
1/5 – O fim do Licenciamento Ambiental do Brasil foi decidido essa semana pela Câmara. Nas redes, houve grande mobilização de perfis de defesa do meio ambiente (Como @socioambiental, @obsclima, @GuajajaraSonia, @ApibOficial e @GreenpeaceBR) contra a aprovação da PL/3729/04 ? pic.twitter.com/dgDFq0l7QQ
— Carina Pensa (@cajupensa) May 14, 2021
1. O que esses grafos representam? Por que alguns são de perfis, outros de páginas do Facebook, outros de vídeos/canais do YouTube, e outros simplesmente de palavras?
Independente da plataforma ou da “matéria-prima” (tweets, vídeos do YouTube, posts no Facebook etc.), os elementos básicos que constituem uma rede (um grafo) são: nós (vértices) e arestas (laços). É o conjunto deles que permite a criação de uma rede, que busca demonstrar cognitivamente as conexões formadas entre as entidades. O que acontece é que essas “entidades” podem ser qualquer coisa: pessoas, cidades, organismos, etc. – ou, como no caso das mídias sociais, geralmente são perfis, páginas, vídeos/canais ou hashtags. Por isso é dever de quem produziu o grafo também explicar do que se trata.
As redes podem ser sobre interações entre perfis do Twitter em torno de uma hashtag específica – neste caso, os perfis são os nós e as interações (que podem ser replies ou retweets, ou ambos); relações entre canais/vídeos do YouTube conforme recomendação do algoritmo da própria plataformas (neste caso, os canais/vídeos são os nós e as relações do algoritmo são as conexões).
O importante aqui é ter em mente que quase tudo pode ser transformado em rede, desde que haja uma relação entre os dados. Você mesmo pode criar um grafo: basta abrir uma planilha, fazer duas colunas (uma de origem e outra de destino) e colocar os nomes das entidades que você deseja. Pronto, agora é só inserir essa base num software de análise de redes e gerar a sua própria rede. A única diferença entre esse processo e o que pesquisadores têm feito é trabalhar com algumas ferramentas que permitem a operação disso numa escala muito maior, tanto para coleta quanto para análise.
Veja abaixo uma galeria de grafos que estão circulando nas redes:
Imagens por Fábio Malini e Pedro Barciela
2. Como eles coletam esses dados? Com quais ferramentas?
Há basicamente duas maneiras de coletar dados de mídias sociais atualmente: via API ou raspagem de dados (web scraping). De modo muito simples, a coleta via API (sigla para Application Programming Interface) é um modo de aquisição dos dados que segue os termos de serviço das próprias plataformas. São como mangueiras que fornecem os dados das mídias sociais de acordo com certas limitações e padronizações. Já a raspagem (scraping, em inglês) é o processo de automatização do esforço de coleta manual através de scripts desenhados para essa funcionalidade específica de raspar dados públicos das plataformas (ou de sites também, por exemplo).
Embora o escândalo da Cambridge Analytica tenha desencadeado uma série de medidas restritivas por parte das plataformas, o que dificultou a continuidade de ferramentas acadêmicas como a Netvizz e a Netlytic nos últimos anos, recentemente as empresas de mídias sociais têm retomado suas políticas de acesso aos dados para pesquisa acadêmica. A integração com as APIs das plataformas exige, entretanto, um conhecimento mínimo de programação, como no caso da API do Twitter para acadêmicos. Ou seja, você precisa saber como pedir às plataformas os dados que você deseja (e ela disponibiliza, pois não são todos os dados que são liberados).
Ferramentas como a YouTube Data Tools, da Digital Methods Initiative, são interfaces que realizam essa integração nos bastidores e deixam para o pesquisador apenas as configurações necessárias para a coleta. O acesso a essas iniciativas das plataformas para acadêmicos, porém, exige uma solicitação formal com apresentação de informações detalhadas sobre o projeto de pesquisa, justificativa para sua utilização e até descrição sobre como serão apresentados.
3. Como transformaram em “rede”? Ou seja, qual foi a metodologia?
O processo de transformar esses dados em redes depende geralmente do modo como eles foram coletados e do próprio conhecimento do pesquisador. Ferramentas como a Communalytic (dos mesmos desenvolvedores da Netlytic, ferramenta que fez o exemplo de grafo à direita) realizam tanto a coleta dos dados – feita através das chaves de acesso ou do Twitter, por exemplo – quanto a criação “automática” dos grafos. Eles ainda permitem que você defina qual tipo de rede você deseja: bimodais, com dois tipos de nós, como no caso das notícias em grupos/páginas do Facebook; ou unimodal, com apenas um tipo de nó, como no caso de interações no Twitter.
O que está por trás dessa criação “automática”, de maneira simples, é a identificação das conexões presentes na base de dados. Por exemplo, o pesquisador Deen Freelon, da University of North Carolina, possui um script que permite “extrair retweets e menções [de uma base de dados] em formato de lista de arestas para visualização e análise de redes”. O que ele faz é basicamente identificar na base coletada quais são os @s dos usuários em cada tweet e criar uma conexão entre eles conforme disposto numa planilha que você pode incorporar no Gephi, como no exemplo da sua própria rede manual. Aqui, porém, tendo à disposição os dados em maior volume.
1. minha primeira #Thread é a observação de como a #euautorizopresidente foi parar nos TTs. Gerei essa bela imagem ? pic.twitter.com/VN4ozxDupc
— Lia Gabriela Pagoto (@gabriela_lia) April 19, 2021
No caso do YouTube, o próprio YouTube Data Tools já disponibiliza esse formato de rede através dos outputs em GDF, enquanto que no Facebook basta uma tabulação bem feita dos dados com base na URLs das notícias e páginas do grupo. Para grafos de co-ocorrência entre termos (ou hashtags), ferramentas como a Textometrica ou a WORDij também criam esses arquivos prontos para serem trabalhados no Gephi. E este é o último passo: encontrar uma ferramenta de análise de redes que permita o cálculo de métricas e distribuição de layout para a análise – afinal, grafos são tanto recursos cognitivos visuais quanto métodos quanti-quali de análise.
Quer aprender a fazer redes semânticas com a WORDij, integrando seus outputs diretamente com o Gephi? Inscreva-se no nosso curso de Técnicas para Análise de Texto e descubra também toda a potência de outros softwares como o AntConc e Iramuteq!
Mas afinal, o que demonstram essas redes?
Sim, grafos são visualizações lindas de se ver e talvez seja justamente esse apelo visual que tenha levado a metodologia de análise de redes ganhar tanta popularidade nos últimos tempos. No entanto, (muito) mais do que simples obras de arte, eles representam uma série de cálculos estatísticos que compõem sua formação em rede. Como explica essa thread do projeto Nós e Conexões, é importante também entender como ler e visualizar um grafo, visto que o modo como ele se apresenta é também uma decisão do pesquisador: layout, cores, distribuição, destaque de nós etc. Um mesmo grafo pode ser trabalhado de diferentes formas, ajustando cada um desses critérios conforme diferentes medidas e modos de apresentação.
Colocando de modo muito simples, funciona assim: lembra da base que você criou numa planilha para gerar uma rede? Ou, neste caso, para levarmos em conta maiores proporções, a lista de arestas que você pode gerar a partir de uma enorme base do Twitter? O software de análise de redes da sua escolha – e a há vários deles -, ao receber o arquivo, pode operar uma série de cálculos que identificam fatores importante, como quais são as entidades que mais se conectam entre si, gerando possíveis agrupamentos matematicamente identificáveis; ou, ainda, quais são as entidades que recebem o maior ou o menor número de conexões na rede, o que pode indicar certa relevância (ou até mesmo influência) no grupo de atores analisados.
Essas métricas são possíveis de serem calculadas em softwares como o Gephi, que também permite a customização dos elementos visuais: atribuir determinada cor para um nó específico ou um grupo de nós; determinar medidas mínimas e máximas para o tamanho de nós a partir de alguma medida específica (número de visualizações/seguidores/inscritos, ou pela própria métrica de número de conexões recebidas/ofertadas); escolher o tipo de layout a ser utilizado na distribuição espacial do grafo de acordo com o que deseja realçar em sua apresentação, tudo tendo em conta que os layouts são desenvolvidos a partir de algoritmos de distribuição espacial.