por Cristina Graciela, profª do curso Estatística Básica para Comunicadores
Quando se tem uma formação/profissão “exótica” se escuta muitas dúvidas sobre o que de fato é aquilo que você faz. É relativamente fácil imaginar o dia-a-dia de um médico, mas é raro quem tenha clareza (ou mesmo a mínima idéia! =S) sobre o que um estatístico faz. Quando falo que trabalho com publicidade então, aí que “dá tilt” geral.
Mas como é do ser humano tentar ser simpático e interagir, entre algumas ponderações comuns, uma que escutei várias vezes foi: “ah, então você gosta de média?” Já pensei em responder que sim, principalmente logo que sai do forno! (Na minha terra – Baixada Santista – média é como chamamos o pãozinho francês).
Deixando a resposta “fofa” que nunca dou de lado, apenas aproveito o gancho pra falar sobre média: a métrica mais conhecida, mais amada e mais odiada de todos os tempos!
Assim como o médico faz (ou deveria fazer) uma anamnese do paciente, o estatístico deve fazer uma análise ampla antes de dar o diagnóstico. A média sozinha pode levar a conclusões indevidas, assim como o resultado de um exame de sangue isolado levaria.
Por exemplo, quem trabalha com mídias sociais sabe que fotos/vídeos geralmente engajam mais que texto (mesmo que você não trabalhe com isto, pense nas postagens que vê diariamente em suas redes sociais: as fotos tendem a ganhar mais “likes” que os textos, correto?). Um levantamento recente mostra que tweets com imagens tem em média 211 engajamentos, enquanto os que são somente texto tem 31.
A partir de referências como esta, já vi muita gente extrapolar conclusões do tipo “se eu publicar uma foto e ela tiver menos retweets que um texto, então a performance foi ruim”. Ou fazer afirmações como “qualquer publicação com mais de 211 engajamentos foi bem, pois está acima da média”.
Um exemplo para pensarmos juntos:
O perfil com maior números de interações no Twitter no Brasil é o @NetflixBrasil. Observe o número de interações de dois tweets em 17/out/17:
Neste caso, a publicação sem imagem teve 6 vezes mais comentários, 17 vezes mais curtidas e mais de 500 vezes mais retweets! Isto quer dizer que o Tweet sobre a série Slasher foi um fracasso? Os resultados de ambas foi ótimo, afinal tiveram um número de interações acima da média?
Parecem extrapolações absurdas? Mas, infelizmente, já vi muitos profissionais de marketing, na ânsia de usar referências de mercado, tirarem conclusões similares…
A média é uma medida de tendência central. Como tal, tem o objetivo de representar o conjunto de dados com um único valor. Isto é a praticidade em forma de mensuração! Imagine se cada vez que uma análise de dados fosse apresentada, os dados fossem todos listados 1 a 1? Aposto que quando falassem o último você não lembraria do primeiro! Um número que explica uma amostra de dados, de forma bastante amigável: todo mundo entende a média. Mas que deve ser usado com parcimônia.
Entre alguns pontos a se pesar numa análise com média, estão a variabilidade e a segmentação da informação.
Podemos comparar uma publicação do perfil que mais bomba no país com a média geral? Estamos falando de outro patamar, então os 211 engajamentos deixam de ser uma referência válida, concorda? Então com o que comparar?
Daí te listo algumas opções (em análise de dados nunca há uma única receita de bolo a ser seguida): comparar com os maiores perfis do país ou comparar com a performance histórica da página. O post da série Slasher performou mal? Não sei, para concluir isto teria que comparar com o resultado das outras publicações da página, das publicações sobre séries, das publicações sobre conteúdos de audiência similar, de conteúdos postados no mesmo dia da semana… Enfim, as possibilidades de segmentação para análise são infinitas.
O tweet só com texto foi um sucesso? Provavelmente sim, mas para confirmar temos que buscar outros parâmetros, que não somente outro post da página ou uma referência genérica de mercado. Pela dinâmica das mídias sociais, pensando qualitativamente, este é um conteúdo altamente “compartilhável”. É justo comparar conteúdos feitos para compartilhar com conteúdos feitos para informar?
Além de segmentar a informação para avaliar, é importante verificar se a variação da informação permite que os dados sejam representados por um único valor.
Se eu comi um frango inteiro e você nenhum, na média cada um comeu meio frango! Matematicamente não há erro aqui, mas seu estômago continua vazio, certo? Neste caso, a variação foi muito grande para que meio frango, a média, represente bem a realidade. Também é comum encontrarmos valores extremos que distorcem a média. Em mídias sociais, por exemplo, os conteúdos “altamente compartilháveis” tendem a distorcer a avaliação da performance média. Muitas vezes fala-se que um perfil foi muito bem em um mês, mas na verdade teve uma postagem “lacradora” que “puxou” o resultado médio.
É indispensável um olhar crítico para dizer se a média está, na prática, cumprindo seu objetivo primordial: representar a informação com um único valor.
Voltando ao início, quando me perguntam se eu gosto de média, eu digo: “ô”… Mas, se me perguntarem se eu gosto de analisar variação eu digo “como com farinha”! =)