Photo by Dimitri Karastelev on Unsplash
O assunto do momento é a pandemia de COVID-19, o novo coronavírus que conseguiu desestruturar o mundo como o conhecemos e nos fazer diariamente desejar voltar ao normal (com fé que ainda existirá o normal….ou algo melhor).
Como boa amante da informação tenho consumido muuuuuuitas notícias, artigos, análises, opiniões e teorias (da conspiração eu dispenso) sobre o cenário atual e projeções futuras. E no meio disto tudo não paro de pensar na imprecisão da informação com que estamos trabalhando. Não vou entrar aqui no mérito do porque o Brasil não está testando em massa, mas falar sobre o FATO de que os números de casos confirmados é subestimado pela sub-testagem.
Já pensaram sobre o fato de que, se estamos testando somente os casos mais graves, nossa taxa de mortalidade é superestimada? (uma divisão com denominador menor do que o real)
Como podemos comparar curvas de crescimento de países que testaram em massa com países com falta de testes?
Já pensaram que estamos tentando analisar se o isolamento social está funcionando para “achatar a curva” se não sabemos qual a curva real?
Aí eu pergunto: e quando é que temos dados perfeitos para analisar?
A maioria das vezes não temos. Daí que assumimos premissas, agregamos análises paralelas, usamos a criatividade (analítica e não invencionista) e fazemos o papel principal da Estatística: minimizar a incerteza! Não temos os dados perfeitos, mas você prefere procurar a agulha no palheiro com uma luz fraca ou no total escuro? (lembrando que ter iluminação profissional não foi te dado de opção)
Seguindo a linha de agregar análises paralelas, gostei muito de algumas reportagens que li no fim de semana mostrando dados do sistema InfoGripe, da Fundação Oswaldo Cruz (Fiocruz). Este sistema registra o número de notificações, em todo o país, de Síndrome Respiratoria Aguda Grave (SRAG). Não se trata de uma doença específica, mas de um conjunto de complicações respiratórias que podem ser causadas por diferentes infecções, como influenza e também pelo COVID-19.
Tivemos um aumento significante nas notificações do InfoGripe, em comparação ao ano anterior. Somente uma testagem em massa garantiria que são casos de COVID-19 e não Influenza, mas não há nenhum outro dado de saúde pública que indique que estamos vivendo um momento de criticidade em relação às gripes comuns. Então, muito provavelmente, a maior parcela deste aumento se deve a casos do novo coronavírus.
Os dados do sistema da Fiocruz estão atualizados até 21/mar (as 12 primeiras semanas do ano). Comparando com as mesmas semanas do ano anterior, registra-se um aumento de 141% no número de notificações para cada 100 mil habitantes no país. Na região sudeste este aumento foi de 422%! Fazendo um paralelo com os casos de coronavírus, SP e RJ são os campeões de casos.
Dado que o COVID-19 impacta diretamente na incidência de SRAG, há bons indícios que estes dados podem nos dar um norte da evolução da epidemia no país, nos dando uma forcinha para entender o que acontece além das confirmações de casos.
Enquanto “brincava” com este dados (sim, eu me divirto analisando dados! =D ) lembrei de uma pequena polêmica levantada nas redes sociais sobre o vírus já estar circulando no país antes do carnaval, dado que seria uma “grande coincidência” o primeiro caso no país ser notificado em 26/mar, exatamente no fim do carnaval. Ou mesmo que só não estávamos contabilizando casos antes por falta de testagem.
Então, fui verificar como estavam as notificações de SRAG até o dia 22/fev (sábado de carnaval) e fazer um comparativo com o mesmo período de 2019.
O que encontrei foi uma queda de 10% na incidência no país. Uma flutuação dos dados por região, mas nenhum aumento que justificasse falar que já vivíamos uma epidemia de uma doença que causa complicações respiratórias graves.
As chuvas recordes que atingiram o sudeste em fevereiro de 2020 e o fato de que a temperatura média de janeiro e fevereiro foi mais baixa este ano são 2 fatores que tendem a aumentar problemas respiratórios e que fariam sentido para explicar esta ordem de grandeza no aumento de incidência de problemas respiratórios graves na região Sudeste (mas que já não fariam sentido para explicar um aumento de 422% da incidência na região Sudeste, como acontece no agregado até a semana 12)
Juro de pé junto que li por aí gente falando que deveriam ter cancelado o carnaval para evitar a propagação do vírus! Aqui trago uma análise rasa, de somente 1 indicador, mas que poderia dizer que não havia nenhum sentido na proposta de cancelar um evento que tem uma importância cultural imensurável pro país e que gera renda para muitos setores da economia e para muitas famílias.
Outra visão, dessa mesma informação, é um olhar por faixa etária. A hipótese de que estou partindo aqui é de que se houvesse tido uma propagação do vírus no carnaval, as faixas etárias mais propensas a estarem nas aglomerações da folia deveriam ter sido mais impactadas. Então levantei os dados de incidência até a semana 10, ou seja, até o fim da semana após o carnaval, quando já deu tempo da imunidade dos foliões ter ido no chão e estar geral dependendo de respirador.
Vemos que onde tivemos um dos maiores saltos de incidência foi em crianças de 5 a 9 anos. Podemos concordar que não este grupo demográfico não é o que estava em maiores aglomerações? Também não deveriam ter sido muito contaminados pelos pais (pelo menos meus conhecidos com filhos nessa idade costumam ter um carnaval um pouco mais recluso…).
Assim como nas faixas acima de 40 anos tivemos um aumento de incidência maior do que na faixa de 20 a 29 anos, que é mais típica das grandes aglomerações nos blocos carnavalescos.
Não trago nenhuma prova concreta com esta análise, mas trago um resultado razoavelmente consistente para reduzir a incerteza (e quem sabe deixar uma pulguinha atrás da orelha da galera das teorias conspiratórias! 😉 ).
Obs: os dados do InfoGripe de 2020 estão estimados e podem sofrer alterações. A extração de dados foi feita no dia 30/mar/20