Atualizado em 21 set. 2021

Alguns livros fizeram eu me interessar ainda mais pela ciência de dados e também por estatística e outros temas da tecnologia, como inteligência artificial. Reuni abaixo os 10 livros que considero mais importantes da área, mas não têm como objetivo ensinar uma linguagem de programação nem apresentar tutoriais. São livros menos técnicos e que conseguem muito bem apresentar os assuntos e reter a atenção do leitor – todos têm versão em português.

 

1. Todo Mundo Mente: O que a internet e os dados dizem sobre quem realmente somos

todo mundo mente

O livro conquistou bastante sucesso e é resultado de uma pesquisa feita pelo autor, Seth Stephens-Davidowitz. Ele já trabalhou no Google e é cientista de dados e doutor em economia por Harvard. A versão original do livro, em inglês, saiu em 2017, mas a tradução para o português foi publicada em fevereiro de 2018. Apesar dos quatro anos desde o lançamento, o livro continua bastante atual.

2. Dominados pelos números: Do Facebook e Google às fake news – Os algoritmos que controlam nossa vida

dominados pelos numeros

Este livro tem quase 400 páginas, mas a leitura não é repetitiva e cada página acrescenta algo para o leitor. O autor, David Sumpter, é professor de matemática aplicada na Universidade de Uppsala e consegue, com uma linguagem simples, explicar o impacto dos algoritmos na nossa vida – com direito a abordar temas atuais, como redes sociais e desinformação.

3. A revolução do aprendizado profundo

a revolucao do aprendizado profundo

O Google Tradutor e as assistentes virtuais Alexa e Siri são exemplos de tecnologias que avançaram muito no decorrer dos anos. Pioneiro na neurociência computacional, Terrence Sejnowski nos ajuda a entender o potencial transformador do aprendizado profundo.

4. Manipulados: como a Cambridge Analytica e o Facebook invadiram a privacidade de milhões e botaram a democracia em xeque

manipulados

Ex-funcionária da Cambridge Analytica, Brittany Kaiser conta como funcionava a empresa que ajudou na ascensão da extrema direita. Ela também fala de brechas no Facebook, como o uso de dados sem consentimento dos usuários para traçar um perfil do eleitor. Brittany Kaiser também aparece no documentário da Netflix “Privacidade hackeada”. 

5. Algoritmos de destruição em massa

algoritmos de destruicao em massa

O famoso livro de Cathy O’Neil, lançado em 2016, ganhou a sua versão em português em dezembro de 2020. A doutora em matemática por Harvard alerta para o risco de usar dados e modelos para aumentar a desigualdade, além de excluir e reforçar preconceitos contra segmentos da população.

6. O sinal e o ruído

o sinal e o ruido

O livro publicado em 2012 pelo estatístico Nate Silver, fundador do site FiveThirtyEight, mostra que muitas das previsões feitas hoje são falhas e nos ajuda a entender o que pode estar por trás dos erros. Nate Silver ficou conhecido por ter criado um modelo preditivo que teve ótimo desempenho nas eleições presidenciais dos EUA em 2008 e 2012.

7. Factfulness: O hábito libertador de só ter opiniões baseadas em fatos

factfulness

O professor sueco Hans Rosling destaca vários dados mundiais para mostrar que a situação não é tão ruim assim. Houve avanços nas últimas décadas, e os dados evidenciam isso. Rosling morou em diversos países e conta na obra suas experiências como palestrante e médico. O autor morreu antes do livro ser publicado, mas o trabalho foi continuado pela família. Ele criou ainda a Fundação Gapminder, que reúne estatísticas internacionais.

8. Como mentir com estatística

como mentir com estatistica

O livro de Darrell Huff é bem pequeno, ideal para quem deseja entender o básico de estatística. Ele conta histórias simples para você não ser enganado pelos números – nem enganar alguém. É uma obra indispensável para não fazer absurdos com os números nem acreditar em qualquer análise. A primeira edição do livro saiu em 1954, mas a última versão brasileira é de 2016.

9. Estatística – o que é, para que serve, como funciona

estatistica o que eh

Este livro também é para quem não é da área de estatística, mas já aprofunda mais nos conceitos básicos e até em técnicas avançadas. É bastante amplo e traz exemplos reais, com assuntos que interessam a todos. Outro livro de Charles Wheelan também foi traduzido para o português e também com título similar: “Economia nua e crua: O que é, para que serve, como funciona”.

10. Introdução à ciência de dados: mineração de dados e big data

introducao a ciencia de dados

Apesar de apresentar trechos práticos (com Weka e R), o mais valioso no livro de Fernando Amaral são as introduções a temas e conceitos da ciência de dados. São alguns dos assuntos tratados no livro: aprendizado de máquina computacional, governança de dados, mineração de texto, data warehouse, modelo relacional, entre outros.