Tem pacotes para R que têm muitas funções, e têm outros que possuem só uma função principal. Neste post, olhamos os pacotes brasileiros para R que caem nesta segunda categoria — ‘micro-pacotes’.

RSLP

O pacote rlsp, por Daniel Falbel, vai fazer a vida de quem trabalha com mineração de textos em português bem mais fácil. O pacote usa ‘stemming’ para a língua portuguesa. Em outras palavras, ele reduz palavras às suas raízes, facilitando a análise de textos. Um exemplo:

 

install.packages("rslp")
palavras

Um outro pacote do Daniel, ptstem traz mais ferramentas para a análise de texto, para quem tem interesse em nesta área.

cepR

O pacote cepR acessa dados postais do Brasil tais como nomes de bairros, cidades, estados, logradouros, CEPs e outras informações de interesse como altitude, longitude e latitude. O usuário precisa de um token do website CEPaberto, e daí pode procurar ou por CEPs ou por detalhes de bairros com o CEP. Por exemplo, a rua João Moura onde moro em São Paulo:


install.packages("cepR")
cepR::busca_cep(cep = "005412002", token = XXXXXXXXX)
 ## # A tibble: 1 x 10 ## estado cidade bairro cep ## ## 1 SP São Paulo Pinheiros 05412002 ## ## # ... with 6 more variables: logradouro , latitude , ## # longitude , altitude , ddd , cod_IBGE

 

GetTDData

O pacote GetTDData baixa dados do Tesouro do governo brasileiro, do website Tesouro Direto. O pacote arruma estes arquivos para você usar no R. Para quem está interessado em dados financeiras, é bem mais fácil do que baixar tudo e tentar importar um por um para R! O autor, Marcelo Perlin, tem outros pacotes para R que tratam com dados financeiros também.

riscoBrasil

Falando de dados financeiros, o pacote riscoBrasil baixa dados do índice do J.P. Morgan sobre o ‘risco Brasil’. O J.P. Morgan mantenha um Emerging Markets Bond Index com índices de risco para vários países, e o IBGE disponibiliza estes dados no caso do Brasil. O pacote tem uma função, `riscoBrasil()`, fazendo ele um ‘micro-pacote’ mesmo! Mais detalhes podem ser vistos na página do pacote, e pode ser instalado com `install.packages(“riscoBrasil”)`.

sabesp

O pacote sabesp do Júlio Trecenti, baixa e arruma dados da SABESP (a Companhia de Saneamento Básico do Estado de São Paulo). Júlio mostra como, com poucas linhas de código, pode produzir um gráfico bem informativo sobre o estado dos reservatórios de água em São Paulo:


# install.packages("devtools")  ## se não tem
# install.packages("lubridate") ## idem
 devtools::install_github("jtrecenti/sabesp") library(dplyr) library(sabesp) library(ggplot2) datas % filter(titulo == 'volume armazenado') %>% ggplot(aes(x = data, y = info, colour = lugar)) + geom_line() + theme_bw() + geom_hline(yintercept = 0, colour = 'gray') + scale_x_date(date_labels = '%b %Y', date_breaks = '3 months', limits = as.Date(c('2012-12-01', '2015-12-01'))) + theme(axis.text.x = element_text(angle = 45, hjust = 1))
sabesp 1