knitr::opts_chunk$set(
  collapse = TRUE,
  comment = "#>",
  fig.path = "README-"
)

rfolha

Download de notícias do site da Folha de São Paulo

Instalação

Para instalar o pacote use o comando.

devtools::install_github("dfalbel/rfolha")

Usando

Para evitar grande quantidade de acessos ao site, o pacote trabalha sempre fazendo o download de todas as páginas que serão utilizadas para em seguida fazer o processamento.

Download das páginas de busca

library(rfolha)
baixar_pag_busca(q("olimpiadas"), dir = "data-raw/busca")

Tabelar as páginas de busca

busca <- tabelar_busca(dir = "data-raw/busca")

Baixar páginas encontradas

controle <- baixar_urls(busca$url, dir = "data-raw/noticias/")

Obter o texto das notícias

busca$texto <- processar_noticias(dir = "data-raw/noticias/")


dfalbel/rfolha documentation built on May 15, 2019, 5:10 a.m.