knitr::opts_chunk$set( collapse = TRUE, comment = "#>", fig.path = "man/figures/README-", out.width = "100%" )
O objetivo deste repositório/pacote é raspar as notícias de portais de noticias governamentais, e disponibilizar em .csv
.
library(magrittr) tibble::tribble( ~estado, ~nome_site, ~url_site, ~url_csv, ~cod_r, ~freq_action, "SP", "Portal do Governo do Estado de São Paulo", "https://www.saopaulo.sp.gov.br/ultimas-noticias/", "https://raw.githubusercontent.com/beatrizmilz/noticiasgov/master/inst/base_noticias_gov_sp.csv", '`base_noticias_gov_sp <- readr::read_delim("https://raw.githubusercontent.com/beatrizmilz/noticiasgov/master/inst/base_noticias_gov_sp.csv", delim = ";")` ', "A cada 6 horas" ) %>% dplyr::transmute( Estado = estado, Fonte = glue::glue("[{nome_site}]({url_site})"), `Freq. de atualização` = freq_action, `Baixar base` = glue::glue("[`.csv`]({url_csv})"), `Código para importar no R` = cod_r ) %>% knitr::kable()
base_noticias_gov_sp <- readr::read_delim("https://raw.githubusercontent.com/beatrizmilz/noticiasgov/master/inst/base_noticias_gov_sp.csv", delim = ";") dplyr::glimpse(base_noticias_gov_sp)
Pesquisar as notícias que contém algum termo ao longo do tempo:
library(ggplot2) noticias_sp_filtradas <- base_noticias_gov_sp %>% dplyr::mutate(titulo_clean = stringr::str_to_lower(titulo), titulo_clean = abjutils::rm_accent(titulo_clean)) %>% dplyr::filter( stringr::str_detect(titulo_clean, "rio pinheiros") ) noticias_sp_filtradas |> dplyr::mutate(titulo_url = glue::glue("[{titulo}]({url_noticia})")) |> dplyr::select(data, titulo_url) |> knitr::kable()
Add the following code to your website.
For more information on customizing the embed code, read Embedding Snippets.