knitr::opts_chunk$set(
  collapse = TRUE,
  comment = "#>",
  fig.path = "man/figures/README-",
  out.width = "100%"
)

noticiasgov

atualiza_dados Lifecycle: experimental

O objetivo deste repositório/pacote é raspar as notícias de portais de noticias governamentais, e disponibilizar em .csv.

library(magrittr)
tibble::tribble(
  ~estado, ~nome_site, ~url_site, ~url_csv, ~cod_r, ~freq_action,
  "SP",
  "Portal do Governo do Estado de São Paulo",
  "https://www.saopaulo.sp.gov.br/ultimas-noticias/",
  "https://raw.githubusercontent.com/beatrizmilz/noticiasgov/master/inst/base_noticias_gov_sp.csv",


  '`base_noticias_gov_sp <- readr::read_delim("https://raw.githubusercontent.com/beatrizmilz/noticiasgov/master/inst/base_noticias_gov_sp.csv", delim = ";")` ',
  "A cada 6 horas"
) %>% 
  dplyr::transmute(
    Estado = estado,
    Fonte = glue::glue("[{nome_site}]({url_site})"),
    `Freq. de atualização` = freq_action,
    `Baixar base` = glue::glue("[`.csv`]({url_csv})"),
    `Código para importar no R` = cod_r

  ) %>% 
  knitr::kable()

Exemplo dos dados disponíveis

base_noticias_gov_sp <- readr::read_delim("https://raw.githubusercontent.com/beatrizmilz/noticiasgov/master/inst/base_noticias_gov_sp.csv", delim = ";")

dplyr::glimpse(base_noticias_gov_sp)

Pesquisar as notícias que contém algum termo ao longo do tempo:

library(ggplot2)

noticias_sp_filtradas <- base_noticias_gov_sp %>%
  dplyr::mutate(titulo_clean = stringr::str_to_lower(titulo),
                titulo_clean = abjutils::rm_accent(titulo_clean)) %>% 
  dplyr::filter(
      stringr::str_detect(titulo_clean, "rio pinheiros")
  )

noticias_sp_filtradas |> 
  dplyr::mutate(titulo_url = glue::glue("[{titulo}]({url_noticia})")) |> 
    dplyr::select(data, titulo_url) |> 
  knitr::kable()


beatrizmilz/noticiasgov documentation built on March 11, 2024, 5 p.m.