R/tjsp_ler_peticoes_diversas.R

Defines functions tjsp_ler_peticoes_diversas

Documented in tjsp_ler_peticoes_diversas

#' Extrai tabela de petições diversas da busca cpopg
#'
#' @param arquivos se não informados, informar diretório
#' @param diretorio objeto ou diretorio  onde se encontram os htmls
#'
#' @return tibble com nomes das petições e datas
#' @export

tjsp_ler_peticoes_diversas <- function(arquivos = NULL,diretorio = ".") {

   if (is.null(arquivos)){
   arquivos <- list.files(
    path = diretorio, pattern = ".html",
    full.names = TRUE
  )  
}

  pb <- progress::progress_bar$new(total = length(arquivos))

  purrr::map_dfr(arquivos, purrr::possibly(~{


    pb$tick()

    processo <- stringr::str_extract(.x, "\\d{20}")

    

       xml2::read_html(.x) |>
      xml2::xml_find_all(xpath = "//div/h2[contains(text(),'Peti\u00E7\u00F5es diversas')]/../following-sibling::table[1]/tbody/tr") |>
      xml2::xml_text() |>
      stringr::str_trim() |>
      stringr::str_split("\n\\s+") |>
      purrr::map_dfr(stats::setNames, c("data","tipo")) |>
      dplyr::mutate(data = lubridate::dmy(data)) |>
      tibble::add_column(processo  = processo, .before = 1)

  }, otherwise = NULL))
}
jjesusfilho/tjsp documentation built on May 4, 2024, 9:35 a.m.