R/ler_acordaos_carf.R

Defines functions ler_acordaos_carf

Documented in ler_acordaos_carf

#' Lê acórdãos baixados pela função baixar_pdf_car
#'
#' @param arquivos Vetor de endereços de arquivos
#' @param diretorio Informar se arquivos não for informado
#' @param parallel Rodar em paralelo? Usar somente diretamente no
#'     R
#'
#' @return tibble
#' @export
#'
#' @examples
#' \dontrun{
#' df <- ler_acordaos_carf()
#' }
ler_acordaos_carf <- function(arquivos = NULL,diretorio = ".", parallel = FALSE){

  if (is.null(arquivos)){

    arquivos <- list.files(diretorio, pattern=".pdf",full.names = TRUE)
  }

  if (parallel == TRUE) {

    future::plan("multicore")
  }


  furrr::future_map_dfr(arquivos, purrr::possibly(~{
    acordao <- stringr::str_extract(.x,"\\d{7,}")
    processo <-stringr::str_extract(.x, "\\d+(?=\\.pdf)")

    inteiro_teor <- pdftools::pdf_text(.x) %>%
      paste0(collapse = "\r\t")

    tibble::tibble(acordao,processo,inteiro_teor)

  },NULL), .progress = TRUE)

}
jjesusfilho/carf documentation built on Nov. 4, 2019, 2:44 p.m.