R/stj_ler_decisoes_dje.R

Defines functions stj_ler_decisoes_dje

Documented in stj_ler_decisoes_dje

#' Lê decisoes baixadas do DJE
#'
#' @param arquivos Vetor de arquivos
#' @param assinatura FALSE para remover.
#' @param diretorio Alternativa aos arquivos.
#'
#' @return tibble
#' @export

stj_ler_decisoes_dje <- function(arquivos = NULL, assinatura = FALSE, diretorio = "."){

  if (is.null(arquivos)){

    arquivos <- list.files(diretorio, full.names = T, pattern = "pdf$")

  }

  pb <- progress::progress_bar$new(total = length(arquivos))

  purrr::map_dfr(arquivos, purrr::possibly(~{

    pb$tick()

    registro <- .x |>
      stringr::str_extract("(?<=registro_)\\d+")

    data <- .x |>
      stringr::str_extract("(?<=data_)\\d{2}_\\d{2}_\\d{4}") |>
      lubridate::dmy()

    seq_documento <- .x |>
      stringr::str_extract("(?<=seq_documento_)\\d+")

    nu_seguimento <- .x |>
      stringr::str_extract("(?<=nu_seguimento_)\\d+")

    texto <- pdftools::pdf_text(.x)

    if (assinatura == FALSE) {
      texto <- stringr::str_remove_all(texto, "\nEdi\u00E7\u00E3o\\sn\u00BA\\s\\d\\X+Controle do Documento:\\s\\S+")
    }

    texto <- stringr::str_c(texto, collapse = "\n\n")

    tibble::tibble(registro, data, seq_documento, nu_seguimento,
                   julgado = texto)
  }, NULL))


}
jjesusfilho/stj documentation built on Sept. 12, 2023, 12:05 a.m.