R/extrair_numero_unico_pdf.R

Defines functions extrair_numero_unico_pdf

Documented in extrair_numero_unico_pdf

#' Extrai número único do pdf
#'
#' @param arquivos Vetor de arquivos.
#' @param diretorio Caso não informe arquivos.
#'
#' @return Lista com números
#' @export
#'
extrair_numero_unico_pdf <- function(arquivos = NULL, diretorio = "."){
  
  if (is.null(arquivos)){
    
    arquivos <- list.files(diretorio, pattern= "pdf$", full.names = TRUE)
    
  }
  
  purrr::map(arquivos,~{
    
    pdftools::pdf_text(.x) |> 
      paste(collapse = "\n") |> 
      stringr::str_extract_all( "\\d+-\\d{2}\\.\\d{4}\\.8.26.\\d{4}") |> 
      unlist() |> 
      unique()
  })
  
}
courtsbr/JurisMiner documentation built on June 14, 2025, 12:19 p.m.