#' Ler tabelas baixadas com tjsp_baixar_tabela_docs
#'
#' @param arquivos Vetor de arquivos
#' @param diretorio Informar se não informar diretório
#'
#' @return tibble
#' @export
#'
tjsp_ler_tabela_docs_cd_processo <- function(arquivos = NULL, diretorio = "."){
if (is.null(arquivos)) {
arquivos <- list.files(diretorio,full.names = TRUE)
}
pb <- progress::progress_bar$new(total = length(arquivos))
purrr::map_dfr(arquivos,purrr::possibly(~{
pb$tick()
cd_processo_pg <- stringr::str_extract(.x,"(?<=processo_pg_)[A-Z0-9]+")
cd_processo_sg <- stringr::str_extract(.x,"(?<=processo_sg_)\\w+")
suppressMessages({
doc <- .x |>
xml2::read_html() |>
xml2::xml_text() |>
stringr::str_extract("(?<=requestScope = )\\X+?(?=;)") |>
jsonlite::fromJSON()
doc_name <- tibble::tibble(doc_name= doc$data$title) |>
tibble::rownames_to_column("id_doc")
paginas <- doc$children[[2]]$data$indicePagina
df <- purrr::imap_dfr(doc$children,~{
url_doc <- .x$data$parametros
pagina_inicial <- .x$data$title |>
stringr::str_extract("\\d+")
pagina_final <- .x$data$title |>
stringr::str_extract("\\d+$")
tibble::tibble(id_doc = .y, pagina_inicial, pagina_final, url_doc) |>
dplyr::mutate(id_doc = as.character(id_doc))
}) |>
dplyr::left_join(doc_name) |>
dplyr::select(id_doc, doc_name, pagina_inicial, pagina_final, url_doc) |>
dplyr::mutate(url_doc = paste0("https://esaj.tjsp.jus.br/pastadigital/getPDF.do?",url_doc)) |>
dplyr::group_by(id_doc) |>
dplyr::ungroup() |>
tibble::add_column(cd_processo_pg, .before =1) |>
tibble::add_column(cd_processo_sg, .after = 1) |>
dplyr::mutate(instancia = ifelse(is.na(cd_processo_sg), 1, 2), .after = 2)
})
}, NULL))
}
Add the following code to your website.
For more information on customizing the embed code, read Embedding Snippets.