tjsp: Coleta e organização de dados do Tribunal de Justiça de São Paulo

Documented in tjsp_ler_tabela_docs_cd_processo

#' Ler tabelas baixadas com tjsp_baixar_tabela_docs
#'
#' @param arquivos Vetor de arquivos
#' @param diretorio Informar se não informar diretório
#'
#' @return tibble
#' @export
#'
tjsp_ler_tabela_docs_cd_processo <- function(arquivos = NULL, diretorio = "."){

  if (is.null(arquivos)) {

    arquivos <- list.files(diretorio,full.names = TRUE)

  }


  purrr::map_dfr(arquivos,purrr::possibly(~{


    cd_processo_pg <- stringr::str_extract(.x,"(?<=processo_pg_)[A-Z0-9]+")
    cd_processo_sg <- stringr::str_extract(.x,"(?<=processo_sg_)\\w+")

    suppressMessages({

      doc <-   .x |>
        xml2::read_html() |>
        xml2::xml_text() |>
        stringr::str_extract("(?<=requestScope = )\\X+?(?=;)") |>
        jsonlite::fromJSON()


      doc_name <- tibble::tibble(doc_name= doc$data$title) |>
        tibble::rownames_to_column("id_doc")

      paginas  <- doc$children[[2]]$data$indicePagina

      df <- purrr::imap_dfr(doc$children,~{

        url_doc <-  .x$data$parametros

        pagina_inicial <- .x$data$title |>
          stringr::str_extract("\\d+")

        pagina_final <- .x$data$title |>
          stringr::str_extract("\\d+$")

        tibble::tibble(id_doc = .y, pagina_inicial, pagina_final, url_doc) |>
          dplyr::mutate(id_doc = as.character(id_doc))

      }) |>
        dplyr::left_join(doc_name) |>
        dplyr::select(id_doc, doc_name, pagina_inicial, pagina_final, url_doc) |>
        dplyr::mutate(url_doc = paste0("https://esaj.tjsp.jus.br/pastadigital/getPDF.do?",url_doc) |> URLencode(repeated = TRUE)) |>
        tibble::add_column(cd_processo_pg, .before =1) |>
        tibble::add_column(cd_processo_sg, .after  = 1) |>
        dplyr::mutate(instancia = ifelse(is.na(cd_processo_sg), 1, 2), .after = 2)

    })

  }, NULL), .progress = TRUE)
}

jjesusfilho/tjsp documentation built on June 14, 2025, 2:34 a.m.

rdrr.io home R language documentation Run R code online

CRAN packages Bioconductor packages R-Forge packages GitHub packages

Note that we can't provide technical support on individual packages. You should contact the package authors for that.

jjesusfilho/tjsp
Coleta e organização de dados do Tribunal de Justiça de São Paulo

R/tjsp_ler_tabela_docs_cd_processo.R
In jjesusfilho/tjsp: Coleta e organização de dados do Tribunal de Justiça de São Paulo

Defines functions tjsp_ler_tabela_docs_cd_processo

Documented in tjsp_ler_tabela_docs_cd_processo

R Package Documentation

Browse R Packages

We want your feedback!

jjesusfilho/tjsp Coleta e organização de dados do Tribunal de Justiça de São Paulo

R/tjsp_ler_tabela_docs_cd_processo.R In jjesusfilho/tjsp: Coleta e organização de dados do Tribunal de Justiça de São Paulo

Defines functions tjsp_ler_tabela_docs_cd_processo

Documented in tjsp_ler_tabela_docs_cd_processo

R Package Documentation

Browse R Packages

We want your feedback!

jjesusfilho/tjsp
Coleta e organização de dados do Tribunal de Justiça de São Paulo

R/tjsp_ler_tabela_docs_cd_processo.R
In jjesusfilho/tjsp: Coleta e organização de dados do Tribunal de Justiça de São Paulo