suppressPackageStartupMessages(library(dplyr)) library(tidyr) library(stringr) library(lubridate) library(knitr) library(ggplot2) library(tjsp) library(lucrosCessantes)
l <- dir('data-raw/cjsg/') pags <- as.numeric(unique(str_split_fixed(l, '_', 2)[, 1])) if(length(pags) == 0) pags <- 1 # consulta realizada em 17/08/2015 aux <- cjsg(ementa = 'lucro cessante', min_pag = max(pags), max_pag = Inf, salvar = TRUE, path = 'data-raw/cjsg/') # consulta teve como resultado 18877 documentos # mas apenas 18218 eram com números de 20 dígitos (numeração CNJ) # e foram excluídos. d_lc <- carregar_pasta('data-raw/cjsg/') %>% setNames(arrumar_nomes(names(.))) %>% mutate(n_processo = gsub('[^0-9]', '', n_processo)) %>% filter(str_length(n_processo) == 20) %>% distinct(n_processo, cdacordao) %>% select(relator:pag) save(d_lc, file = 'data/d_lc.rda')
d_lc <- readRDS('data/d_lc.rds') res <- cpo_sg(unique(d_lc$n_processo), path = 'data-raw/cpo-sg') # ao rodar o parser, tivemos problemas com 953 arquivos # Esses arquivos foram baixados novamente. Deu na mesma. # Acabei retirando esses processos. d_cpo_sg <- parse_cpo_sg('data-raw/cpo-sg', keyval = TRUE) %>% filter(key != 'erro', val != 'erro') %>% mutate(n_processo = gsub('[^0-9]', '', arq)) %>% select(-arq) save(d_cpo_sg, file = 'data/d_cpo_sg.rda')
arqs <- dir('~/Downloads/lucrosCessantes/data-raw/cpo-sg', full.names = TRUE) resultados <- decisao_cpo_sg(arqs) %>% mutate(n_processo = gsub('[^0-9]', '', arq)) %>% select(-arq)
# save(resultados, file = 'data/resultados.rda') data(resultados) negaram <- 'nega[^(va)].+p?rovime|nego |nao provid|mantivera' parcial <- 'parcial|[^(conheceram )]+em parte|provimento em parte' nconhec <- 'nao conhec|anula[dr]|prejudic|vista|diligencia|negaram conhecimento' provido <- 'deram provimento|deferiram o pedido|integral provimento|julgaram procedente' add_key2 <- function(d, lab, re) { d <- mutate(d, lab = ifelse(str_detect(decisao, re), lab, '')) nm <- names(d) nm[nm == 'lab'] <- lab names(d) <- nm d } resultados <- resultados %>% filter(data != 'erro', !is.na(decisao)) %>% mutate(decisao = gsub(' +', ' ', desacentuar(tolower(decisao))), decisao = gsub('parcialmente vencid', '', decisao), decisao = ifelse(str_detect(decisao, '(parcialmente )?vencid'), str_sub(decisao, 1L, str_locate(decisao, '(parcialmente )?vencid')[, 2]), decisao), decisao = ifelse(str_detect(decisao, '\\(b\\).+minist|2\\..+minist'), str_sub(decisao, 1L, str_locate(decisao, '\\(b\\).+minist|2\\..+minist')[, 1]), decisao)) %>% add_key2('negaram', negaram) %>% add_key2('parcialmente', parcial) %>% add_key2('nao_conhecido_anulado_prejudicado', nconhec) %>% add_key2('provido', provido) %>% mutate(soma = paste(negaram, parcialmente, nao_conhecido_anulado_prejudicado, provido), soma = str_trim(gsub(' +', ' ', soma)), soma = ifelse(str_detect(soma,'nao_conhecido') & soma != 'nao_conhecido_anulado_prejudicado', gsub('nao_conhecido_anulado_prejudicado', '', soma), soma), soma = str_trim(gsub(' +', ' ', soma)), soma = ifelse(soma == 'parcialmente provido', 'parcialmente', soma), soma = ifelse(soma == 'negaram parcialmente' & str_detect(decisao, 'mantiver'), 'parcialmente', soma), soma) %>% rename(resultado = soma) %>% select(n_processo, data, decisao, resultado) aux <- resultados %>% mutate(data = as.Date(lubridate::dmy(data))) %>% arrange(desc(data)) %>% distinct(n_processo) %>% count(resultado, sort = TRUE) aux %>% mutate(`%` = scales::percent(n / sum(n))) %>% bind_rows(data_frame(resultado = 'Total', n = sum(aux$n), `%` = '100%')) %>% knitr::kable()
path <- '~/Downloads/lucrosCessantes/data-raw/inteiro-teor' cd_acordao <- d_lc$cdacordao cd_acordao <- cd_acordao[!cd_acordao %in% gsub('[^0-9]', '', dir(path))] res <- baixar_inteiro_teor(cd_acordao, path) pdf <- dir(path, full.names = TRUE) txt <- gsub('\\.pdf$', '.txt', gsub('inteiro-teor/', 'inteiro-teor-text/', pdf)) plyr::l_ply(1:length(pdf), function(i) { system(sprintf('pdftotext %s %s', pdf[i], txt[i])) }, .progress = 'text')
Add the following code to your website.
For more information on customizing the embed code, read Embedding Snippets.