suppressPackageStartupMessages(library(dplyr))
library(tidyr)
library(stringr)
library(lubridate)
library(knitr)
library(ggplot2)
library(tjsp)
library(lucrosCessantes)

Download e parse CJSG

l <- dir('data-raw/cjsg/')
pags <- as.numeric(unique(str_split_fixed(l, '_', 2)[, 1]))
if(length(pags) == 0) pags <- 1

# consulta realizada em 17/08/2015
aux <- cjsg(ementa = 'lucro cessante',
            min_pag = max(pags), max_pag = Inf, salvar = TRUE, 
            path = 'data-raw/cjsg/')

# consulta teve como resultado 18877 documentos
# mas apenas 18218 eram com números de 20 dígitos (numeração CNJ)
# e foram excluídos.

d_lc <- carregar_pasta('data-raw/cjsg/') %>%
  setNames(arrumar_nomes(names(.))) %>%
  mutate(n_processo = gsub('[^0-9]', '', n_processo)) %>%
  filter(str_length(n_processo) == 20) %>%
  distinct(n_processo, cdacordao) %>%
  select(relator:pag)

save(d_lc, file = 'data/d_lc.rda')

Download e parse CPO-SG

d_lc <- readRDS('data/d_lc.rds')
res <- cpo_sg(unique(d_lc$n_processo), path = 'data-raw/cpo-sg')

# ao rodar o parser, tivemos problemas com 953 arquivos
# Esses arquivos foram baixados novamente. Deu na mesma.
# Acabei retirando esses processos.
d_cpo_sg <- parse_cpo_sg('data-raw/cpo-sg', keyval = TRUE) %>%
  filter(key != 'erro', val != 'erro') %>%
  mutate(n_processo = gsub('[^0-9]', '', arq)) %>%
  select(-arq)

save(d_cpo_sg, file = 'data/d_cpo_sg.rda')

Resultados dos processos

arqs <- dir('~/Downloads/lucrosCessantes/data-raw/cpo-sg', full.names = TRUE)
resultados <- decisao_cpo_sg(arqs) %>%
  mutate(n_processo = gsub('[^0-9]', '', arq)) %>%
  select(-arq)
# save(resultados, file = 'data/resultados.rda')
data(resultados)

negaram <- 'nega[^(va)].+p?rovime|nego |nao provid|mantivera'
parcial <- 'parcial|[^(conheceram )]+em parte|provimento em parte'
nconhec <- 'nao conhec|anula[dr]|prejudic|vista|diligencia|negaram conhecimento'
provido <- 'deram provimento|deferiram o pedido|integral provimento|julgaram procedente'

add_key2 <- function(d, lab, re) {
  d <- mutate(d, lab = ifelse(str_detect(decisao, re), lab, ''))
  nm <- names(d)
  nm[nm == 'lab'] <- lab
  names(d) <- nm
  d
}

resultados <- resultados %>%
  filter(data != 'erro', !is.na(decisao)) %>%
  mutate(decisao = gsub(' +', ' ', desacentuar(tolower(decisao))),
         decisao = gsub('parcialmente vencid', '', decisao),
         decisao = ifelse(str_detect(decisao, '(parcialmente )?vencid'), 
                          str_sub(decisao, 1L, str_locate(decisao, '(parcialmente )?vencid')[, 2]),
                          decisao),
         decisao = ifelse(str_detect(decisao, '\\(b\\).+minist|2\\..+minist'), 
                          str_sub(decisao, 1L, str_locate(decisao, '\\(b\\).+minist|2\\..+minist')[, 1]),
                          decisao)) %>%
  add_key2('negaram', negaram) %>%
  add_key2('parcialmente', parcial) %>%
  add_key2('nao_conhecido_anulado_prejudicado', nconhec) %>%
  add_key2('provido', provido) %>%
  mutate(soma = paste(negaram, 
                      parcialmente, 
                      nao_conhecido_anulado_prejudicado, 
                      provido),
         soma = str_trim(gsub(' +', ' ', soma)),
         soma = ifelse(str_detect(soma,'nao_conhecido') & soma != 'nao_conhecido_anulado_prejudicado',
                       gsub('nao_conhecido_anulado_prejudicado', '', soma), soma),
         soma = str_trim(gsub(' +', ' ', soma)),
         soma = ifelse(soma == 'parcialmente provido', 'parcialmente', soma),
         soma = ifelse(soma == 'negaram parcialmente' & str_detect(decisao, 'mantiver'), 
                       'parcialmente', soma), soma) %>%
  rename(resultado = soma) %>%
  select(n_processo, data, decisao, resultado)

aux <- resultados %>%
  mutate(data = as.Date(lubridate::dmy(data))) %>%
  arrange(desc(data)) %>%
  distinct(n_processo) %>%
  count(resultado, sort = TRUE)

aux %>%
  mutate(`%` = scales::percent(n / sum(n))) %>%
  bind_rows(data_frame(resultado = 'Total', n = sum(aux$n), `%` = '100%')) %>%
  knitr::kable()

baixando acordaos

path <- '~/Downloads/lucrosCessantes/data-raw/inteiro-teor'
cd_acordao <- d_lc$cdacordao
cd_acordao <- cd_acordao[!cd_acordao %in% gsub('[^0-9]', '', dir(path))]
res <- baixar_inteiro_teor(cd_acordao, path)


pdf <- dir(path, full.names = TRUE)
txt <- gsub('\\.pdf$', '.txt', gsub('inteiro-teor/', 'inteiro-teor-text/', pdf))
plyr::l_ply(1:length(pdf), function(i) {
  system(sprintf('pdftotext %s %s', pdf[i], txt[i]))
}, .progress = 'text')


jtrecenti/lucrosCessantes documentation built on May 20, 2019, 3:17 a.m.