Julio Trecenti
r Sys.Date()
Caso queira reproduzir essa pesquisa, clone o repositório e carregue o projeto
clicando no arquivo .RProj
.
git clone https://github.com/jtrecenti/brunoSalama
No RStudio, rode
devtools::use_data_raw()
devtools::document()
devtools::install()
Em seguida, rode os códigos do arquivo vignettes/bruno-salama.Rmd
cuidadosamente, chunk por chunk, verificando os resultados de cada passo. O
processo é instável pois depende de internet e configurações de OS. Recomendável
utilizar linux.
library(dplyr)
library(stringr)
library(tidyr)
library(lubridate)
library(purrr)
library(httr)
library(ggplot2)
library(brunoSalama)
knitr::opts_chunk$set(echo = FALSE)
Nesse estudo, vamos buscar dados no TJSP para ver se uma pesquisa é factível.
Hipótese: % de julgamento pró devedor muda de acordo com a taxa de juros.
## [1] 45428
\n | result | \nn | \nprop | \n
---|
\n | magistrado | \nn | \nprop | \n
---|
\n | magistrado | \nn | \nACORDO/EXTINTO/VAZIO | \nIMPROCEDENTE | \nPARCIALMENTE | \nPROCEDENTE | \n
---|
## Observations: 23,989
## Variables: 16
## $ n_processo (chr) "00000012820138260099", "0000002732013826037...
## $ digital (lgl) FALSE, FALSE, FALSE, FALSE, FALSE, FALSE, FA...
## $ data_distribuicao (date) 2013-01-07, 2013-01-08, 2014-01-09, 2014-01...
## $ valor (dbl) 3566.87, 19740.99, 3676.58, 51315.90, 7130.4...
## $ txt (chr) "\n\nSENTENÇA\n\nProcesso nº:0000001-28.2013...
## $ magistrado (chr) "Adriana Andrade Pessi", "Ayman Ramadan", "F...
## $ comarca (chr) "Bragança Paulista", "Monte Azul Paulista", ...
## $ foro (chr) "Foro de Bragança Paulista", "Foro de Monte ...
## $ vara (chr) "2ª Vara Cível", "Vara Única", "Vara do Juiz...
## $ data_sentenca (date) 2014-04-30, 2014-06-23, 2014-04-01, 2014-10...
## $ cod_sentenca (chr) "2RZ0D00010000-99-PG5JUN-15243022", "AAZ0D00...
## $ autor (chr) "Claudio Ramalho", "Rafael Calin Zeitoum", "...
## $ reu (chr) "Banco Santander Leasing S/A Arrendamento Me...
## $ tempo (dbl) 478, 531, 82, 265, 390, 151, 589, 75, 594, 3...
## $ valor_sm (dbl) 4.403543, 24.371593, 4.538988, 63.352963, 8....
## $ result (chr) "PARCIALMENTE", "IMPROCEDENTE", "PROCEDENTE"...
Observa-se que os processos digitais são mais recentes. Isso é óbvio, mas significa que não é possível comparar o tempo de processos digitais e físicos, pois há uma truncagem e só consideraríamos os processos digitais mais recentes.
Observa-se algumas flutuações e uma queda de produtividade no final/início do ano, mas nada muito relevante
## 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
## 1 77 120 169 224 290 364 465 609 829 9627
O tempo é altamente assimétrico, apresentando 48 valores que podem ser considerados aberrantes (> 10 anos). Sugere-se remover essas observações.
\n | comarca | \nn | \nprop | \n
---|
Por quê Campinas/Guarulhos não está em segundo? Por quê Franca está em segundo? Possível explicação: viés na disponibilidade dos dados.
\n | comarca | \nn | \nACORDO/EXTINTO/VAZIO | \nIMPROCEDENTE | \nPARCIALMENTE | \nPROCEDENTE | \n
---|
Também é possível notar que as decisões mudam bastante por comarca...
\n | comarca | \nforo | \nn | \nACORDO/EXTINTO/VAZIO | \nIMPROCEDENTE | \nPARCIALMENTE | \nPROCEDENTE | \n
---|
... E por foro...
\n | foro | \nvara | \nn | \nACORDO/EXTINTO/VAZIO | \nIMPROCEDENTE | \nPARCIALMENTE | \nPROCEDENTE | \n
---|
... E por vara.
\n | media | \nsd | \nmin | \n1quart | \nmediana | \n3quart | \nmax | \n
---|
Pode-se observar que a variável é altamente assimétrica
\n | comarca | \nn | \nmedia | \nsd | \nmin | \n1quart | \nmediana | \n3quart | \nmax | \n
---|
\n | result | \nn | \nmedia | \nsd | \nmin | \n1quart | \nmediana | \n3quart | \nmax | \n
---|
Add the following code to your website.
For more information on customizing the embed code, read Embedding Snippets.