knitr::opts_chunk$set( collapse = TRUE, comment = "#>", fig.path = "README-" )
Scraper de estatísticos registrados nas pesquisas eleitorais do Tribunal Superior Eleitoral (TSE). O objetivo desse pacote é mostrar todas as pesquisas eleitorais registradas e algumas de suas características, com o fim de obter uma visão geral dos registros e identificar potenciais fraudes.
Você pode instalar o pesqEle from github com:
# install.packages("devtools") devtools::install_github("conre3/pesqEle")
Quando esse pacote estiver no CRAN, você poderá instalá-lo rodando
install.packages("pesqEle")
A função pe_2018()
Faz o download de todas as pesquisas de 2018 por raspagem de dados. Por padrão, os arquivos HTML são armazenados na pasta data-raw/html_2018
, mas é possível alterar essa pasta pelo parâmetro path=
.
pe <- pe_2018("pasta") dplyr::glimpse(pe)
Observations: 184 Variables: 24 $ id_seq <int> 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14... $ id_pesq <chr> "MA-05302/2018", "DF-03958/2018", "DF-06553/2... $ info_uf <chr> "MA", "DF", "DF", "PI", "PI", "SP", "SP", "PI... $ info_election <chr> "Eleições Gerais 2018", "Eleições Gerais 2018... $ info_position <chr> "", "Deputado Distrital", "Deputado Federal",... $ comp_nm <chr> "M R BORGES SERVICOS / MBO PUBLICIDADE, MARKE... $ comp_cnpj <chr> "00905916000190", "00850844000121", "00850844... $ comp_contract_same <chr> "Sim", "Sim", "Sim", "Não", "Não", "Não", "Nã... $ stat_id <chr> "1791", "CONRE 1a. Região No. 9403", "CONRE 1... $ stat_nm <chr> "ANTONIO CARLOS RODRIGUES BARBOSA", "LUCIANA ... $ pesq_n <dbl> 10973, 3200, 3200, 320, 320, 601, 601, 320, 8... $ pesq_val <dbl> 15700, 32000, 32000, 3000, 3000, 6000, 0, 300... $ pesq_contractors <chr> "CNPJ: 00905916000190 - M R BORGES SERVICOS",... $ pesq_origin <chr> "Vazio", "Vazio", "Vazio", "Recursos proprios... $ pesq_same <lgl> FALSE, FALSE, FALSE, FALSE, FALSE, FALSE, FAL... $ dt_reg <date> 2018-05-12, 2018-03-26, 2018-03-26, 2018-02-... $ dt_pub <date> 2018-05-18, 2018-04-01, 2018-04-01, 2018-02-... $ dt_start <date> 2018-03-26, 2018-03-21, 2018-03-21, 2018-02-... $ dt_end <date> 2018-05-04, 2018-03-30, 2018-03-30, 2018-02-... $ txt_verif <chr> "Sistema interno de controle e verificação, c... $ txt_method <chr> "METODOLOGIA: A pesquisa foi realizada median... $ txt_about <chr> "Trata-se de uma amostra não aleatória por co... $ txt_plan <chr> ". PLANO AMOSTRAL E INTERVALOS DE CONFIANÇA: ... $ stat_unique <chr> "1791_A535", "9403_L252", "9403_L252", "5102_...
Ao rodar pela primeira vez, provavelmente o download demorará por volta de 15-20 minutos, dependendo da conexão com a internet. Nas próximas vezes o download é mais rápido pois o programa não baixa pesquisas já armazenadas em arquivos HTML.
Se não quiser rodar a função pe_2018()
, armazenamos os dados no objeto pesqEle::pesqEle_2018
. Esse objeto é uma data.frame()
com as mesmas colunas resultantes de pe_2018()
. Essas variáveis são:
id_seq
: ID sequencialid_pesq
: ID de registro da pesquisainfo_uf
: Unidade Federativa indicando abrangência da pesquisa ("BR" = Brasil)info_election
: Eleição (no caso, sempre 2018)info_position
: Cargo eleitoralcomp_nm
: Nome da empresa que realizou a pesquisacomp_cnpj
: CNPJ da empresa que realizou a pesquisacomp_contract_same
: Contratante é a própria empresa?stat_id
: ID do estatísticostat_nm
stat_unique
: Código único do estatístico. Os nomes dos estatísticos estavam escritos de formas diferentes, então arrumamos utilizando o pacote SoundexBR
e outras heurísticas. Nada garante que o pacote contenha mais erros nos nomes.pesq_n
: Tamanho da amostra.pesq_val
: Custo da pesquisa informado no registro.pesq_contractors
: Empresas que contrataram a pesquisa.pesq_origin
: Origem dos recursos da pesquisa.pesq_same
: Indica se o contratante da pesquisa é a própria empresa e a pesquisa foi realizada com recursos próprios (em 2018 não tem nenhuma).dt_reg
: Data de registro da pesquisa.dt_pub
: Data de publicação da pesquisa.dt_start
: Data de início da pesquisa.dt_end
: Data de término da pesquisa.txt_verif
, txt_method
, txt_about
, txt_plan
: informações adicionais da pesquisa, geralmente em texto, sobre metodologia, aplicação e outros detalhes.Após instalar o pacote, você pode rodar o app do pesqEle
rodando
shiny::runApp(system.file("app", package = "pesqEle"))
Para rodar o app, além dos pacotes do tidyverse
e shiny
, você precisará instalar os pacotes shinydashboard
, highcharter
, shinyBS
e shinyjs
. Todos eles estão no CRAN e podem ser instalados via install.packages()
.
Os nomes dos estatísticos estavam escritos de formas diferentes, então arrumamos utilizando o pacote SoundexBR
e outras heurísticas. Nada garante que o pacote contenha mais erros nos nomes.
MIT
Add the following code to your website.
For more information on customizing the embed code, read Embedding Snippets.