knitr::opts_chunk$set( collapse = TRUE, comment = "#>", fig.path = "README-", fig.width = 5, fig.height = 3 )
Esse pacote serve para quebrar o captcha da Receita Federal que aparece neste endereço.
Um exemplo deste captcha pode ser observado na imagem abaixo.
library(captchaReceita) library(magrittr) a <- download() %>% ler() b <- download() %>% ler() a %>% desenhar() b %>% desenhar()
Depois da classificação de 1100 captchas manualmente. Criamos um algoritmo capaz de processá-los em formatos que podem ser inseridos em um algoritmo de classificação.
Por exemplo, a imagem tratada fica neste formato.
a %>% captchaReceita:::processar() %>% desenhar() b %>% captchaReceita:::processar() %>% desenhar()
Usamos a função preparar
para preparar um banco de dados completo.
bd <- preparar(dir = "data-raw/")
Depois de preparar o banco de dados, separamos o banco de dados em construção e validação e ajustamos um modelo de random forest.
A função separar
separa o banco em duas partes.
bd_s <- separar(bd)
O ajuste do modelo foi realizado da seguinte forma.
library(randomForest) modelo <- randomForest(letras ~ ., data = bd_s$treino %>% dplyr::select(-arqs))
Agora podemos verificar o acerto na base de validação com o seguinte comando:
library(randomForest) load("data/bd_s.rda") load("data/modelo.rda")
calcular_erro(bd_s$teste)
Para prever p/ um novo captcha, use os seguintes comandos:
arq <- download() arq %>% ler() %>% desenhar() decodificar(arq, modelo)
Add the following code to your website.
For more information on customizing the embed code, read Embedding Snippets.