parse: Parse dos arquivos HTML baixados

parseR Documentation

Parse dos arquivos HTML baixados

Description

cnc_parse_pag() transforma arquivo HTML de uma página do CNC em um data.frame.

cnc_parse_pessoa() transforma HTMLs de pesquisas do tipo http://www.cnj.jus.br/improbidade_adm/visualizar_processo.php?seq_condenacao=1101 em um data.frame com dados estruturados.

cnc_parse_processo() transforma HTMLs de pesquisas do tipo http://www.cnj.jus.br/improbidade_adm/visualizar_processo.php?seq_processo=9421 em um data.frame com dados estruturados.

cnc_parse_pessoa_infos() transforma HTMLs de pesquisas do tipo http://www.cnj.jus.br/improbidade_adm/visualizar_condenacao.php?seq_condenacao=1&rs=getDadosParte&rst=&rsrnd=0&rsargs[]=1 em um data.frame com dados estruturados.

Usage

cnc_parse_pag(arq)

cnc_parse_pessoa(arq)

cnc_parse_processo(arq)

cnc_parse_pessoa_infos(arq)

Arguments

arq

caminho do arquivo que deve ser processado.

Value

Para cnc_parse_pag(), uma tibble com as colunas

  • id id (1 a 15) do indivíduo obtido na página.

  • key "nm_pessoa" ou "num_processo", indicando se é o nome da pessoa ou número do processo.

  • value nome da pessoa ou número do processo.

  • link para acessar informações da pessoa ou do processo (info utilizada nos outros scrapers).

Para cnc_parse_pessoa(), uma tibble com as colunas

  • key nome (label) da informação. Geralmente contém localização do processo, data da propositura e número do processo.

  • value conteúdo da informação.

Para cnc_parse_processo(), uma tibble com as colunas

  • key nome (label) da informação. Geralmente contém localização do processo, data da propositura e número do processo.

  • value conteúdo da informação.

Para cnc_parse_pessoa_infos(), uma tibble com as colunas

  • key nome (label) da informação. Geralmente contém id da pessoa, tipo de pessoa, nome, sexo, funcionário público (S ou N) e código. Se for público, informa também esfera, órgão, cargo, uf.

  • value conteúdo da informação.


abjur/cnc documentation built on July 15, 2022, 4:09 p.m.