library(dplyr)
library(tidyr)
library(lubridate)
library(stringr)
setwd('../')

cna_crianca_disp <- read.csv2('data-raw/cna_crianca_disp.csv', as.is=TRUE)

cna_crianca_disp %>% 
  filter(situacao_crianca == 'Disponivel') %>%
  mutate(data = lubridate::dmy(DT.Disponibilização.Criança),
         mes=lubridate::month(data), 
         ano = lubridate::year(data)) %>%
  mutate(na_entrada = is.na(mes)) %>%
  count(sigla_estado_nascimento, na_entrada) %>%
  spread(na_entrada, n, fill = 0)

# isso aqui liga as tabelas de raca_cor do cna e cnca  
tab <- structure(list(raca_cor = c("Amarela", "Branca", "Indiferente", 
"Indígena", "Parda", "Preta"), n = c(80L, 5490L, 1L, 80L, 10983L, 
2593L)), .Names = c("raca_cor", "n"), row.names = c(NA, -6L), class = c("tbl_df", 
"tbl", "data.frame"), drop = TRUE) %>%
  mutate(raca_cor_cnca = c('AMARELA', 'BRANCA', '(NULL)', 'INDÍGENA',
                           'PARDA', 'NEGRA'))

cnca_crianca_disp <- read.csv('data-raw/cnca_guia_crianca.csv', as.is=TRUE, sep = '@') %>%
  mutate(data = as.character(lubridate::ymd(data_nascimento))) %>%
  mutate(sexo = ifelse(SEXO == 'MASCULINO', 'M', 'F')) %>%
  inner_join(tab, c('raca_cor'='raca_cor_cnca'))


cna_crianca_disp %>% 
  tbl_df() %>%
  mutate(data = as.character(lubridate::dmy(data_nascimento))) %>%
  inner_join(cnca_crianca_disp, c('data' = 'data',
                                 'sigla_estado_nascimento' = 'UF',
                                 'sexo' = 'sexo',
                                 'raca_cor' = 'raca_cor.y')) %>%
  tbl_df() %>%
  count(Codigo.da.Criança, sort = TRUE) %>%
  filter(n > 1)


jtrecenti/adocao documentation built on May 20, 2019, 3:15 a.m.