PnadcTidy: Transforma microdados baixados da PnadC em uma base de dados...
In gustavoppmonteiro/PnadcTidy:

Description Usage Arguments Details Value Author(s) References Examples

View source: R/PnadcDIEESE.R

A função PnadcTidy transforma microdados baixados da PnadC em uma base de dados estruturados (tidy dataset), do tipo definido por Wickham (2014).

Para usá-lo é preciso antes baixar os microdados e também o arquivo de Input para o SAS, disponíveis em: ftp://ftp.ibge.gov.br/Trabalho_e_Rendimento/Pesquisa_Nacional_por_Amostra_de_Domicilios_continua/.

Também é necessário declarar quais variáveis serão utilizadas (não é necessário declarar as variáveis de peso e do deseho amostral).

1	PnadcTidy(inputSAS,arquivoPnad, variaveis)

`inputSAS`	usado para especificar o nome do arquivo Input do SAS (deve terminar em ".txt").
`arquivoPnad`	usado para especificar o nome do arquivo de microdados da PnadC (deve terminar em ".txt").
`variaveis`	usado para selecionar as variáveis da PnadC que serão mantidas na base.

O pacote PnadcTidy permite que os microdados da PNAD Contínua sejam transformados em uma base de dados estruturados (tidy dataset).

A função inputPnadC dele é inspirada no pacote "PNADcIBGE", de Douglas Braga.

Diferentemente do PNADcIBGE, o PnadcTidy retorna um banco relacional, que é mais fácil de ser manuseado utilizando, por exemplo, os pacotes dplyr e ggplot2 - ambos incluídos no pacote tidyverse. Embora isso signifique que este banco não contenha a declaração do desenho amostral, isso também representa uma vantagem para aquelas pessoas com menos familiaridade com os conceitos relacionados ao desenho amostral, como Coeficiente de Variação.

A desvantagem é que, na hora de extrair informações desse banco relacional, é necessário declarar a variável de peso amostral (V1028, para as pesquisas trimestrais ou V1032 para as pesquisas anuais).

Por exemplo, após rodar o comando PnadcTidy para os microdados de determinado trimestre, e salvar o banco com o nome PNAD1, se alguém quiser obter a frequência de pessoas segundo Sexo (V2007) e Condição na ocupação (V4002), terá que instalar o pacote questionr e, em seguida, rodar as seguintes linhas de comando:

tabela <- wtd.table(PNAD1$V2007, PNAD1$VD4002, weights = PNAD1$V1028)

tabela

Observe que no comando acima o peso amostral é especificado utilizando o parâmetro "weights".

Retorna uma base de dados estruturados (tidy dataset) que contém apenas as variáveis selecionadas e as variáveis de peso e do desenho amostral.

Gustavo Monteiro

Wickham, H. (2014). Tidy data. Journal of Statistical Software, 59(10):1–23. Disponível em: <https://www.jstatsoft.org/article/view/v059i10>.

Braga, D. Análise de microdados da PNAD Contínua com os pacotes PNADcINGE e survey. Disponível em: <https://rpubs.com/BragaDouglas/335574>.

# Depois de baixar os microdados do 4º trimestre de 2019
# e o arquivo de input, salvá-los em uma pasta local e
# definir essa pasta como a pasta de trabalho
# usando o comando setwd(caminho/da/pasta):

PNADc04T2019 <- PnadcTidy(inputSAS="Input_PNADC_trimestral.txt",
                                arquivoPnad="PNADC_042019.txt",
                                variaveis=c("VD4009", "V2009", "V2007" ,"UF", "VD4016"))

# Retorna um tidy dataset, alocado no objeto PNADc04T2019.
# Ele conterá as variáveis do desenho amostral
# e também as variáveis VD4009, V2009, V2007 UF e VD4016.

***