Description Usage Arguments Details Value Author(s) References Examples
A função PnadcTidy transforma microdados baixados da PnadC em uma base de dados estruturados (tidy dataset), do tipo definido por Wickham (2014).
Para usá-lo é preciso antes baixar os microdados e também o arquivo de Input para o SAS, disponíveis em: ftp://ftp.ibge.gov.br/Trabalho_e_Rendimento/Pesquisa_Nacional_por_Amostra_de_Domicilios_continua/.
Também é necessário declarar quais variáveis serão utilizadas (não é necessário declarar as variáveis de peso e do deseho amostral).
1 | PnadcTidy(inputSAS,arquivoPnad, variaveis)
|
inputSAS |
usado para especificar o nome do arquivo Input do SAS (deve terminar em ".txt"). |
arquivoPnad |
usado para especificar o nome do arquivo de microdados da PnadC (deve terminar em ".txt"). |
variaveis |
usado para selecionar as variáveis da PnadC que serão mantidas na base. |
O pacote PnadcTidy permite que os microdados da PNAD Contínua sejam transformados em uma base de dados estruturados (tidy dataset).
A função inputPnadC dele é inspirada no pacote "PNADcIBGE", de Douglas Braga.
Diferentemente do PNADcIBGE, o PnadcTidy retorna um banco relacional, que é mais fácil de ser manuseado utilizando, por exemplo, os pacotes dplyr e ggplot2 - ambos incluídos no pacote tidyverse. Embora isso signifique que este banco não contenha a declaração do desenho amostral, isso também representa uma vantagem para aquelas pessoas com menos familiaridade com os conceitos relacionados ao desenho amostral, como Coeficiente de Variação.
A desvantagem é que, na hora de extrair informações desse banco relacional, é necessário declarar a variável de peso amostral (V1028, para as pesquisas trimestrais ou V1032 para as pesquisas anuais).
Por exemplo, após rodar o comando PnadcTidy para os microdados de determinado trimestre, e salvar o banco com o nome PNAD1, se alguém quiser obter a frequência de pessoas segundo Sexo (V2007) e Condição na ocupação (V4002), terá que instalar o pacote questionr e, em seguida, rodar as seguintes linhas de comando:
tabela <- wtd.table(PNAD1$V2007, PNAD1$VD4002, weights = PNAD1$V1028)
tabela
Observe que no comando acima o peso amostral é especificado utilizando o parâmetro "weights".
Retorna uma base de dados estruturados (tidy dataset) que contém apenas as variáveis selecionadas e as variáveis de peso e do desenho amostral.
Gustavo Monteiro
Wickham, H. (2014). Tidy data. Journal of Statistical Software, 59(10):1–23. Disponível em: <https://www.jstatsoft.org/article/view/v059i10>.
Braga, D. Análise de microdados da PNAD Contínua com os pacotes PNADcINGE e survey. Disponível em: <https://rpubs.com/BragaDouglas/335574>.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 | # Depois de baixar os microdados do 4º trimestre de 2019
# e o arquivo de input, salvá-los em uma pasta local e
# definir essa pasta como a pasta de trabalho
# usando o comando setwd(caminho/da/pasta):
PNADc04T2019 <- PnadcTidy(inputSAS="Input_PNADC_trimestral.txt",
arquivoPnad="PNADC_042019.txt",
variaveis=c("VD4009", "V2009", "V2007" ,"UF", "VD4016"))
# Retorna um tidy dataset, alocado no objeto PNADc04T2019.
# Ele conterá as variáveis do desenho amostral
# e também as variáveis VD4009, V2009, V2007 UF e VD4016.
***
|
Add the following code to your website.
For more information on customizing the embed code, read Embedding Snippets.