Si querés procesar datos de la Encuesta Permanente de Hogares (EPH)
elaborada por el Instituto Nacional de Estadística y Censos de la
República Argentina
(INDEC) mediante el
lenguaje de programación R, la librería
eph
tiene por objeto facilitar tu trabajo.
El paquete cumple un rol fundamental en la democratización de la posibilidad de procesar los datos publicados por INDEC y así obtener conclusiones independientes de aquellas publicadas en los informes elaborados por el organismo. Dado que la información de la EPH constituye una de las principales fuentes para el análisis de las problemáticas sociales presentes en Argentina, el paquete no sólo posibilita investigaciones académicas y periodísticas, sino que también contribuye a la formulación de políticas públicas fundamentadas en evidencia.
Algunas de sus funciones son:
get_microdata()
: Descarga las bases de microdatos,
organize_panels()
: Permite armar un pool de datos en panel de la
EPH continua,
organize_cno()
: Clasifica las ocupaciones según el Clasificador
Nacional de Ocupaciones (CNO) 2001
organize_caes()
: Clasifica las actividades económicas según el
Clasificador de Actividades Economicas para encuestas
Sociodemograficas (CAES) Mercosur 1.0 y el CAES Mercosur
organize_labels()
: Etiqueta las bases siguiendo el último
diseño de
registro
map_agglomerates()
: Mapa de indicadores por aglomerado
El paquete también cuenta con dataframes útiles para el trabajo con la EPH. Algunos de estos son:
diccionario_regiones
: Diccionario de regiones según el diseño de
registro de la EPH
diccionario_aglomerados
: Diccionario de aglomerados según el
diseño de registro de la EPH
centroides_aglomerados
: Tabla de centroides de los aglomerados
(basado en https://www.indec.gob.ar/indec/web/Nivel4-Tema-1-39-120)
adulto_equivalente
: Tabla de valores de adulto equivalente segun
sexo y edad (ver definición
mtodológica)
Para la versión estable
install.packages("eph")
Para la versión en desarrollo
# install.packages('devtools')
# si no tiene instalado devtools
devtools::install_github("holatam/eph")
Ejemplo de descarga de microdatos
# Cargo la libreria
library(eph)
base_individual <- get_microdata(
year = 2018:2019, # especifco el año
trimester = 1, # el trimestre
type = "individual", # y el tipo de base
vars = c("PONDERA", "ESTADO", "CAT_OCUP")
) # opcionalmente, puedo especificar las variables que deseo utilizar.
base_individual
#> # A tibble: 117,320 × 3
#> PONDERA ESTADO CAT_OCUP
#> <int> <int> <int>
#> 1 684 4 0
#> 2 1008 3 0
#> 3 1008 1 1
#> 4 1008 2 0
#> 5 886 1 2
#> 6 594 3 0
#> 7 594 3 0
#> 8 546 3 0
#> 9 509 1 3
#> 10 509 1 3
#> # ℹ 117,310 more rows
Podés citar este paquete como “se obtuvieron y/o normalizaron los datos de la Encuesta Permanente de Hogares (EPH-INDEC) utilizando el paquete de R ‘eph’ (Kozlowski et al, 2020)”.
La referencia completa para incluir en la bibliografía es:
Diego Kozlowski, Pablo Tiscornia, Guido Weksler, German Rosati and Natsumi Shokida (2020). eph: Argentina's Permanent Household Survey Data and Manipulation Utilities. R package version https://doi.org/10.5281/zenodo.3462677
Si necesitás la entrada bib:
@Manual{kozlowski2020,
title = {eph: Argentina's Permanent Household Survey Data and Manipulation Utilities},
author = {Diego Kozlowski and Pablo Tiscornia and Guido Weksler and German Rosati and Natsumi Shokida},
year = {2020},
doi = {10.5281/zenodo.3462677},
url = {https://holatam.github.io/eph/},
}
Este paquete se propone incorporar cualquier función de propósitos generales que utilice como base los datos de la Encuesta Permanente de Hogares. Todos los aportes en este sentido son bienvenidos.
Si trabajas con la EPH y querés agregar tu función, te recomendamos que leas los siguientes consejos sobre cómo como colaborar
Any scripts or data that you put into this service are public.
Add the following code to your website.
For more information on customizing the embed code, read Embedding Snippets.