a_muestra | R Documentation |
Función para calcular muestras complejas
a_muestra( datos, var_estratos, var_tamano, casos, casos_x_unidad, tolerancia_tamano = 1.5, unidad = "seccion", casos_maximos_seccion, repeticiones_muestreo_estratos = 1, repeticiones_muestreo_unidades = 1, semilla = 42, minimo_duplicar = 0.8, forzar_proporcionalidad = 0, porcentaje_aceptacion_estrato_unico = 0.8, fusiona_estratos = T )
datos |
dataframe - marco muestral |
var_estratos |
char vector - nombres de las variables con las que se construyen los estratos |
var_tamano |
character - nombre de la variable con los tamanos |
casos |
numeric - número de casos en la muestra |
casos_x_unidad |
numeric - número de casos por unidad seleccionada |
tolerancia_tamano |
numeric - multiplicador de tolerancia. Default = 1.5 |
unidad |
character - nombre de la variable que contiene el ID de las unidades seleccionadas |
casos_maximos_seccion |
numeric - número máximo de casos por unidad |
repeticiones_muestreo_estratos |
numeric - número de muestras generadas, siempre se seleccionará la muestra con mayor verosimilitud con base en ese número. Default = 1 |
repeticiones_muestreo_unidades |
numeric - número de asignaciones probabilísticas generadas, la asignación con mayor verosimilitud se selecciona. Default = 1 |
semilla |
numeric - semilla aleatoria utilizada para mantener la replicabilidad. Default = 1 |
minimo_duplicar |
numeric - número mayor a 0 y menor a 1 que decir del punto de corte para n-plicar. Default = .8 |
forzar_proporcionalidad |
numeric - número entre 0 y 1 que define el porcentaje a partir del cuál se forzará una asignación proporcional preferencial cuando se hace la asignación estratificada |
porcentaje_aceptacion_estrato_unico |
numeric - número entre 0 y 1 que determina el tamaño mínimo que tendrá algo para ser considerado como estrato. Default = .8 |
fusiona_estratos |
boolean - valor que indica si el último estrato creado se fusionará con el penúltimo. Default = T |
La estratificación para el caso electoral considera generalmente los municipios y los distritos federales, en el caso no electoral tomamos una combinación de municipios, colonias y códigos postales.
Cuando una unidad tiene un tamaño igual o mayor a N / n se obtiene una probabilidad de inclusión 1 (Salvo ajustes cuando existen múltiples instancias de estas unidades).
La verosimilitud se refiere a la probabilidad de haber visto una ejecución específica de un evento aleatorio. Al quedarnos con muestras más verosímiles disminuímos la probabilidad de quedarnos con una muestra desafortunada
El muestreo se realiza con una estratificación seguida de un muestreo sistemático de probabilidades proporcionales al tamaño.
dataframe - el marco muestral original con 2 nuevas columnas correspondientes a la selección de la muestra (0,1) y a las probabilidades de inclusión
Add the following code to your website.
For more information on customizing the embed code, read Embedding Snippets.