a_muestra: función de muestreo

a_muestraR Documentation

función de muestreo

Description

Función para calcular muestras complejas

Usage

a_muestra(
  datos,
  var_estratos,
  var_tamano,
  casos,
  casos_x_unidad,
  tolerancia_tamano = 1.5,
  unidad = "seccion",
  casos_maximos_seccion,
  repeticiones_muestreo_estratos = 1,
  repeticiones_muestreo_unidades = 1,
  semilla = 42,
  minimo_duplicar = 0.8,
  forzar_proporcionalidad = 0,
  porcentaje_aceptacion_estrato_unico = 0.8,
  fusiona_estratos = T
)

Arguments

datos

dataframe - marco muestral

var_estratos

char vector - nombres de las variables con las que se construyen los estratos

var_tamano

character - nombre de la variable con los tamanos

casos

numeric - número de casos en la muestra

casos_x_unidad

numeric - número de casos por unidad seleccionada

tolerancia_tamano

numeric - multiplicador de tolerancia. Default = 1.5

unidad

character - nombre de la variable que contiene el ID de las unidades seleccionadas

casos_maximos_seccion

numeric - número máximo de casos por unidad

repeticiones_muestreo_estratos

numeric - número de muestras generadas, siempre se seleccionará la muestra con mayor verosimilitud con base en ese número. Default = 1

repeticiones_muestreo_unidades

numeric - número de asignaciones probabilísticas generadas, la asignación con mayor verosimilitud se selecciona. Default = 1

semilla

numeric - semilla aleatoria utilizada para mantener la replicabilidad. Default = 1

minimo_duplicar

numeric - número mayor a 0 y menor a 1 que decir del punto de corte para n-plicar. Default = .8

forzar_proporcionalidad

numeric - número entre 0 y 1 que define el porcentaje a partir del cuál se forzará una asignación proporcional preferencial cuando se hace la asignación estratificada

porcentaje_aceptacion_estrato_unico

numeric - número entre 0 y 1 que determina el tamaño mínimo que tendrá algo para ser considerado como estrato. Default = .8

fusiona_estratos

boolean - valor que indica si el último estrato creado se fusionará con el penúltimo. Default = T

Details

La estratificación para el caso electoral considera generalmente los municipios y los distritos federales, en el caso no electoral tomamos una combinación de municipios, colonias y códigos postales.

Cuando una unidad tiene un tamaño igual o mayor a N / n se obtiene una probabilidad de inclusión 1 (Salvo ajustes cuando existen múltiples instancias de estas unidades).

La verosimilitud se refiere a la probabilidad de haber visto una ejecución específica de un evento aleatorio. Al quedarnos con muestras más verosímiles disminuímos la probabilidad de quedarnos con una muestra desafortunada

El muestreo se realiza con una estratificación seguida de un muestreo sistemático de probabilidades proporcionales al tamaño.

Value

dataframe - el marco muestral original con 2 nuevas columnas correspondientes a la selección de la muestra (0,1) y a las probabilidades de inclusión


pelishk/upax_library documentation built on Nov. 28, 2022, 10:45 a.m.