Estimation de variance dans les enquêtes de l'Insee {.unnumbered}

\

\vspace{-0.5cm} L'estimation de variance est une opération qui gagne en importance dans le \strong{processus de production d'une enquête}:

\pause \strong{Remarque} Cette présentation porte sur une composante parmi d'autres de l'imprécision associée à un processus d'enquête.

\pause Cette contribution présente:

Plan de la présentation

\large \tableofcontents[sectionstyle=show/show, subsectionstyle=hide/hide/hide]

Objectif : rendre le calcul de précision (plus) simple

\large Sources de complexité du calcul de précision

\pause \strong{Plan de sondage}

\pause \bigskip \strong{Méthodes d'estimation}

\pause \bigskip \strong{Estimateurs}

Première solution: le logiciel Poulpe

\pause Poulpe (\strong{P}rogramme \strong{O}ptimal et \strong{U}niversel pour la \strong{L}ivraison de la \strong{P}récision des \strong{E}nquêtes) est une macro SAS de calcul de précision présentée lors des 6$^\text{ème}$ JMS (1998):

\pause \bigskip La présente contribution \strong{s'appuie sur les travaux associés à Poulpe} avec quelques différences notables:

\large Nouvelle proposition (1): procéder en deux étapes

Difficultés de l'estimation de variance en pratique:

\pause \bigskip \strong{Proposition organisationnelle}: bien distinguer \strong{deux étapes}

  1. \pause \strong{Méthodologue}: analyse méthodologique, mobilisation de l'information auxiliaire, construction d'un \strong{programme d'estimation de variance} raisonnablement exact;

  2. \pause \strong{Responsable d'enquête, chargé(e) d'étude}: utilisation du programme d'estimation dans le cadre d'études ou pour répondre à des obligations réglementaires.

\large Nouvelle proposition (2): le package R gustave

\strong{Conséquence} : les programmes d'estimation de variance doivent donc

\bigskip \pause \strong{Proposition technique}: package R \strong{G}ustave: a \strong{U}ser-oriented \strong{S}tatistical \strong{T}oolkit for \strong{A}nalytical \strong{V}ariance \strong{E}stimation

Exemple d'applications de gustave à l'Insee

Le package gustave à l'Insee

Utilisé pour l'estimation de variance des enquêtes ménages périodiques: Enquête emploi en continu (EEC), dispositif Statistique sur les revenus et les conditions de vie (SRCV), Cadre de vie et sécurité (CVS), Loyers et charges.

\pause \bigskip \strong{Exemple} Enquête emploi en continu

\small \pause \bigskip {\itshape \strong{Nota bene} Les estimateurs ponctuels figurant sur les diapositives suivantes ne coïncident en général pas avec la diffusion officielle (champs de calcul différents, pas de désaisonnalisation, etc.).}

Les fichiers de calcul de précision

Le package gustave permet de produire, pour chaque millésime d'une enquête (chaque trimestre pour l'EEC) un \strong{fichier de données R} qui contient :

\pause Pour mettre en \oe uvre l'estimation de variance, \strong{il suffit de charger ce fichier} (par exemple pour le T2 2014):

\footnotesize

load("precisionEec142.RData")

\normalsize

\pause \small \bigskip \vspace{-0.4cm} \strong{Remarque} Ces fichiers de calcul de précision sont susceptibles de contenir des \strong{informations auxiliaires réidentifiantes}.

load("gustave_jms_exemple.RData")
options(width = 60)
# Note : les calculs sont effectués sur un serveur sécurisé,
# seuls les résultats sont réutilisés ici pour la présentation

\large Code : Précision du taux de chômage au T2 2014

\pause \strong{Nombre total de chômeurs} (acteu %in% 2)

\pause \footnotesize

precisionEec(z, total(acteu %in% 2))

\vspace{-0.5cm}

eec1

\pause \bigskip \normalsize \strong{Taux de chômage}

\pause \footnotesize

precisionEec(z, ratio(acteu %in% 2, acteu %in% c(1, 2)))

\vspace{-0.5cm}

eec2

\large Code : Précision du taux de chômage au T2 2014

\strong{Taux de chômage des 50 ans et plus}

\pause \footnotesize \vspace{-0.2cm}

precisionEec(z, 
  ratio(acteu %in% 2, acteu %in% c(1, 2)),
  where = age >= 50
)

\vspace{-0.5cm}

eec3[, 2:5]

\pause \normalsize \strong{Taux de chômage par région}

\pause \footnotesize \vspace{-0.2cm}

precisionEec(z, 
  ratio(acteu %in% 2, acteu %in% c(1, 2)),
  by = reg
)

\vspace{-0.5cm}

eec4[1:3, 2:6]

Principe de fonctionnement du package gustave

\og Emballer \fg{} (wrap) la complexité

L'objectif du package gustave est de \strong{préserver l'utilisateur final de la complexité} du processus d'estimation de la variance.

\pause \strong{Idée centrale} \og Emballer \fg{} la fonction d'estimation de variance complexe dans une autre fonction (appelée \og \textit{wrapper} \fg{}) plus simple d'utilisation:

Apports du package gustave

La production d'un programme d'estimation de variance avec le package gustave suppose en général \strong{trois étapes pour le ou la méthodologue}:

  1. \pause Élaborer la fonction de variance spécifique à l'enquête

    $\rightarrow$ gustave propose des \strong{fonctions optimisées} qui mettent en \oe uvre les estimateurs de variance standard.

  2. \bigskip \pause Définir le wrapper de variance

    $\rightarrow$ gustave \strong{simplifie la production} de wrappers de variance faciles à utiliser et intégrant toute l'information auxiliaire nécessaire.

  3. \bigskip \pause Définir des linéarisations ad hoc si nécessaire

    $\rightarrow$ gustave permet l'\strong{interaction} entre wrappers de variance et fonctions de linéarisation.

Diffusion et perspectives

Estimation de variance dans les enquêtes de l'Insee {.unnumbered}

En guise de conclusion

Le Département des méthodes statistiques a mis en place une organisation pour \strong{industrialiser l'estimation de variance}:

\bigskip \pause Le développement du package gustave constitue un \strong{investissement important}:

\

\begin{center} \large \strong{Merci de votre attention!}

\normalsize \bigskip \bigskip Martin Chevalier \ martin.chevalier@insee.fr \\url{https://github.com/martinchevalier/gustave} \end{center}



martinchevalier/gustave documentation built on Jan. 15, 2024, 11:56 p.m.