library(dplyr)
library(magrittr)
library(knitr)

Objectif

Reproduire les chiffres du tableau 1.V.5.EMM d'OVALIDE à partir des données de VisualValoSej pour l'année 2017 pour vérification de la véracité.

Référence

La référence utilisée est le tableau 1.V.5.EMM d'OVALIDE. Ces données ont déjà été importées et vérifiées dans de précédents scripts.

df_emm <- readRDS("../produced_data/emm2017.rds")
glimpse(df_emm)

Les données EMM sont encore ventilées selon les différentes tables (ex. : AME, GHS...). Nos données importées de VisualValoSej ne permettent pas facilement de ventiler selon ces catégories (essayé mais sans succès). Nous allons faire la somme des différentes tables EMM pour pouvoir comparer avec les données VisualValoSej.

ref <- df_emm %>%
  rename(valo = valorisation) %>%
  group_by(mois_envoi, mois_sortie) %>%
  summarise(valo = sum(valo)) %>%
  ungroup

rm(df_emm) # Le tableau source n'est plus utile

glimpse(ref) # Jeter un coup d'oeil

On peut présenter ce tableau de la même façon que l'ATIH.

kable(xtabs(valo ~ mois_envoi + mois_sortie, ref), row.names = TRUE)

Données source

Les données sources sont chacun des fichier mensuels produits par VisualValoSej pour l'année 2017. Ces fichier ont déjà été importés dans de précédents scripts.

db <- readRDS('../produced_data/30-calcul_evol.rds')
glimpse(db)
db <- db %>%
  select(id, mois_envoi, mois_sortie, evol_mnt_tot)

kable(db %>% sample_n(10), caption = "Echantillon de 10 observations dans la table simplifiée")

Comparer

Les sommes correspondantes sont l'évolution des montants.

compare <- db %>%
  group_by(mois_envoi, mois_sortie) %>%
  summarise(valo_calcul = sum(evol_mnt_tot, na.rm = TRUE)) %>%
  left_join(ref) %>%
  mutate(diff = round(valo - valo_calcul)) %>%
  ungroup

Comparer les sommes totales

compare %>%
  summarise(sum_emm = sum(valo), sum_calc = sum(valo_calcul)) %>%
  mutate(diff = round(sum_emm - sum_calc), prop_diff = diff / sum_emm * 100)

Différence minime (différence de 0.000003%) pouvant être causé par les arrondis.

Vérification envoi par envoi

compare %>%
  filter(abs(diff) > 3)

Il y a des décalage lorsque le mois de sortie a été modifié au cours des différents mois d'envoi.

compare %>%
  group_by(mois_sortie) %>%
  summarise(diff = sum(diff))

compare %>%
  group_by(mois_envoi) %>%
  summarise(diff = sum(diff))


jomuller/vvs documentation built on May 21, 2019, 2:05 p.m.