library(dplyr) library(magrittr) library(knitr)
Reproduire les chiffres du tableau 1.V.5.EMM d'OVALIDE à partir des données de VisualValoSej pour l'année 2017 pour vérification de la véracité.
La référence utilisée est le tableau 1.V.5.EMM d'OVALIDE. Ces données ont déjà été importées et vérifiées dans de précédents scripts.
df_emm <- readRDS("../produced_data/emm2017.rds") glimpse(df_emm)
Les données EMM sont encore ventilées selon les différentes tables (ex. : AME, GHS...). Nos données importées de VisualValoSej ne permettent pas facilement de ventiler selon ces catégories (essayé mais sans succès). Nous allons faire la somme des différentes tables EMM pour pouvoir comparer avec les données VisualValoSej.
ref <- df_emm %>% rename(valo = valorisation) %>% group_by(mois_envoi, mois_sortie) %>% summarise(valo = sum(valo)) %>% ungroup rm(df_emm) # Le tableau source n'est plus utile glimpse(ref) # Jeter un coup d'oeil
On peut présenter ce tableau de la même façon que l'ATIH.
kable(xtabs(valo ~ mois_envoi + mois_sortie, ref), row.names = TRUE)
Les données sources sont chacun des fichier mensuels produits par VisualValoSej pour l'année 2017. Ces fichier ont déjà été importés dans de précédents scripts.
db <- readRDS('../produced_data/30-calcul_evol.rds') glimpse(db)
db <- db %>% select(id, mois_envoi, mois_sortie, evol_mnt_tot) kable(db %>% sample_n(10), caption = "Echantillon de 10 observations dans la table simplifiée")
Les sommes correspondantes sont l'évolution des montants.
compare <- db %>% group_by(mois_envoi, mois_sortie) %>% summarise(valo_calcul = sum(evol_mnt_tot, na.rm = TRUE)) %>% left_join(ref) %>% mutate(diff = round(valo - valo_calcul)) %>% ungroup
Comparer les sommes totales
compare %>% summarise(sum_emm = sum(valo), sum_calc = sum(valo_calcul)) %>% mutate(diff = round(sum_emm - sum_calc), prop_diff = diff / sum_emm * 100)
Différence minime (différence de 0.000003%) pouvant être causé par les arrondis.
Vérification envoi par envoi
compare %>% filter(abs(diff) > 3)
Il y a des décalage lorsque le mois de sortie a été modifié au cours des différents mois d'envoi.
compare %>% group_by(mois_sortie) %>% summarise(diff = sum(diff)) compare %>% group_by(mois_envoi) %>% summarise(diff = sum(diff))
Add the following code to your website.
For more information on customizing the embed code, read Embedding Snippets.