library(dplyr)
Explorer, décrire et vérifier la base propre.
db <- readRDS('../produced_data/10-vvs_2017_clean.rds') pryr::object_size(db) glimpse(db)
Une bonne façon de vérifier la véracité des données (et donc l'absence d'erreur dans les étapes précédentes) est de vérifier qu'il est toujours possible de calculer les montants totaux assurance maladie mnt_tot_am
.
# Sélection des colonnes qui impactent la valorisation totale col_sum <- c('mnt_ghs_am', 'mnt_exinf_am', 'mnt_exh_am', 'mnt_ghs50_am', 'mnt_majo', 'mnt_dialyse', 'mnt_po', 'mnt_rxt', 'mnt_rea', 'mnt_nn', 'mnt_caisson_am', 'mnt_ant_am', 'mnt_mon', 'mnt_dmi', 'mnt_ivg_am', 'mnt_med_atu', 'ghsminam', 'mnt_scd') # Somme par ligne db$recalcul <- rowSums(db[, col_sum]) # Calculer la différence entre la valeur calculée et celle disponible db$diff <- db$recalcul - db$mnt_tot_am # Pour les séjours de valo 1 il ne devrait pas y avoir de différence # à part les erreurs d'arrondis summary(db$diff)
Aucune différence. Calculs fiables.
table(is.na(db$diff), is.na(db$taux))
Les valeurs manquantes proviennent de séjour où le taux de facturation est manquant.
Add the following code to your website.
For more information on customizing the embed code, read Embedding Snippets.