library(dplyr)

Objectif

Explorer, décrire et vérifier la base propre.

Prérequis

  1. Les données VisualValoSej des 12 mois d'une années ont été importées ;
  2. Les données brutes ont été sélectionnées et adaptées.

Importation

db <- readRDS('../produced_data/10-vvs_2017_clean.rds')
pryr::object_size(db)
glimpse(db)

Calcul des montant

Une bonne façon de vérifier la véracité des données (et donc l'absence d'erreur dans les étapes précédentes) est de vérifier qu'il est toujours possible de calculer les montants totaux assurance maladie mnt_tot_am.

# Sélection des colonnes qui impactent la valorisation totale
col_sum <- c('mnt_ghs_am', 'mnt_exinf_am', 'mnt_exh_am', 'mnt_ghs50_am', 'mnt_majo', 'mnt_dialyse', 'mnt_po', 'mnt_rxt', 'mnt_rea', 'mnt_nn', 'mnt_caisson_am', 'mnt_ant_am', 'mnt_mon', 'mnt_dmi', 'mnt_ivg_am', 'mnt_med_atu', 'ghsminam', 'mnt_scd')

# Somme par ligne
db$recalcul <- rowSums(db[, col_sum])

# Calculer la différence entre la valeur calculée et celle disponible
db$diff <- db$recalcul - db$mnt_tot_am

# Pour les séjours de valo 1 il ne devrait pas y avoir de différence
# à part les erreurs d'arrondis
summary(db$diff)

Aucune différence. Calculs fiables.

table(is.na(db$diff), is.na(db$taux))

Les valeurs manquantes proviennent de séjour où le taux de facturation est manquant.



jomuller/vvs documentation built on May 21, 2019, 2:05 p.m.