README.md

Lifecycle: stable https://guillaumepressiat.r-universe.dev/badges/pmeasyr

pmeasyr : données PMSI avec R

Guillaume Pressiat

28 novembre 2021

Le développement de ce package a été initié au DIM du siège de l'AP-HP. Il était auparavant hébergé sur le github IM-APHP.

Contenu du package

Ce package contient des fonctions pour :

Support documentaire et annexes

Une vidéo est aussi disponible.

Installation du package

Pré-requis

pmeasyr utilise les packages suivants, il faut donc les installer avant de préférence.

install.packages('tidyverse')
install.packages('sjlabelled')
install.packages('sqldf')

Depuis r-universe (CRAN-like pre-build)

Le plus simple pour installer pmeasyr est de lancer directement :

install.packages('pmeasyr', repos = 'https://guillaumepressiat.r-universe.dev')

Cf guillaumepressiat.r-universe.

Depuis github avec remotes

# install.packages('remotes')
library(remotes)
install_github('guillaumepressiat/pmeasyr')

Cette commande lance l'installation du package et de ses dépendances.

Installation derrière un proxy

Souvent, les établissements hospitaliers ont mis en place un proxy qui empèche l'installation pratique d'un package sur github. Voici comment faire dans ce cas.

# install.packages('httr')
library(httr)
set_config( use_proxy(
    url = "proxy_url",    # Remplacer proxy_url par l'URL de votre proxy
    port = 8080,
    username = "user",    # Remplacer user par votre nom d'utilisateur du proxy
    password = "password" #Remplacer password par votre nom d'utilisateur du proxy
))

# install.packages('remotes')
library(remotes)
install_github('guillaumepressiat/pmeasyr')

Une autre option dans ce contexte est la configuration définitive des proxys du logiciel R au sein du fichier Renviron.site, voir ici par exemple. En cas de question, n'hésitez pas à ouvrir une issue.

Par exemple, si vous ne connaissez pas votre proxy, vous pouvez faire comme indiqué ici.

Pour commencer

La vignette introductive du package donne des exemples de commandes pour les traitements des données du champ PMSI MCO.

browseVignettes('pmeasyr')

Ou bien consulter la vignette en ligne.

Le pourquoi du package

Ci-après, des arguments en faveur de l'utilisation de R dans le contexte des données PMSI.

Contexte

Les données du Programme de Médicalisation des Systèmes d'Informations (PMSI) sont souvent traitées via des logiciels spécifiques au PMSI (ou des outils statistiques / bases de données du marché) ne permettant pas de réaliser des traitements statistiques et des infographies satisfaisantes. Les départements d'information médicale sont donc souvent amenés à retraiter ces données avec R.

L'évolution récente de R intègre la manipulation de bases de données de taille importante. Le package pmeasyr s'inscrit dans cette veine et permet de réaliser de façon autonome l'ensemble des traitements (de l'import des données à leur analyse) avec R.

Avantages de R

Un flux de travail unique

En travaillant uniquement avec R, on peut mettre en place un flux de travail épuré : un seul projet, un seul programme, un seul logiciel. La traçabilité, la reproductibilité et la mise à jour des opérations sont ainsi facilitées.

Le travail avec de multiples logiciels oblige à l'export / import de fichiers entre les différents logiciels, et chaque modification du début du flux de travail génère des fichiers exportés v1, v2, ...

Avec un flux complet dans R, toute nouvelle modification est intégrée au processus de travail global. La localisation de toutes les étapes d'une analyse en un seul point évite les erreurs et la confusion lorsque l'on reprend l'analyse ultérieurement.

R et le PMSI

L'utilisation de R confère aux données du PMSI la liberté proposée par le logiciel :

*NB: Données In / Out : données en entrée / sortie des logiciels de l'ATIH

Des outils performants

L'engouement autour de R est lié au développement de packages intuitifs et performants : readr, dplyr, tidyr, magrittr, pour n'en citer que quelques-uns. pmeasyr s'appuie sur ces packages pour proposer des imports de données rapides sur des fichiers de taille importante (l'entité juridique de l'AP-HP est prise en charge sans problème avec un ordinateur récent).

Dans le cas de pmeasyr, l'import de 100 000 rsa (partie fixe, parsing des passages unités médicales, des diagnostics associés et des actes) nécessite en moyenne 5 secondes avec un processeur i7 -- 16Go de ram.

En dernier ressort, R travaillant en mémoire vive, les exécutions de requêtes sont très rapides.



IM-APHP/pmeasyr documentation built on April 22, 2024, 6:38 p.m.