README.md

Cette application vise à faciliter la manipulation de données de trajectoires à partir du logiciel de traitement statistique 'R'. Elle permet aux personnes qui ne sont pas familières de ce langage de pouvoir utiliser un certain nombre de fonctions particulièrement utiles pour la manipulation de données de trajectoires.

Les fonctions spécifiques incluses dans l'application proviennent surtout des paquets suivants :

1. Construction d'un jeu de données :

L'application permet dans un premier temps de construire des trajectoires à partir de données 'brutes' (dans l'onglet 'Les données').

Trois types de fichiers peuvent être chargés dans l'application :

  1. un fichier .csv avec des données au format 'wide' : une colonne par variable et par date, et à la suite une colonne par variable complémentaire.

| VARIABLE_IDENTIFIANT | RSA_1 | RSA_2 | RSA_3 | RSA_... | SEXE | COMMUNE_HABITATION | ... | | -------------------- | ----- | ------ | ----- | --------- | ---- | ------------------ | ---- | | 1 | RSA | RSA | RSA | ... | M | Paris | ... | | 2 | NA | RSA | RSA | ... | F | Lyon | ... | | 3 | RSA | Sortie | NA | ... | NA | Grenoble | ... |

  1. un fichier .RData comportant une liste (list()) avec un objet 'trajectoire' créé par la fonction seqdef() et un data.frame comportant des données complémentaires. Dans ce cas, les noms de ligne (row.names()) des trajectoires doivent correspondre avec une variable d'identifiant individuel dans le data.frame (variable à spécifier dans l'application).

Exemple de data.frame pour les données complémentaires :

| VARIABLE_IDENTIFIANT | SEXE | COMMUNE_HABITATION | ... | | -------------------- | ---- | ------------------ | ---- | | 1 | M | Paris | ... | | 2 | F | Lyon | ... | | 3 | NA | Grenoble | ... |

  1. un fichier .RData comportant une liste ('list()') avec pour chaque date (chaque mois, chaque année, chaque jour, etc) un data.frame avec les valeurs correspondantes. Dans ce cas, les trajectoires pourront être générées à partir de n'importe quelle variable commune aux différentes dates.

Exemple de liste de data.frames:

| VARIABLE_IDENTIFIANT_1 | RSA_1 | SEXE_1 | COMMUNE_HABITATION_1 | ... | | ---------------------- | ----- | ------ | -------------------- | ---- | | 1 | RSA | M | Paris | ... | | 3 | RSA | NA | Grenoble | ... |

| VARIABLE_IDENTIFIANT_2 | RSA_2 | SEXE_2 | COMMUNE_HABITATION_2 | ... | | ---------------------- | ------ | ------ | -------------------- | ---- | | 1 | RSA | M | Paris | ... | | 2 | RSA | F | Lyon | ... | | 3 | Sortie | NA | Grenoble | ... |

| VARIABLE_IDENTIFIANT_3 | RSA_3 | SEXE_3 | COMMUNE_HABITATION_3 | ... | | ---------------------- | ----- | ------ | -------------------- | ---- | | 1 | RSA | M | Paris | ... | | 2 | RSA | F | Lyon | ... |

Les individus peuvent absents de certains tableaux de données pour certains mois, ou être présents avec des valeurs manquantes (NA).

A partir de ces différentes sources, des possibilités de sélection d'individus sont offertes (sélection multi-critères sur tous les types de données ou pour une ou plusieurs dates). Chaque sélection constituée dans l'application et qui a donné lieu à la constitution de trajectoires peut être enregistrée localement et réutilisée (chargée dans la console R ou dans l'application).

Note sur le format des données

https://cran.r-project.org/web/packages/tidyr/vignettes/tidy-data.html

http://mephisto.unige.ch/pub/TraMineR/doc/TraMineR-Users-Guide.pdf

2. Indicateurs statistiques :

Une fois que les trajectoires sont construites et validées, différents onglets permettent d'obtenir des indicateurs statistiques sur les trajectoires et leurs données complémentaires.

3. Classification des trajectoires :

L'application permet aussi de générer des classes de trajectoires à partir de méthodes basiques (Optimal Matching et ses dérivés principalement), et d'utiliser ces groupes pour visualiser et comparer les données.

Les groupes peuvent être enregistrés localement et réutilisés dans R ou dans l'application.

Néanmoins, pour une classification fine et pleinement paramétrable, il serais préférable d'utiliser directement les diverses fonctions existantes dans une interface R classique.

Licence et références : Le code de l'application est sous licence GNU General Public License v3.0 https://www.gnu.org/licenses/quick-guide-gplv3.html

Adresse du code source : https://github.com/ECLOH/ViCaTraj (vous pouvez contribuer!)

Application générée grâce au logiciel 'R' et en particulier aux packages 'shiny' et 'ggplot2'.

Pincipaux contributeurs :



ECLOH/ViCaTraj documentation built on July 5, 2021, 12:09 a.m.