knitr::opts_chunk$set(echo = TRUE) library(wikidataESR) library(knitr) library(tidyverse) wdesr_clear_cache() statuts_to_table <- function (statuts) { df <- statuts df$wikidata.id <- paste( '[',statuts$id, '](https://www.wikidata.org/wiki/', statuts$id,')',sep='') df$wikipedia <- ifelse(df$wikipedia!="", paste('[ref](',df$wikipedia,')',sep=''), "") return(select(df,wikidata.id,libellé,niveau,note,wikipedia)) }
Les réformes successives touchant l’organisation de l'enseignement supérieur et de la recherche (ESR) depuis une quinzaine d’années ont profondément modifié le paysage universitaire français. Aujourd'hui, les transformations institutionelles sont si nombreuses et si rapides, qu'il est devenu impossible de connaitre la structure actuelle des établissements de l'ESR.
Il existe trois sources principales d'informations sur les établissements de l'ESR français :
Les deux premières sources ne sont pas communautaires, et proposent essentiellement des jeux de données brutes. En revanche, WikiData permet l'édition collaborative, plus adaptée au rythme actuel des transformations. Il permet également de structurer les données grace à un très large choix de relations. La contrepartie de ces deux avantages est la difficulté à uniformiser les données, passage indispensable à leur exploitation.
C'est pourquoi ce document est un guide visant l’harmonisation des informations sur l’organisation de l’enseignement supérieur français disponibles publiquement sur la base de donnée collaborative WikiData.
Le principe de la modélisation des informations dans WikiData est relativement simple :
Pour l'utilisation particulière de WikiData, on pourra se reporter à cette introduction.
Les éléments présentent quatre informations indispensables :
Par exemple, pour l'UCA :
Les propriétés permettent de modéliser les relations entre les établissements de l'ESR. La proposition suivante permet d'harmoniser les informations :
df <- read.table("proprietes.csv", sep=";", header=TRUE, quote="") kable(df,background="blue")
Afin d'harmoniser au mieux les informations, il est utile d'éviter plusieurs erreurs fréquentes.
Il est recommandé d'utiliser autant d'éléments que de nécessaires, sans tenter de réutiliser ceux qui existent. Cela vaut aussi bien pour les établissements composites (regroupements) que pour les établissements qui changent de statuts au cours du temps.
En particulier, les universités qui retrouvent leur nom historique après une re-fusion ne doivent surtout pas réutiliser l'élément historique. De même pour les universités qui gardent le même nom mais changent de statut. Globalement, chaque changement d'UAI doit être marqué par un changement d'élément wikidata.
Il existe de très nombreux statuts d'établissement de l'ESR, ou qui s'en approchent. Il est recommandé d'éviter d'utiliser des statuts génériques ("centre de recherche"), et de stipuler le statut la plus précise possible de l'établissement ("UMR"). Dans l'idéal, le statut se confond avec la forme juridique. Stipuler plusieurs statuts doit être réservé au cas où l'établissement a effectivement une nature composite.
Une liste de statuts recommandés et déconseillés est donnée en annexe.
Les organisations des regroupements de l'ESR étant particulièrement complexes, il est indispensable d'utiliser les propriétés les mieux adaptées, notamment pour différencier les membres pleinement intégrés (appelés ici "composante") des membres seulement associés.
De plus, même si les tutelles (EPST, EPCA, EPIC...) sont membres des regroupements, il est recommandé de les déclarer sous forme d'affiliation pour les différencier des établissements composantes ou associés.
Enfin, les adhésions aux diverses associations (CPU, CURIF, LERU, COUPERIN...) doivent être déclarées avec "membre de", toujours pour les différencier des autres types de relations.
Les statuts d'établissement sont hiérarchisés en différents niveaux :
kable(wdesr.niveaux)
Cette hiérarchisation est faite hors wikidata, directement dans la librairie R/wikidataESR.
df <- statuts_to_table(subset(wikidataESR:::wdesr.cache$status,recommandé=="oui")) kable(df)
La plupart des statuts dans cette liste sont déconseillés parce que des statuts plus précises existent.
df <- statuts_to_table(subset(wikidataESR:::wdesr.cache$status,recommandé=="non")) kable(df)
Add the following code to your website.
For more information on customizing the embed code, read Embedding Snippets.