Rmd/wikidataESR.md

Tenter d’y voir clair dans l’ESR : guide de style wikidata

Julien Gossa, Bastien Tagliana et Pierre Zoschke 28/07/2019

Les réformes successives touchant l’organisation de l’enseignement supérieur et de la recherche (ESR) depuis une quinzaine d’années ont profondément modifié le paysage universitaire français. Aujourd’hui, les transformations institutionelles sont si nombreuses et si rapides, qu’il est devenu impossible de connaitre la structure actuelle des établissements de l’ESR.

Il existe trois sources principales d’informations sur les établissements de l’ESR français :

Les deux premières sources ne sont pas communautaires, et proposent essentiellement des jeux de données brutes. En revanche, WikiData permet l’édition collaborative, plus adaptée au rythme actuel des transformations. Il permet également de structurer les données grace à un très large choix de relations. La contrepartie de ces deux avantages est la difficulté à uniformiser les données, passage indispensable à leur exploitation.

C’est pourquoi ce document est un guide visant l’harmonisation des informations sur l’organisation de l’enseignement supérieur français disponibles publiquement sur la base de donnée collaborative WikiData.

Proposition de modélisation

Le principe de la modélisation des informations dans WikiData est relativement simple :

Pour l’utilisation particulière de WikiData, on pourra se reporter à cette introduction.

Entête des éléments

Les éléments présentent quatre informations indispensables :

Par exemple, pour l’UCA :

Propriétés

Les propriétés permettent de modéliser les relations entre les établissements de l’ESR. La proposition suivante permet d’harmoniser les informations :

| id | libellé.wikidata | libellé.ESR | note | qualificatif | | :---------------------------------------------------- | :------------------- | :------------ | :-------------------------------------------------------------------------------------------------------------------------------------------------- | :---------------------------------------------------------------------------------------------------------------------- | | P31 | nature de l’élément | nature | voir la liste en annexe | | | P3202 | code UAI | | permet de faire le lien avec les autres bases de données | | | P571 | date de fondation | fondation | | | | P576 | date de dissolution | dissolution | | | | P527 | comprend | associé | lien de subordination horizontal : avec une moindre hiérachie, avec une indépendance politique et financière | date de début date de fin | | P361 | partie de | associé de | inverse de associé | date de début date de fin | | P355 | organisation filiale | composante | lien de subordination vertical: avec hiérarchie et dépendance politique ou financière accrue | date de début date de fin | | P749 | organisation mère | composante de | inverse de composante | date de début date de fin | | P1365 | remplace | prédécesseur | marque un changement de statut | date | | P1366 | remplacé par | successeur | inverse de prédécesseur | | | P807 | séparé de | | marque une séparation, lorsqu’un établissement nouveau est créé à partir d’une partie d’un autre (doit être renseigné dans les deux établissements) | date | | P1416 | affilié à | | pour les tutelles (CNRS, etc.) | date de début date de fin | | P463 | membre de | | pour les adhésions aux diverses associations, également pour l’IDEX (de façon un peu abusive) | date de début date de fin | | P1830 | propriétaire de | | pour les équipements de recherche par exemple | date de début date de fin | | P1344 | participant à | | pour les projets par exemple | date de début date de fin |

Erreurs fréquentes

Afin d’harmoniser au mieux les informations, il est utile d’éviter plusieurs erreurs fréquentes.

Il est recommandé d’utiliser autant d’éléments que de nécessaires, sans tenter de réutiliser ceux qui existent. Cela vaut aussi bien pour les établissements composites (regroupements) que pour les établissements qui changent de statuts au cours du temps.

Il existe de très nombreux statuts d’établissement de l’ESR, ou qui s’en approchent. Il est recommandé d’éviter d’utiliser des statuts génériques (“centre de recherche”), et de stipuler le statut la plus précise possible de l’établissement (“UMR”). Dans l’idéal, le statut se confond avec la forme juridique. Stipuler plusieurs statuts doit être réservé au cas où l’établissement a effectivement une nature composite.

Une liste de statuts recommandés et déconseillés est donnée en annexe.

Les organisations des regroupements de l’ESR étant particulièrement complexes, il est indispensable d’utiliser les propriétés les mieux adaptées, notamment pour différencier les membres pleinement intégrés (appelés ici “composante”) des membres seulement associés.

De plus, même si les tutelles (EPST, EPCA, EPIC…) sont membres des regroupements, il est recommandé de les déclarer sous forme d’affiliation pour les différencier des établissements composantes ou associés.

Enfin, les adhésions aux diverses associations (CPU, CURIF, LERU, COUPERIN…) doivent être déclarées avec “membre de”, toujours pour les différencier des autres types de relations.

Status et niveaux

Niveaux

Les statuts d’établissement sont hiérarchisés en différents niveaux :

| niveau | libellé | description | exemple | | -----: | :------------------ | :---------------------------------------------------------------------------------------------------------- | :-------------------------------------- | | 1 | national | institutions nationales | CNRS | | 2 | regroupement | groupe d’établissement ou intitutions régionales | COMUEs | | 3 | grand établissement | établissements de grande taille ou institutions locales | universités | | 4 | intermédiaire | établissements de moindre taille, premier sous-niveau des grands établissements, ou réseau d’établissements | école indépendante, collégium, COUPERIN | | 5 | composante | sous-partie d’un établissement | UFR ou UMR | | 6 | autre | ni établissement, ni institution | équipements ou projets |

Cette hiérarchisation est faite hors wikidata, directement dans la librairie R/wikidataESR.

Liste des statuts recommandés

| wikidata.id | libellé | niveau | note | wikipedia | | :--------------------------------------------------- | :-------------------------- | -----: | :------------------------------------- | :--------------------------------------------------------------------------------------------------------------------------- | | Q13582798 | EPST | 1 | | ref | | Q3244038 | EPCA | 1 | | ref | | Q3591583 | EPIC | 1 | | ref | | Q61612084 | PRES | 2 | | ref | | Q15974764 | COMUE | 2 | | ref | | Q65963615 | EPE | 2 | | ref | | Q3412198 | Regroupement universitaire | 2 | Pour les autres regroupements | ref | | Q2822246 | Académie | 2 | | ref | | Q3551775 | Université (EPSCP) | 3 | | ref | | Q1542938 | Grand Établissement | 3 | | ref | | Q3591586 | EPSCP | 3 | | ref | | Q135436 | École normale supérieure | 3 | | ref | | Q3457065 | réseau universitaire | 4 | Pour les réseaux, type EUA ou COUPERIN | | | Q6542557 | consortium de bibliothèques | 4 | Pour les réseaux de bibliothèques | | | Q1059324 | CHU | 4 | | ref | | Q3152659 | IUT | 4 | | ref | | Q1475041 | IEP | 4 | | ref | | Q3578562 | ESPÉ | 4 | | ref | | Q184644 | école supérieure de musique | 4 | | ref | | Q1143635 | école de commerce | 4 | | ref | | Q383092 | école d’art | 4 | | ref | | Q479716 | presse universitaire | 4 | | | | Q3550864 | UMR | 5 | | ref | | Q43371084 | UPR | 5 | | ref | | Q3550863 | UMS | 5 | | ref | | Q43371093 | FRE | 5 | | ref | | Q3550804 | UFR | 5 | | ref | | Q13220391 | école doctorale | 5 | | | | Q57314035 | faculté de médecine | 5 | | | | Q856234 | bibliothèque universitaire | 5 | | | | Q180958 | composante | 5 | A défaut de plus précis | ref | | Q1254933 | observatoire astronomique | 6 | | | | Q1298668 | projet de recherche | 6 | | |

Liste des statuts déconseillés

La plupart des statuts dans cette liste sont déconseillés parce que des statuts plus précises existent.

| | wikidata.id | libellé | niveau | note | wikipedia | | -- | :--------------------------------------------------- | :-------------------------------- | -----: | :---------------------------------------------------------- | :----------------------------------------------------------- | | 34 | Q2659904 | organisation gouvernementale | 1 | | | | 35 | Q327333 | agence publique | 1 | | | | 36 | Q43229 | organisation | 2 | | | | 37 | Q15911314 | association | 2 | | | | 38 | Q15343039 | établissement public | 3 | | | | 39 | Q270791 | entreprise d’État | 3 | | | | 40 | Q902104 | université privée | 3 | | | | 41 | Q1371037 | institut de technologie | 3 | | ref | | 42 | Q16917 | hôpital | 3 | Préférer CHU | | | 43 | Q2945655 | CH | 3 | Préférer CHU | | | 44 | Q3918 | université | 3 | | | | 45 | Q847027 | Grande ecole | 3 | Réserver aux écoles non contemporaines | ref | | 46 | Q875538 | université publique | 3 | | | | 47 | Q194166 | consortium | 4 | Préferer réseau universitaire (Q3457065) | | | 48 | Q1663017 | école d’ingé | 4 | | | | 49 | Q3578166 | École nationale supérieure | 4 | Confusion avec les ENS | | | 50 | Q2385804 | institution éducative | 4 | | | | 51 | Q189004 | Collége | 4 | | | | 52 | Q4287745 | organisation de santé | 4 | | | | 53 | Q13226383 | site | 5 | | | | 54 | Q3914 | école | 5 | | | | 55 | Q483242 | laboratoire | 5 | | | | 56 | Q31855 | institut de recherche | 5 | | | | 57 | Q1664720 | institut | 5 | | | | 58 | Q7315155 | centre de recherche | 5 | | | | 59 | Q4671277 | institut universitaire | 5 | | | | 60 | Q38723 | institut d’enseignement supérieur | 5 | | | | 61 | Q3356144 | ODAC | 5 | | | | 62 | Q28863779 | centre de recherche | 5 | | | | 63 | Q7075 | bibliothèque | 5 | préférer BU/biliothèque universitaire (Q856234) | | | 64 | Q1622062 | college library | 5 | Préférer bibliothèque universitaire (Q856234) | | | 65 | NOID | statut manquant | 6 | Absence de propriété P31 (instance_of/nature de l’élément) | |

Exploitation des données

A partir de wikidata, il est possible d’exploiter les données grace à la librairie R/wikidataESR.

Des exemples de productions sont visibles ici.



cpesr/wikidataESR documentation built on Sept. 14, 2024, 5:51 a.m.