Méthodologie, code et source des données
Les sources des données, la méthodologie et le code utilisés pour réaliser ce baromètre reprennent ceux du baromètre science ouverte proposé par l'université de Lorraine (BSO Lorraine), lui-même inspiré du baromètre français de la Science ouverte du MESRI (BSO MESRI).
Les sources des données
Les données sur les publications de 2016 à 2020 dont au moins un auteur est affilié à l'Unistra, sont issues d'extractions réalisées en octobre 2020 à partir des sites suivants :
Les données APC pour l'Unistra ne sont pas encore disponibles.
La méthodologie employée
Après extraction, les données sont nettoyées en suivant la méthode indiquée par le BSO Lorraine pour obtenir la liste des DOI des publications Unistra 2016-2020.
Cette liste est ensuite enrichie par le code du BSO MESRI qui fait appel à UnPaywall pour ajouter, notamment, les données indiquant le statut de chaque publication : accès ouvert (ou fermé), type d'accès (archive ouverte, éditeur, les deux).
Le fichier obtenu est enfin complété par les informations issues du jeu de données du BSO MESRI recensant toutes les publications avec une affiliation française avec DOI. Ce traitement ajoute une discipline scientifique à chaque publication.
L'algorithme créé par le MESRI n'a pas toujours pu attribuer une discipline à chaque article ; il aura alors indiqué "unknown" dans la colonne "scientific field". Pour éviter d'afficher cette catégorie lors de la visualisation du taux d'accès ouvert par discipline, celle-ci a été ajoutée manuellement dans le fichier pour les publications Unistra de l'année 2018 concernées.
Article détaillant la méthodologie employée pour le BSO du MESRI (HAL)
Limitations :
Seules les publications avec DOI sont prises en compte par UnPaywall, ce qui laisse de côté un certain nombre de publications, notamment en SHS.
Le code du baromètre
Le code utilisé pour réaliser ce baromètre reprend en grande partie le code du BSO Lorraine, avec quelques adaptations :
- ajout du graphique représentant la proportion de publications en accès ouvert depuis 2016
- adaptation de la visualisation des données selon la charte graphique de l'Unistra
- ajout de code
Le code, les données et les requêtes sont disponibles sur Gitlab.
Date de mise à jour
- Données : octobre 2020
- Code : décembre 2020