Méthodologie, code et source des données
Les sources des données, la méthodologie et le code utilisés pour réaliser ce baromètre reprennent ceux du baromètre lorrain de la science ouverte proposé par l'université de Lorraine, lui-même inspiré du baromètre français de la Science ouverte du Ministère de l'Enseignement Supérieur et de la Recherche (MESR).
Les codes des deux baromètres sont disponibles sur Gitlab (Université de Lorraine) et sur Github (Ministère de l'Enseignement supérieur et de la Recherche).
Les sources des données
Les données sur les publications de 2016 à 2020 dont au moins un auteur est affilié à l'Université de Strasbourg, sont issues d'extractions réalisées en mars 2021 à partir des sites suivants et de leurs outils d'interface Application Programming Interface (API):
- HAL (documentation de l'API)
- Web of Science (API disponible sous abonnement, utilisez le proxy pour accéder à la base de données)
- PubMed (APIs publiques)
- Lens.org (API disponible sous conditions)
Les données des frais de publications Article Processing Charges (APC) pour l'Université de Strasbourg ne sont pas encore disponibles.
La méthodologie employée
Après extraction, les données sont nettoyées en suivant la méthode indiquée par l'Université de Lorraine pour obtenir la liste des identifiant pérenne (DOI) des publications Université de Strasbourg 2016-2021.
Cette liste est ensuite enrichie par le code du Ministère qui fait appel à UnPaywall pour ajouter, notamment, les données indiquant le statut de chaque publication : accès ouvert (ou fermé), type d'accès (archive ouverte, éditeur, les deux).
Le fichier obtenu est enfin complété par les informations issues du jeu de données du Baromètre national recensant toutes les publications avec une affiliation française avec identifiant pérenne (DOI). Ce traitement ajoute une discipline scientifique à chaque publication.
L'algorithme créé par le Ministère n'a pas toujours pu attribuer une discipline à chaque article ; il aura alors indiqué "unknown" dans la colonne "scientific field". Pour éviter d'afficher cette catégorie lors de la visualisation du taux d'accès ouvert par discipline, celle-ci a été ajoutée manuellement dans le fichier pour les publications Université de Strasbourg de l'année 2019 concernées.
Limitations :
Seules les publications avec identifiant pérenne (DOI) sont prises en compte par UnPaywall, ce qui laisse de côté un certain nombre de publications, notamment en Sciences Humaines et Sociales (SHS).
Le code du baromètre
Le code utilisé pour réaliser ce baromètre reprend en grande partie le code de l'Université de Lorraine, avec quelques adaptations :
- ajout du graphique représentant la proportion de publications en accès ouvert depuis 2016
- adaptation de la visualisation des données selon la charte graphique de l'Université de Strasbourg
- ajout de code
Le code, les données et les requêtes sont disponibles sur Gitlab.
Date de mise à jour
- Données : mars 2021
- Code : mars 2021