Nouvelle offre de diffusion et réutilisation des données BnF : le site « API et jeux de données » et Gallica studio

À l’occasion de son hackathon 2017, la BnF a ouvert deux services qui marquent sa volonté non seulement de favoriser l’appropriation et la réutilisation de ses données.

Légende ci-dessous
Copie d'écran du site Gallical Studio

API et jeux de données

Le portail BnF API et jeux de données a été créé afin de rassembler en un point d’entrée unique l’ensemble de l’offre de récupération des données et métadonnées, ainsi qu’une sélection de jeux de données préconstitués et considérés d’intérêt pour les internautes. Cette structuration sur un seul site de l'ensemble de l’offre de diffusion des données de la BnF permet non seulement d'en simplifier l'accès, mais également d'en susciter de nouveaux usages (alimentation d’autres catalogues, création d'applications innovantes, fouille de données, datavisualisation, etc.) auprès de publics professionnels diversifiés (acteurs de la culture et de la chaîne du livre, chercheurs dans le domaine des humanités numériques, développeurs, etc.).

Il décrit et documente l'ensemble des API (Application Programming Interface – interface de programmation applicative) qui permettent d'interroger et de récupérer les métadonnées des catalogues et les collections numérisées de la BnF : les images de Gallica (via le service IIIF), les métadonnées de data.bnf.fr (via un SPARQL endpoint) ou les métadonnées de Gallica et de BnF catalogue général (via les entrepôts OAI ou les services Z39.50 et SRU). L’offre des API ne cesse de s’étendre, comme le montre l’ouverture du service SRU (Search and Retrieve via URL) d’interrogation et de récupération des données de BnF catalogue général, qui facilite les échanges de données avec les acteurs du web utilisateurs de formats.

En complément de ces services, des jeux de données (images et textes, métadonnées, statistiques) ont été constitués et mis en ligne afin d’y être directement téléchargeables, qu’il s’agisse d’ensembles des catalogues (comme les produits de la Bibliographie nationale française) ou de corpus documentaires réalisés dans le cadre de projets de recherche (comme Europeana Newspapers). Ces jeux de données ont été enrichis par les données du CCFr, en licence ouverte de l’État depuis le 1er janvier 2018.

Gallica Studio

Le site web Gallica Studio vise à favoriser l’appropriation de Gallica par ses utilisateurs de Gallica. L’objectif est d’encourager à terme l’émergence de nouveaux usages du patrimoine en ligne et d’en créer les outils. Le site est constitué de trois rubriques :

  • la Boîte à outils fournit des ressources techniques pour la réutilisation de Gallica avec des outils développés par la BnF ou les usagers. Par exemple, GallicaPix, un outil de recherche iconographique, repose sur la classification par une intelligence artificielle des illustrations présentes dans les collections d’images et d’imprimés de Gallica.
  • la rubrique Projets collaboratifs documente des projets issus d’une collaboration entre la BnF et des communautés d’utilisateurs. Y figurent aussi des projets du hackathon BnF. Celui de 2016, Gallicarte, affiche les résultats d’une recherche effectuée dans Gallica sur une carte.
  • La partie Veille des gallicanautes recense les usages créatifs et innovants produits par des gallicanautes à partir de Gallica. Ainsi, la démarche de « Disquaires de Paris » donne accès via une carte interactive à des témoignages visuels rendant compte de l’activité des commerces de disques dès la fin du 19e siècle à Paris. La publication d’un corpus « patrimoine gourmand » a été l’occasion d’inviter les gallicanautes à tester les recettes de pâtisserie et à partager les photos des gâteaux.

À terme, Gallica Studio proposera de suivre dans une autre rubrique des résidences d’artistes pour revisiter le patrimoine à travers la création contemporaine.

Top