La numérisation des collections

La BnF conduit une politique de numérisation décrite dans sa Charte documentaire de la numérisation des collections, validée en 2016, et déclinée dans des Programmes de numérisation des collections 2017-2021. La numérisation concerne tous les types de documents, imprimés, presse, documents spécialisés et audiovisuels. Elle a pour principaux objectifs l’enrichissement de Gallica (et, au niveau européen, d’Europeana), la sauvegarde de certains fonds dégradés ou encore la réalisation de projets de recherche et de valorisation de fonds spécifiques. Les documents imprimés numérisés sont convertis en mode texte (OCR : reconnaissance optique des caractères), sauf pour la production des ateliers internes.

La numérisation repose sur des travaux de numérisation internes et sur des marchés. Parmi ces marchés, le plus important en volume concerne la numérisation des imprimés, ouvert aux collections de bibliothèques partenaires. Les programmes partenariaux pilotés par la filiale BnF-Partenariats contribuent également à la politique de numérisation de la BnF.

Légende ci-après
Numérisation d'un livre d'heures du XVe siècle
© David Paul Carr / BnF

Les marchés de numérisation

Les imprimés et la presse

Le marché de numérisation de masse des imprimés, financé par le Centre national du livre (CNL), a connu sa deuxième année de pleine production en 2017. Sur l’année, ce sont près de 6,2 millions de pages de collections BnF ou partenaires qui ont été numérisées. Un deuxième marché, également financé par le CNL, traite des imprimés exceptionnels de la Réserve des livres rares, de la bibliothèque de l’Arsenal et d’autres départements. Les ouvrages sont choisis dans une perspective encyclopédique, du XVe au XXe siècle, en privilégiant les exemplaires illustrés ou annotés, les éditions originales et les possesseurs illustres. Relancé en 2016, il a permis de numériser près de 506 056 pages en 2017.

Notifié en janvier 2015, le marché dédié à la numérisation des livres indisponibles du programme ReLIRE (cf. Les applications et la vidéo) a fonctionné toute l’année, permettant de numériser plus de 4,7 millions de pages. Fin 2017, ce sont environ 103 000 livres indisponibles qui ont été numérisés depuis le début du marché. L’intégration dans Gallica intramuros de ces livres s’effectue au fur et à mesure de leur numérisation. La tranche conditionnelle du marché, affermie en novembre 2017, sera consacrée à la numérisation des hors d’usage avec une production qui commencera en 2018.

Un dernier marché, sur fonds propres, concerne la numérisation et la conversion en mode texte de périodiques. Lancé au printemps 2016, le marché Presse a permis la numérisation d’environ 815 000 pages de journaux anciens. La presse bénéficie également d’un marché de numérisation de transparents, qui a permis d’accroître la numérisation avec plus d’1,8 million de pages de journaux produites, contre 965 000 en 2016.

Les collections spécialisées

Le marché Collections spécialisées 2013 comprend deux lots, le premier portant sur les collections de manuscrits, estampes, photographies et cartes, le second sur les monnaies. Sur le premier lot, les objectifs de production pour 2017 ont été réalisés avec plus de 760 000 images contre près de 610 000 images produites en 2016. Deux programmes spécifiques ont continué d’alimenter ce lot, avec des financements extérieurs : la numérisation de la plupart des manuscrits hébreux de la BnF, financée par la Bibliothèque nationale d’Israël, et celle de manuscrits médiévaux prestigieux, mécénée par la fondation Polonsky. Le marché Collections spécialisées 2013 arrivant à son terme en 2017, un nouveau marché de numérisation des collections spécialisées a été notifié à la fin 2017.

France-Angleterre 700-1200, manuscrits médiévaux de la BnF et de la British Library, un programme de la Fondation Polonsky

BnF-Partenariats

Créée en 2012, la filiale BnF-Partenariats a pour mission la constitution d’offres numériques à partir des œuvres conservées par la BnF (imprimés, manuscrits, presse, estampes, photographies, cartes, plans, musique, etc.) et leur valorisation commerciale. Les revenus issus de ces activités sont réinvestis dans le déploiement de projets de numérisation et de diffusion des collections de la BnF.

Le programme de numérisation des livres anciens de la BnF s’est poursuivi avec la fin de la numérisation de ces fonds dans les départements Droit, économie et politique, Sciences et techniques et Littérature et art. En août, l’atelier de numérisation a été installé à la Bibliothèque de l’Arsenal où la numérisation a commencé en septembre. Dans le cadre de ce programme, 1,8 million de pages ont été numérisées en 2017 portant le cumul à 8 millions de pages numérisées et 16 000 ouvrages depuis le début du projet en 2012.

Lancé en 2016 avec les principaux quotidiens généralistes, retronews.fr, site de presse numérisée de la BnF, propose à la consultation 6 millions de pages et 220 journaux publiés entre 1631 et 1945, dont 2,5 millions de pages numérisées au cours de l’année 2017. Les documents font l’objet d’un traitement sémantique complémentaire qui permet d’affiner la recherche à l’aide de filtres par thème, événement, personne, lieu, organisation. La numérisation de la presse va s’accélérer en 2018 avec l’obtention cette année d’une nouvelle dotation de la Caisse des dépôts pour numériser 10 millions de pages supplémentaires sur deux ans.

Les programmes internes de numérisation

Les ateliers internes de la BnF se sont spécialisés dans la numérisation de documents ne pouvant être pris en charge dans les marchés de grande ampleur : grands formats, documents très fragiles et précieux, objets. Ils complètent de façon substantielle les marchés dans certains domaines (presse, documents spécialisés). Au total, 1,9 million d’images ont été produites en 2017 (+13% par rapport à 2016), meilleur résultat depuis que ces ateliers sont passés de la micrographie à la numérisation.

La filière de reproduction numérique « urgents lecteurs » permet de numériser gratuitement et en urgence un document demandé par un lecteur, monographie ou périodique, dont l’état ne permet pas la communication. Installée sur le site François-Mitterrand pour réduire les délais (sauf pour la presse traitée à Bussy-Saint-Georges), elle a continué à progresser légèrement en 2017 avec 479 documents hors presse numérisés (111 773 images) contre 480 documents numérisés en 2016 (109 312 images). Toutes les demandes de lecteurs ont été satisfaites.

Enfin, la sauvegarde dérivée, qui consiste à sauvegarder intégralement un document dont une reproduction totale voire partielle a été demandée auprès du département de la Reproduction, a permis de reproduire 81 774 pages au cours de l’année 2017 (81 110 en 2016).

Numérisation (nombre d’images numériques validées)

Top