ContentSide a été retenu pour développer la plateforme de service du grand projet de valorisation du patrimoine de la presse française conduit par BnF-Partenariats, avec le soutien du Ministère de la Culture et de la BnF
septembre 2022 par Patrick LEBRETON
ContentSide a été choisi par BnF-Partenariats, filiale de la Bibliothèque nationale de France, pour créer une plateforme commune visant à valoriser le patrimoine éditorial d’éditeurs de presse. Cette plateforme s’inscrit dans un projet d’envergure piloté par BnF-Partenariats et ses partenaires permettant de numériser, enrichir grâce à l’IA, conserver, publier et valoriser près de 8,5 millions de pages de presse. Avec un savoir-faire développé depuis 12 ans auprès des acteurs de l’édition et la performance de son API d’intelligence artificielle Semantic Platform, ContentSide a su proposer une solution complète, pertinente et fiable pour ce vaste projet.
Dans la continuité d’une politique volontariste de numérisation massive et de diffusion des collections de presse de la BnF engagée avec le lancement de RetroNews en 2016, BnF-Partenariats et une douzaine d’éditeurs de presse (dont Libération, Le Télégramme, Paris Match, L’Express, …), ont convenu de lancer ce projet de numérisation et de plateforme commune afin de regrouper, préserver et valoriser leur patrimoine éditorial.
La plateforme de service réalisée par ContentSide permettra la consultation de plusieurs millions de pages de presse, constituant ainsi une source extrêmement riche d’information et de documentation pour de nombreux publics. Les éditeurs associés à BnF-Partenariats pourront ainsi proposer de nouvelles offres d’abonnement et élaborer de nouveaux produits documentaires basés sur leurs archives inexploitées à ce jour. Pour BnF-Partenariats, cela ouvre la possibilité de proposer des licences de consultation sur tout ou partie du fonds à des tiers, comme des écoles, des universités, des centres de recherches, …
Spécialiste du contenu depuis plus de 12 ans, ContentSide a su proposer une solution complète permettant de gérer l’ensemble des fonctionnalités demandées :
– Le mécanisme d’ingestion gérant différents formats de flux d’import
– L’enrichissement sémantique automatique (catégorisation des articles et détection des personnes, lieux, organisations)
– Le système d’authentification gérant les différents contextes (abonné, accès grand compte, …)
– Une API permettant aux éditeurs d’intégrer finement les archives à leur site
– Des interfaces web intégrables en marque blanche aux sites des éditeurs
– Une liseuse pour la consultation des pages numérisées en complément des articles convertis en XML
– Des interfaces d’administration pour permettre à BnF-Partenariats de gérer le service
La solution est développée avec la méthodologie agile et les meilleures pratiques de développement, en impliquant à la fois BnF-Partenariats et les éditeurs associés au fil du projet afin de garantir la pleine réussite du projet. Sa mise en production est prévue pour fin 2023.