L’éditeur Penguin Random House accélère la maturité de ses données avec Snowflake

avril 2022 par Marc Jacob

"Nous n’avions jamais imaginé que cette architecture pourrait nous permettre d’avancer aussi rapidement. Nous avons eu notre plateforme de données centralisée construite en trois mois, et quand je regarde certaines des choses que nous faisions avant et le temps qu’il nous a fallu pour les faire, c’est tout simplement incroyable la rapidité avec laquelle nous avons gagné en maturité de données." explique dans un article blog Pete Williams, director of data and online de Penguin Random House. “Nous pensons avoir déjà économisé environ 300 heures par an dans la création d’un simple rapport de vente basé sur les données Amazon et nous pensons que plus de 800 utilisateurs vont en bénéficier. Nous avons débloqué de nouvelles capacités et calculons des économies préliminaires d’environ 5000 heures par an."

Afin d’accroître la maturité data de Penguin Random House, Snowflake a fourni la couche de stockage pour le nouveau modèle de données de la maison d’édition, fournissant trois couches distinctes : une archive historique qui contient les données brutes, une base “data vault” pour l’intégration et la normalisation, et enfin la couche de présentation où les données sont extractibles pour le fonctionnement quotidien de l’entreprise. Le remplacement du codage et de la maintenance manuels par des systèmes automatisés de réplication des données signifie que la saisie des data dans Snowflake est désormais rapide et évolutive.

Penguin Random House est désormais en mesure d’automatiser la capture et le traitement de données, libérant ainsi l’équipe chargée des data pour qu’elle se concentre sur l’analyse et l’opérationnalisation des connaissances acquises au profit de l’entreprise.

Avant le choix et l’utilisation de Snowflake, seules les équipes commerciales et financières avaient accès aux données des outils de BI mais de nombreuses autres parties de l’organisation avaient également besoin d’accéder aux données. Les contraintes de la solution existante ont conduit à la création de données départementales et de silos analytiques. Il en résultait un manque de confiance dans les données proposées, en raison de l’absence d’une source unique et viable de données pour l’entreprise.

Penguin Random House est le leader de l’édition au Royaume-Uni, publiant sur le marché 2 000 nouveaux titres chaque année. Faisant partie du Bertelsmann Media Group, Penguin Random House est une force influente dans l’édition mondiale, opérant sur six continents.