Rechercher
Contactez-nous Suivez-nous sur Twitter En francais English Language
 











Abonnez-vous gratuitement à notre NEWSLETTER

Newsletter FR

Newsletter EN

Vulnérabilités

Se désabonner

Archiver pour mieux sauvegarder : l’importance de la gestion du cycle de vie des données

novembre 2012 par Raphaël Feddawi, consultant Symantec chez AntemetA

Le développement de la mobilité amène son lot de nouvelles problématiques pour les DSI, parmi lesquelles la sauvegarde des données. En effet, la multiplication des connexions au système d’information de l’entreprise accroît considérablement le volume des données à traiter et à conserver. Ce qui induit l’augmentation de la taille et du coût des espaces de stockage, et entraîne également la multiplication du nombre de données mortes, c’est-à-dire qui sont en ligne et consomment de l’espace de stockage sur des équipements coûteux, mais ne sont pas accessibles par les utilisateurs.

Une multiplication des sources qui entraîne failles de sécurité et doublons

Les sources de données sont nombreuses : la messagerie constitue l’une des plus importantes, du fait de l’envoi de plus en plus de pièces jointes volumineuses. La parade classique des DSI est de mettre en place des quotas afin de limiter le poids des pièces jointes. Le problème est que cette stratégie implique la création de nombreux espaces d’archivage personnels sur les PC ou les serveurs de fichiers. Il en résulte des risques de sécurité importants : les données critiques enregistrées sur les ordinateurs portables ne sont pas sauvegardées (comme par exemple les fichiers personnels d’archivage .pst ou .nsf) et sont donc vulnérables ; quant aux données enregistrées sur les serveurs de fichiers, le volume de fichiers personnels accroît la durée des sessions de sauvegarde, nuisant ainsi à la protection du système d’information.

De plus, le plus souvent, on dénombre plusieurs copies d’une même donnée, à la fois sur le serveur dans les répertoires communs et les répertoires personnels, ainsi que dans la messagerie.

On observe le même type de phénomène avec les solutions de travail collaboratif comme Sharepoint, pour lesquels l’entreprise stocke énormément de données qui ne sont utilisées qu’un mois ou deux, et sont ensuite délaissées sans être supprimées, diminuant ainsi la performance de l’infrastructure. Même constat avec les messageries instantanées 2.0 (MSN, Yahoo Messenger, Lync…) pour lesquelles nombres d’entreprises souhaitent conserver des traces des échanges.

La définition du cycle de vie de la donnée

La solution pour pallier à ces problèmes de stockage et de protection des données en masse est donc de définir le cycle de vie de la donnée de production autour de ces différents thèmes. Pour cela, il est nécessaire de s’appuyer sur des stratégies ILM (Information Lifecycle Management) et HSM (Hierarchical Storage Management) permettant de mesurer la valeur de l’information, sa hiérarchie et la qualité du support de stockage. Il s’agit de donner le bon poids à l’information à un instant T, afin de définir à quel moment la donnée doit être accessible, nécessitant ainsi un accès rapide. On accompagne ensuite la donnée dans le temps en définissant à quel moment on doit la transférer de l’espace primaire vers un espace de stockage secondaire, moins coûteux.

Pour ce faire, on peut s’appuyer sur des outils comme File System Analyzer, File Explorer ou Mail System Analyzer, qui analysent le comportement et la typologie de la donnée, établissent le pourcentage d’accès à la donnée, et fournissent des indicateurs qui permettront de définir la stratégie à adopter.

De cette analyse du cycle de vie de la donnée va découler la définition de la politique d’archivage à mettre en place, selon différents niveaux. Plusieurs paramètres doivent être pris en compte dans le cadre de cette politique :

Il est important que le transfert de données d’un espace de stockage à un autre se fasse à la source, et de manière totalement transparente pour l’utilisateur, avec un accès immédiat qui ne viendra pas perturber ses habitudes. Ainsi, le mieux est de conserver un raccourci pour le chemin d’accès à la donnée, accessible sur le serveur de fichier, sur les espaces collaboratifs et les messageries. L’accès se fait donc de n’importe quel support, de n’importe où, tout en garantissant la sécurité des données, puisqu’elles sont archivées sur des espaces protégés.

Si les entreprises commencent à avoir ce réflexe d’archivage, il est indispensable de ne pas s’arrêter à ce premier niveau. En effet, le risque est de voir se multiplier les raccourcis d’accès, ce qui fait que l’on retombe dans le même type de problématique de volume. Il est donc important d’aller jusqu’au bout de la démarche, c’est-à-dire jusqu’à la suppression de la donnée et des raccourcis dans les boîtes mails et sur les serveurs de fichiers. En effet, lors de l’analyse du cycle de vie de la donnée, on peut décider de transférer les données qui n’ont pas été utilisées depuis longtemps vers des systèmes de stockage magnétique, plus capacitatifs et moins coûteux, ou bien de les supprimer définitivement.
Par exemple, les entreprises ont l’obligation légale de conserver les données de facturation pendant 10 ans. Ainsi, durant les deux premières années, on va archiver ces données sur des disques rapides, puis on les transfère sur des disques moins rapides pendant 8 ans, leur accès étant moins fréquent. Puis au bout de 10 ans, on les supprime.

Ainsi, si on prend cet exemple des données comptables et de facturation, comme le montre ce schéma : la politique d’archivage mise en place prévoit que toute nouvelle donnée soit conservée sur un disque rapide, peu capacitatif mais onéreux, avec accès immédiat pour l’utilisateur, pour un haut niveau de service. Ensuite, au fur et à mesure que la donnée vieillit, on la transfère vers des disques moins rapides et moins onéreux, mais offrant une accessibilité transparente pour les utilisateurs (raccourcis, interface de recherche liée à la solution d’archivage…).

Pour ce faire, la société définit une règle pour gérer l’ensemble du cycle de la donnée, du transfert des messages aux différents niveaux d’archivage jusqu’à la suppression définitive à échéance du délai légal de conservation des données de facturation de 10 ans.

Autre critère important : la définition de la politique d’archivage doit se faire en concertation avec les différents services de l’entreprise, pour une analyse au plus près des besoins d’accès aux informations.

50% à 60% d’espaces de stockage libérés en moyenne

Si la mise en œuvre de solutions d’archivage constitue un investissement qui peut paraître coûteux au premier abord, les apports ne sont pas à négliger. En effet, ce travail permet d’alléger l’espace de stockage primaire, et donc de maintenir le niveau de performance de l’entreprise et le service aux utilisateurs. Les données sauvegardées n’ont plus besoin du même cycle de sauvegarde que les données de production, ce qui permet d’augmenter la fenêtre de sauvegarde et ainsi d’optimiser les serveurs de production.

Par ailleurs, la solution d’archivage permet d’éliminer la problématique des fichiers personnels .pst ou .nsf, qui n’étaient auparavant pas sauvegardés. Ces derniers sont désormais traités et intégrés dans le processus de sauvegarde.

Les bénéfices se mesurent également au niveau de l’infrastructure. La gestion et la suppression des fichiers .pst ou .nsf assurent une plus grande sécurité des données présentes sur le poste de travail, tout en améliorant l’accessibilité aux données depuis l’extérieur et en résolvant les problèmes de corruption de fichiers et leur prolifération sur le réseau.

D’où l’importance d’une bonne analyse du cycle de vie des données, afin de passer de l’efficacité à l’efficience de la gestion de la donnée.


Voir les articles précédents

    

Voir les articles suivants