Rechercher
Contactez-nous Suivez-nous sur Twitter En francais English Language
 











Abonnez-vous gratuitement à notre NEWSLETTER

Newsletter FR

Newsletter EN

Vulnérabilités

Se désabonner

Vos S.I. contiennent des « données personnelles » ? Découvrez S.E.A.L., l’outil qui garantit la confidentialité des données

novembre 2013 par Marc Jacob

Les organisations font face à un besoin croissant de communiquer leurs données. Ainsi, les données de production sont recopiées à destination des développeurs pour les tests des programmes, des formateurs pour l’apprentissage des programmes, des analystes de l’organisation pour des études diverses, etc. Il est fréquent également que les données soient transférées en dehors de l’organisation en vue d’être traitées par des prestataires externes, soit pour des opérations techniques (recettes, mises au point de processus de migrations de données,…), soit pour des analyses du comportement des clients, ou encore dans le cadre d’études cliniques ou pharmacologiques, etc.

Cette communication représente pour l’organisation un risque majeur dans la mesure où une partie importante de ces données sont, au regard des lois et réglementations en vigueur, des « données personnelles » dont la communication ou la diffusion est condamnable.

Force est de constater que ce risque de violation, volontaire ou involontaire, de la confidentialité des données n’était pas, jusqu’à un passé récent, réellement pris en compte par les organisations même lors de la transmission des données à l’extérieur. Et pourtant, les études montraient que dans le cas d’au moins 1 organisation sur 4 les données mises à disposition pour les développements avaient été utilisées à d’autres fins, et que plus de 50% des organisations déclaraient ne pas connaître l’utilisation réelle qui était faite des données.
Cette situation évolue toutefois rapidement, en particulier depuis l’adoption par les autorités Européennes d’une nouvelle réglementation sur la protection des « données personnelles » : celle-ci accroît de manière considérable le risque de sanctions pour les organisations.

En remplaçant les données « confidentielles » par des données « fictives », S.E.A.L. permet aux organisations de communiquer leurs données en supprimant les risques liés à la confidentialité.

La solution : S.E.A.L.

S.E.A.L. (Select, Extract, Anonymize, Load) met à la disposition des utilisateurs (développeurs, formateurs, chercheurs, externes,…) un moyen de sélectionner et d’extraire une partie ou la totalité des données des bases de production, tout en les empêchant de connaître les valeurs des données réelles « confidentielles ». Par exemple, dans le cas d’une étude épidémiologique, l’utilisateur peut sélectionner les données liées à une « classe d’âge » en se basant sur les dates de naissance réelles des individus : le processus d’anonymisation remplace au fur et à mesure de l’extraction la date de naissance de chaque individu par une date fictive.

S.E.A.L. est un moyen pour l’utilisateur :

1. de définir sa « vue » c’est-à-dire les informations dont il a besoin sans se soucier des aspects techniques ;

2. de sélectionner dans sa « vue » les données réelles pertinentes qu’il souhaite ;
Sur base de ces éléments, S.E.A.L. garantit :

1. que les données « confidentielles » seront occultées de manière à éviter l’identification d’une personne physique ou morale ;

2. le maintien de la cohérence des données, y compris pour les données qui seront occultées.

S.E.A.L. s’appuie sur deux composants principaux :

L’extracteur.

Il permet à l’utilisateur de définir son système d’information et ses critères de sélection des données. Ceux-ci peuvent porter soit sur une valeur spécifique d’une donnée, soit sur des intervalles de valeurs. Ces critères peuvent être combinés entre eux, offrant ainsi à l’utilisateur de S.E.A.L. un très grand confort pour la définition de son ensemble de données. En se basant sur les critères de sélection, un processus d’extraction entièrement automatisé produit le sous-ensemble de données souhaité. Les technologies exclusives de REVER mises en oeuvre dans l’extracteur garantissent le maintien de la cohérence des données extraites y compris lorsque les données sont stockées dans des environnements techniques complexes contenant plusieurs bases de données.

L’anonymiseur.

Il a pour fonction de remplacer les valeurs « réelles » des données confidentielles par des valeurs « fictives ». Il va de soi que les données fictives se doivent de respecter les mêmes règles et contraintes que les données réelles - par exemple, en Belgique les deux derniers chiffres d’un numéro de TVA (9 chiffres) sont le reste de la division par 97 des 7 premiers chiffres : cette obligation est prise en compte par l’anonymiseur. Par ailleurs, dans S.E.A.L., les règles d’anonymisation sont réutilisables, ce qui évite à l’utilisateur des répétitions fastidieuses.

Vos S.I. contiennent des « données personnelles » ?

Découvrez S.E.A.L.,
l’outil qui garantit la confidentialité des données

S.E.A.L. est un outil souple et simple d’emploi, qui permet à l’utilisateur :
_ ? de définir ses propres règles d’anonymisation ;
_ ? d’associer une règle d’anonymisation à une donnée.
Dans S.E.A.L. il est possible de définir différents types de règles d’anonymisation :
_ ? Le « masquage » qui consiste à remplacer un ou plusieurs caractères d’une donnée par d’autres caractères ;
_ ? La « liste » qui consiste à remplacer une donnée par une autre provenant d’une liste préétablie ;
_ ? Le « calcul » qui consiste à remplacer une donnée par une autre qui est le résultat d’un calcul. Pour ce point, une syntaxe particulière est définie. Elle permet de spécifier très facilement des règles pour la majorité des cas. Les cas complexes sont résolus par l’intégration dans S.E.A.L. de modules spécifiques pouvant être développés assez simplement par les programmeurs.

« L’assignation » associe une règle d’anonymisation à chacune des données « confidentielles ». S.E.A.L. permet d’assigner des règles d’anonymisation à tous types de données y compris celles qui contiennent des « documents » dans lesquelles se trouveraient des données « confidentielles » (BLOB, CLOB, pure XML,…).

Le processus d’anonymisation :

 ? assure automatiquement la propagation des anonymisations au sein des données extraites, afin de garantir le maintien de la cohérence des données. Ainsi, si le numéro de TVA réel d’une entreprise est remplacé par un numéro de TVA fictif, il faut que partout dans la base de données (en ce compris dans les champs XML), le même numéro de TVA réel soit remplacé systématiquement par son analogue fictif ;

 ? permet de mémoriser, si nécessaire, la correspondance « données réelles – données fictives » dans un environnement sécurisé. Cette fonctionnalité est particulièrement utile, d’une part pour propager les anonymisations effectuées dans d’autres bases de données (par exemple pour assurer la permanence d’un numéro de TVA fictif dans d’autres bases de données), d’autre part pour récupérer des données anonymisées de manière identique lors d’extractions successives.

En pratique

S.E.A.L. est un outil simple à installer et à employer. Il fonctionne dans une architecture serveur « web » (Unix, Windows,…) avec des clients « browsers web » (Firefox, Google Chrome, Internet Explorer,…). Il est directement utilisable pour toutes les bases fonctionnant avec des bases de données relationnelles (DB2, Oracle, MySql, SQL server, Postgres…).


Voir les articles précédents

    

Voir les articles suivants