Rechercher
Contactez-nous Suivez-nous sur Twitter En francais English Language
 

De la Théorie à la pratique











Abonnez-vous gratuitement à notre NEWSLETTER

Newsletter FR

Newsletter EN

Vulnérabilités

Se désabonner

Comment surmonter les embûches de la confidentialité en 2019

mai 2019 par Dr Maurice Coyle Chief Data Scientist (Responsable scientifique d’analyses de données) chez Trūata

Le docteur Maurice Coyle, Chief Data Scientist (responsable des analyses de données) chez Trūata, explique les avantages et la nécessité de confier l’anonymisation à une entreprise tierce indépendante suite à la mise en œuvre du Règlement Général sur la Protection des Données (RGPD).

La plupart des organisations veulent se montrer responsables et éthiques et respecter la vie privée de leurs clients, mais elles ne sont pas sûres de la bonne manière de s’y prendre. Elles sont à la fois avides des enseignements et de la génération de valeur qu’elles peuvent tirer des données de leurs clients, mais craignent d’enfreindre les règles du RGPD. C’est un véritable champ de mines dans lequel bien des entreprises vont devoir apprendre à circuler à partir de 2019.

Évitez le piège du consentement

L’une des choses les plus importantes qu’une entreprise axée sur les données puisse faire pour montrer qu’elle respecte la vie privée de ses clients lors de l’analyse de données est d’éviter le piège consistant à penser que l’obtention du consentement du client est une panacée. Ce n’est pas le cas. Comme nous pouvons le constater dans les amendes récemment annoncées au titre du RPGD, et ce ne sont probablement que les premières, il est difficile d’obtenir un consentement valide. Il faut en effet obtenir un consentement positif facilement accessible, spécifique et sans ambigüité, pour chaque objectif poursuivi, ce qui signifie que des consentements généraux « pour faire des analyses » ne sont pas suffisants pour permettre aux entreprises d’analyser les données de leurs clients pour un objectif donné. Au lieu de se baser sur un consentement pour mener des analyse qui contiennent des données à caractère personnel, il serait plus préférable que les entreprises n’utilisent pas du tout de données personnelles, surtout si elles peuvent obtenir la même valeur réelle ayant recours à des données anonymes.

L’anonymisation en interne par opposition à l’anonymisation indépendante

Les données peuvent être considérées comme «  anonymes  » du point de vue de la protection des données lorsque les personnes (sujets des données) concernées ne sont pas identifiables, eu égard à toutes les méthodes raisonnablement susceptibles d’être utilisées par le Contrôleur des Données ou par toute autre personne pour identifier la personne concernée. Toutefois, si les données sources initiales sont conservées à une autre fin (détection de fraude, etc.), celles rendues anonymes sont toujours considérées comme des données à caractère personnel, car il reste possible de les relier aux données d’origine à des fins de ré-identification.

En essayant de rendre les données anonymes en interne, les organisations auront probablement du mal à gérer la complexité de la conformité dans l’univers du RPGD. Les mesures visant à renforcer la protection de la vie privée, telles que l’anonymisation, ne sont pas faciles à mettre en œuvre et nécessitent une combinaison de data science, d’ingénierie des données et d’expertise juridique- toutes des compétences onéreuses, difficiles à acquérir et plus difficiles encore à conserver.

L’anonymisation indépendante est le meilleur moyen de rompre véritablement le lien entre la source des données et l’ensemble de données anonymes sur lesquels on mènera des analyses. Tandis que l’anonymisation en interne laisse subsister le risque de ré-identification délibérée ou accidentelle d’individus, ce qui entrainerait une violation de la règlementation.

Des analyses plus riches d’enseignements et moins biaisées

Le fait de vous adapter entièrement au RPGD grâce à l’anonymisation indépendante ne consiste pas uniquement à se conformer à la loi et à montrer à vos clients que vous respectez leur vie privée. En réalité, cela offre rapidement d’autres avantages. L’un des plus importants, et qui est curieusement sous-estimé, c’est que vous obtenez des informations plus précises avec moins de risque d’erreurs.

Habituellement, très peu de gens donnent leur consentement à l’utilisation de leurs données à des fins d’analyse, ce qui conduit à un petit ensemble de données avec consentement. Malheureusement, lorsque cela se produit, le risque de conclusions erronées est élevé. En règle générale, les modèles ne sont pas suffisamment robustes pour détecter les faux positifs et les nuances subtiles dans les données, ce qui augmente la probabilité de biais dans les conclusions.

Si par exemple une organisation souhaitait identifier des traits qui définissent un comptable, elle pourrait effectuer une enquête auprès de personnes croisées au hasard dans la rue. Si elle interrogeait dix personnes, dont trois sont des comptables qui portaient tous des lunettes, alors que les sept autres personnes interrogées n’en portaient pas, elle pourrait en conclure que les lunettes constituent un facteur caractéristique de la profession.

Il s’agit d’un « surapprentissage » au cours duquel l’analyse correspond trop étroitement à un ensemble de données et manque d’informations supplémentaires garantissant une plus grande précision des observations. Élaborer un modèle en se basant sur un plus grand nombre de personnes constitue la meilleure manière d’éviter les sur-ajustements et les biais. Si l’entreprise était restée dans la rue plus longtemps et avait interrogé plus de personnes, il leur serait probablement devenu évident que les lunettes ne soient pas un bon indicateur que quelqu’un travaille dans la comptabilité - ou dans toute autre profession d’ailleurs.

Une perspective à plus long terme

L’anonymisation indépendante offre un autre avantage : elle permet de mener des études longitudinales pour fournir des informations plus riches à l’entreprise. Elle permet également aux organisations de conserver légalement des données plus longtemps. Cela signifie que les données historiques peuvent être utilisées pour développer des modèles prédictifs plus robustes et plus précis, qui peuvent identifier des effets de saisonnalité ou d’autres effets liés au passage du temps.

En continuant avec l’exemple précédent, si j’ai remarqué que certaines des personnes que j’ai interrogées lors de mon sondage avaient des parapluies, il est possible que je cherche à savoir si cela est dû aux conditions météorologiques ce jour-là, à la météo typique à cette période de l’année ou, dans certains cas, à la nature prudente des répondants dans certaines cohortes. J’aurais besoin de mener mon analyse sur une période plus longue incluant toutes les saisons et, idéalement, un certain nombre d’années, ce qui impliquerait de conserver les réponses pendant toute la durée de mon étude. Si les réponses sont anonymisées, je peux effectuer cette analyse longitudinale sans compromettre la vie privée de ceux qui ont participé à l’étude.

Permettre l’analyse en protégeant les données des clients

L’anonymisation indépendante permet aux organisations de continuer à analyser les données conformément au RPGD tout en maintenant la profondeur et la possibilité de mise en œuvre des résultats obtenus des analyses des données. Cette capacité améliorée peut être obtenue sur une large palette d’activités analytiques, notamment l’optimisation de la tarification, la segmentation de la clientèle, la modélisation de la valeur de durée de vie des clients, la fidélisation de la clientèle et les moteurs de recommandation. Au fond, l’anonymisation indépendante des données clients permet aux entreprises de créer leurs modèles d’analyse, ouvrant ainsi la porte à des enseignements permettant de générer l’innovation et la croissance dans le respect de la loi.


Dr Maurice Coyle
Chief Data Scientist (Responsable scientifique d’analyses de données) chez Trūata
Le docteur Maurice Coyle est le responsable scientifique d’analyses des données de Trūata. Il a plus de 15 ans d’expérience dans la création de solutions technologiques innovantes offrant des expériences améliorées tout en respectant la vie privée des utilisateurs. Sa profonde expertise technique et académique acquise au cours de ses études doctorales et postdoctorales est complétée par une vaste expertise commerciale acquise en tant que CEO d’une start-up technologique qu’il avait cofondée, où il était chargé de la levée de 3,3 millions d’euros de capital-risque et d’effectuer des recherches personnalisées et des analyses prédictives pour des grandes sociétés en Europe, dans les Amériques et au Moyen-Orient.




Voir les articles précédents

    

Voir les articles suivants