Engineering, à qui sont les données qui pourraient nous aider à lutter contre le Coronavirus ?

mars 2020 par Massimo Canducci, Chief Innovation Officer of Engineering

Ce sont des heures difficiles dans le monde entier, avec des milliers de personnes qui essaient de contenir la propagation du Covid-19, mieux connu sous le nom de Coronavirus, tandis que plusieurs équipes dans différentes parties du monde travaillent à la recherche d’un vaccin ou d’un traitement pharmacologique qui puisse limiter les dégâts.

Les procédures d’endiguement de la diffusion sont principalement basées sur la tentative d’identifier les sujets contaminés et d’essayer de reconstituer avec eux ce qu’ils ont fait les jours précédents, qui ils ont rencontré et quels endroits ils ont fréquentés. Le but est de d’essayer d’identifier les autres personnes ayant été en contact avec des personnes infectées, qui pourraient à leur tour avoir été infectées et donc avoir besoin d’une assistance médicale, mais aussi parce que ces dernières peuvent à leur tour être capables d’infecter d’autres personnes dans une sorte de réaction en chaîne qui, si elle n’est pas interrompue dans ses phases initiales, peut devenir incontrôlable.

L’identification du graphique de contamination est donc une opération longue et complexe où le temps est une variable déterminante : plus vite nous pouvons identifier et avertir les personnes potentiellement infectées, plus vite nous pouvons leur porter assistance et en même temps limiter la propagation de l’épidémie en les empêchant d’entrer en contact avec d’autres sujets. Le vrai problème est que cette phase de recherche est essentiellement réalisée en interrogeant les personnes, en leur demandant où elles ont été les jours précédents, qui elles ont rencontré, quels endroits elles ont fréquentés, quels moyens de transport elles ont utilisés, puis en essayant de retrouver avec difficulté les noms de toutes les personnes qu’elles ont pu rencontrer dans le même wagon de train, dans le même restaurant ou lors de la même réunion d’affaires et en rencontrant inévitablement des erreurs, des inexactitudes et d’éventuelles omissions volontaires.

En Corée du Sud, cette question a été abordée de manière très pragmatique, en utilisant toutes les informations disponibles afin d’identifier les citoyens potentiellement infectés et de prévenir la contagion d’autres catégories de la population. Les informations disponibles comprennent également les images des caméras de sécurité, les transactions par carte de crédit, les données de positionnement des smartphones et des voitures. Toutes ces informations ont été collectées, croisées et traitées, ce qui a permis de réduire considérablement la taille du graphique de la contagion. Le revers de la médaille est que les données ont parfois été utilisées de manière un peu trop désinvolte, en communiquant des informations rendues anonymes à la population, mais qui ont néanmoins permis d’identifier certains porteurs potentiels du virus ou certains comportements que ces mêmes citoyens auraient préféré cacher. En Italie, par contre, ces analyses sont effectuées manuellement et avec beaucoup d’efforts, alors qu’il existe en réalité une gigantesque base de données complète, précise et fiable, en mesure de fournir des informations précises sur l’endroit où nous nous trouvions à un moment donné et avec qui, en fournissant en même temps les données personnelles et les mouvements de toutes les personnes que nous avons rencontrées pendant la période d’observation, celles que nous connaissons en tant que membres de la famille, amis et collègues, mais aussi celles que nous ne connaissons pas, celles qui étaient assises à côté de nous dans le train, à la table à côté de la nôtre au restaurant, avec lesquelles nous partagions la salle d’attente d’un professionnel. Il s’agit d’une énorme quantité d’informations que nous générons nous-mêmes grâce aux smartphones, des appareils utilisés par la quasi-totalité de la population, des outils qui stockent à tout moment des informations sur notre localisation et les utilisent à des fins commerciales, pour améliorer notre profil de consommateur ou pour mieux nous connecter avec nos contacts sur les réseaux sociaux.

Si, au lieu d’utiliser la technique des entretiens pour déterminer la position et le temps de déplacement des personnes potentiellement contagieuses, nous pouvions accéder directement à ces informations, nous disposerions immédiatement des données, sans possibilité d’erreur, et nous pourrions identifier et avertir en temps réel, grâce aux mêmes smartphones, les personnes qui sont entrées en contact entre elles, en les invitant à se comporter de manière à ne pas mettre en danger leur santé et celle des autres, et en bloquant efficacement la propagation de la maladie, avec simplicité et rapidité. Le vrai problème, cependant, est que ces données ne sont pas à notre disposition, nous sommes dans le terrible paradoxe où nous produisons des données avec nos comportements quotidiens, nous les cédons à des entreprises privées qui en font un usage commercial en nous aidant à choisir un produit ou en nous proposant des vacances, mais ces données ne peuvent pas être utilisées par les organismes de l’État qui travaillent pour sauver nos vies et qui, grâce à ces données, pourraient améliorer considérablement leur efficacité. La situation devient encore plus compliquée lorsque nous essayons de passer des simples données géographiques à des données de santé collectées par d’autres types d’appareils personnels portables tels que des montres intelligentes. En fait, bon nombre d’entre nous utilisent des appareils qui peuvent détecter le rythme cardiaque, la température du corps, la pression sanguine et effectuer de véritables électrocardiogrammes. Ces données sont généralement utilisées pour établir une sorte de profil de santé de l’utilisateur et, dans certains cas, elles ont permis d’identifier certains problèmes de santé à un stade précoce.

Il est tout à fait clair que, dans le cadre de la lutte contre une épidémie, il peut être utile pour ceux qui y sont directement confrontés de savoir qu’un nombre anormal de personnes ayant des paramètres vitaux hors normes ou hors statistiques est présent dans certaines zones du territoire national. Toutes ces informations, données en pâture aux algorithmes traditionnels (et sans recourir à des outils d’intelligence artificielle) pourraient nous aider grandement à faire face à une urgence sanitaire à l’échelle nationale, mais malheureusement, bien que nous les produisions, elles ne sont pas à la disposition des organismes qui pourraient les utiliser comme un outil utile pour sauver nos vies.

Dans un avenir proche, il sera important d’aborder ces questions à l’échelle internationale et d’identifier les moyens de concilier les règles de protection de notre vie privée avec les besoins exceptionnels qui pourraient se présenter. Il sera essentiel d’ajouter au concept de « monétisation des données » un concept plus moderne de « durabilité des données » afin de garantir que l’ensemble des données que nous produisons en tant qu’individu puisse être utilisé de diverses manières, en protégeant autant que possible notre vie privée, pour aider les autorités dans des situations exceptionnelles, dans ces processus qui visent à sauver nos vies.

Ce ne sera pas facile. Les règles actuelles ne semblent pas proposer d’ouvertures dans cette direction. Même le décret-loi 14 du 9 mars 2020 « Dispositions urgentes pour le renforcement du Service national de santé en relation avec l’urgence COVID-19 » qui permet aux institutions de collecter directement auprès de la population des données personnelles qui sont considérées comme utiles, même celles définies comme plus sensibles (données biométriques et informations sur les condamnations pénales et les délits), ne mentionne que la possibilité de gérer de manière simplifiée l’autorisation et d’omettre la note d’information.

Il convient plutôt d’identifier les bons moyens pour que les institutions, dans les situations d’urgence sanitaire, puissent accéder aux données produites par les citoyens avec leurs smartphones et leurs appareils portables, données qui sont généralement utilisées à des fins de profilage commercial. Elles doivent pouvoir être utilisées pour aider les citoyens eux-mêmes, en leur permettant ainsi de ne pas tomber malade, de ne pas infecter le reste de la population et souvent en sauvant leur propre vie.

Nous devons élaborer un modèle selon lequel si les données peuvent contribuer à sauver des vies, alors elles doivent pouvoir être utilisées de manière responsable.