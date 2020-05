Les données au temps du COVID-19

mai 2020 par Looker

Toutefois, de nombreuses personnes se sont mobilisées pour essayer de comprendre, autant que faire se peut, ce qui se passe exactement. Des professionnels du secteur de la santé publique, des journalistes, des universitaires et même des groupes de bénévoles sur le terrain ont fourni des efforts considérables pour trouver, recueillir, nettoyer, comprendre et maintenir des ensembles de données cruciales.

Durant cette période, les différentes communautés n’ont eu d’autres choix que de s’adapter à cette nouvelle réalité et on dû s’appuyer sur les données disponibles de la situation actuelle. Par ailleurs, les entreprises de e-commerce ont utilisé ces informations COVID pour s’adapter à une demande en forte augmentation, les chaînes de restaurants pour se réorganiser et privilégier la livraison, les établissements publics pour établir des prévisions afin d’atténuer l’impact du COVID sur leurs concitoyens. Et bien sûr, les acteurs du secteur de la santé, les hôpitaux, les laboratoires et les assureurs pour comprendre comment mieux s’organiser

Cependant, compte tenu du grand nombre d’entités qui collectent des données et du fait que chacune d’entre elles les présente de manière légèrement différente, la quantité de travail nécessaire pour les consolider et leur donner un sens est non négligeable. Par ailleurs, dès que les choses fonctionnent bien, la construction d’une pipeline pour garder les données actualisées tout en surveillant les changements de schéma ou de méthodologie est un véritable atout.

Le programme Google Cloud Public Datasets ont utilisé leurs outils existants pour centraliser les données et y ajouter continuellement de nouveaux ensembles. Ces requêtes ont été effectuées gratuitement sur Google BigQuery. La solution de Looker pour une intégration facile : les blocs de données Au moment d’évaluer les domaines dans lesquels Looker pouvait apporter son aide, Il a été important de se concentrer sur la nécessité de rendre les données accessibles, mais également sur la facilité d’usage.

Ainsi, afin d’aider ses clients, les autorités sanitaires et toute autre partie intéressée pour comprendre les informations relatives au COVID-19, Looker à publié un bloc de données sur le sujet. Celui-ci se compose de modèles LookML, de tableaux de bord pré-construits et d’explorations, ainsi que de liens vers les données du Johns Hopkins Center for Systems Science and Engineering (JHU CSSE), du New York Times, du COVID Tracking Project, Definitive Healthcare, Kaiser Family Foundation, et du Dipartimento della Protezione Civile / Département de la Protection Civile italien.

Le bloc est gratuit et peut être chargé sur n’importe quelle instance Looker directement depuis le Marketplace. Les données qui alimentent le bloc ne sont actuellement disponibles que dans BigQuery et elles fonctionneront sur toutes les instances de Looker ayant une connexion BigQuery existante. Il est également possible d’explorer gratuitement les résultats sur cette instance hébergée par Looker ou créer un compte Google Cloud Platform. Les données devraient être proposées sur Amazon Redshift, Snowflake, ainsi que sur d’autres bases prochainement.

Au fur et à mesure que de nouvelles sources pertinentes deviendront disponibles et que la compréhension de cette maladie dans le monde se renforcera, Looker mettra à jour le bloc afin d’y intégrer ces nouvelles connaissances.

*Nous avons décidé de présenter ces résultats de la manière la plus claire possible. Étant donné que nous mettons à disposition les données provenant d’autres entreprises, mais que nous ne sommes pas en mesure d’en vérifier l’exactitude, le bloc et les données sous-jacentes sont fournis tels quels. Les questions légitimes et importantes sur la fiabilité des différentes sources sont nombreuses mais nous pensons qu’il est préférable de laisser ces questions aux experts en épidémiologie et autres domaines connexes. Comme les opinions divergent sur la manière d’interpréter de façon responsable les résultats relatifs à cette pandémie qui évolue rapidement, nous ne tenions pas à laisser entendre que les données sont plus fiables qu’elles ne le sont. Nous faisons confiance à nos clients pour déterminer ce dont ils ont besoin dans ces informations et de les traiter avec le discernement nécessaire, le cas échéant. Nous vous encourageons également à lire les remarques importantes relatives à chaque source de données.