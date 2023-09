OLFEO annonce la mise en production du projet Rapid Metis

septembre 2023 par Marc Jacob

Olfeo annonce avoir atteint une étape critique dans le projet RAPID METIS, visant à améliorer de manière significative la qualité de sa base de données de domaines et d’URLs. Olfeo propose une passerelle de sécurité web pour sécuriser et optimiser le trafic internet des entreprises. Elle permet de déterminer quel risque représente un site web accédé par un internaute afin d’appliquer une action correspondante : information sur le risque encouru, blocage etc.

Avec une base de plus de 20 millions de domaines, correspondant à des centaines de millions d’URLs, Olfeo est le seul acteur français à proposer une base de sites web finement catégorisée suivant les usages et le cadre juridique français. Présent chez plus de 1 000 ETIs et administrations, Olfeo est le numéro un du proxy web en France.

La base de données de domaines est le centre névralgique de la solution d’Olfeo. Sa précision et la pertinence sont parmi les différentiateurs majeures d’Olfeo. Il est donc essentiel d’assurer sa qualité et son exhaustivité dans le temps. L’approche actuelle est basée sur un pré-classement par mots-clés quand il est possible mais toujours vérifié par un classement manuel. Cela permet d’atteindre une qualité de classement inégalée mais avec la croissance exponentielle de nouveaux domaines crées, cette solution a besoin de renforcement.

En effet, avec 70 millions de nouveaux domaines crées dans le monde chaque mois - dont 13 millions de domaines malicieux - et une évolution dynamique des contenus dans le temps, Olfeo a décidé d’implémenter des techniques additionnelles pour continuer à assurer une qualité irréprochable de la base malgré le grand volume de nouveaux contenus générés, tout en préparant une extension européenne de la solution.

Le projet METIS, disposant d’un budget d’1 million d’euros et co-financé par le dispositif RAPID (Régime d’Appui à l’Innovation Duale) et soutenu par l’Agence Innovation Défense du Ministère des Armées et la Direction Générale de l’Armement, est donc lancé en 2020. Il vise à implémenter des algorithmes d’IA et de Machine Learning pour améliorer les performances des outils de classification internes Olfeo. Le projet inclut une dimension principale d’innovation autour des méthodes de classification des données et de l’apprentissage (Machine Learning) pour identifier la catégorie à associer à une URL sur la base de l’analyse du contenu de la page web.

Effectué en collaboration avec l’Université de Reims Champagne-Ardenne et le laboratoire d’informatique de l’Université Grenoble Alpes sur une durée de 3 ans, le projet a combiné exploration de l’état de l’art dans l’analyse et le classement sémantique, la mise en place de processus automatisés de traitement, l’entrainement de différents modèles de Machine Learning avec les données existantes Olfeo et finalement le déploiement d’un modèle d’apprentissage profond (Deep Learning) qui a permis d’optimiser le taux de reconnaissance des contenus.

Le projet a donné entière satisfaction par rapport à l’objectif visé. La pertinence de la classification a pu être améliorée jusqu’à 30% sur certains types de contenus tout en maintenant la qualité de la base existante avec un taux de reconnaissance des URLs proche de 100%. Ces résultats ont permis l’intégration de l’algorithme de classification dans l’outil de pré-qualification Olfeo.

Olfeo continue la double approche combinant classification par des techniques de Machine Learning, tout en permettant à l’humain de garder la main sur le classement final. Avec l’augmentation de la précision de classification automatique, Olfeo prépare le terrain pour une validation automatique sur certains types de contenus dans un futur proche.

« L’expérience engrangée par Olfeo sur des enjeux aussi importants que l’IA est une excellente chose et laisse présager de belles opportunités pour l’avenir, tant le contexte est porteur. À l’époque de l’explosion de la bulle IA, de chatGPT et consorts, il est crucial pour une entreprise qui a pour objectif de devenir un leader français et européen de la cybersécurité de maitriser ces enjeux et profiter de leur force » affirme Alexandre Souillé, CEO et fondateur d’Olfeo.