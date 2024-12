4 tendances clés qui façonneront le paysage IT en 2025, selon Ampere Computing

décembre 2024 par Jeff Wittich, CPO d’Ampere Computing

De l’expérimentation à l’exécution : l’inférence de l’IA générative occupe le devant de la scène

L’IA générative est en train de passer du statut de simple outil expérimental à celui de solution entièrement intégrée avec une forte valeur ajoutée. Alors que l’année dernière se concentrait sur des cas d’usage de chatbots reposant principalement sur des données publiques, l’avenir résidera dans l’application de l’IA générative à des ensembles de données privées et protégées afin de créer des outils de qualité. Les secteurs de la finance, de l’assurance et du e-commerce sont particulièrement prêts à adopter cette technologie pour extraire des informations pertinentes de leurs données propriétaires.

Une mise en œuvre flexible sera essentielle. Alors que les charges de travail d’IA s’étendent à des environnements variés – on-premise, edge et centres d’hébergement climatisés -, les applications sujettes à des temps de latence exigeront une infrastructure à proximité des utilisateurs, déployée localement dans des centres de données et des terminaux existants. En outre, l’inférence ne sera plus une charge de travail isolée. Les tâches de support telles que la génération augmentée par récupération (Retrieval-Augmented Generation - RAG) et l’intégration d’applications nécessiteront un calcul robuste et polyvalent ainsi que des ressources d’IA spécialisées, mettant l’accent sur l’efficacité et la scalabilité.

Consolider l’avenir : plus d’énergies renouvelables et gains de productivité

Alors que la demande de calcul se fait pressante, il en est de même pour la demande d’électricité. Les réseaux électriques surchargés et les contraintes géographiques en matière d’énergie forcent les industries à trouver de nouvelles solutions. Les sources d’énergies renouvelables d’origine solaire, éolienne et géothermique prennent de l’ampleur à mesure que des centres de données plus petits et décentralisés émergent. Néanmoins, ces projets prendront plus de temps qu’il n’en faut pour répondre aux demandes immédiates de croissance de l’infrastructure informatique.

L’efficacité ne peut attendre. Pour éviter de recourir à de nouvelles sources d’énergie non renouvelables ou à des technologies avec un cycle de vie trop court, l’optimisation du matériel jouera un rôle essentiel dans la réduction de la consommation énergétique. Remplacer les systèmes obsolètes et énergivores avec des processeurs modernes et efficaces peut réduire considérablement la consommation énergétique en rendant les infrastructures existantes viables sur le long terme. Ce gain de performance est essentiel pour trouver l’équilibre entre le besoin d’énergie et la préservation de l’environnement.

Hausse de la densité : maximiser le potentiel de chaque rack et centre de données

Compte tenu de la croissance exponentielle de la demande de calcul d’IA, la densité à l’échelle est devenue la nouvelle référence en matière d’efficacité informatique. Les solutions sont construites non pas au niveau du nœud, mais au niveau des racks et du centre de données. Cela signifie que les organisations cherchent à maximiser les charges de travail par rack en utilisant pleinement les capacités du matériel disponible. Contrairement aux anciens systèmes, où les ressources étaient souvent sous-utilisées en raison de leur manque d’efficacité, les architectures modernes sont conçues pour annuler le gaspillage et améliorer l’utilisation moyenne à l’échelle du rack et du centre de données, sans les effets secondaires d’imprévisibilité.

L’optimisation de la densité au niveau des solutions ne se limite pas aux charges de travail d’IA. Certaines charges de travail, comme l’inférence IA, nécessitent d’adapter l’infrastructure aux environnements à usage mixte, pour lesquels la densité de calcul doit être généralisée. Dans les organisations d’ingénierie logicielle, les technologies de virtualisation et de conteneurisation - associées à des conteneurs plus efficaces et à des pratiques de codage qui prennent en compte la consommation énergétique - permettront une meilleure répartition des ressources. Ce qui permettra aux entreprises d’atteindre des taux d’utilisation plus élevés sans compromettre les performances.

Souveraineté et sécurité : l’IA d’entreprise en plein essor

La souveraineté et la sécurité des données influenceront fortement les stratégies de déploiement de l’IA en 2025. Les entreprises sont de plus en plus conscientes de la valeur de leurs ensembles de données propriétaires, qu’elles considèrent comme des avantages concurrentiels. Cette évolution signifie que les charges de travail d’inférence de l’IA s’exécuteront non seulement dans des clouds hyperscale publics, mais aussi dans des environnements plus sécurisés tels que les clouds privés, les centres de données sur-site ou les installations d’hébergement privées.

Le risque de violation des données et d’altération des algorithmes d’IA renforce la nécessité d’une infrastructure sécurisée et isolée. À mesure que les entreprises se concurrencent en matière d’innovation axée sur l’IA, leur capacité à protéger la propriété intellectuelle et les informations sensibles représentera la clé du succès. Cette tendance élargira le rôle du patrimoine informatique de l’entreprise, créant ainsi un écosystème d’IA plus décentralisé et plus sûr. Cette exigence de souveraineté et de sécurité, combinée à la nécessité de déployer des ressources informatiques à proximité des utilisateurs, dispersera les ressources informatiques et donnera naissance à une architecture périphérique plus lourde en termes de calcul.