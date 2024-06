OVHcloud lance de nouveaux GPUs NVIDIA Tensor Core et des modèles IA

juin 2024 par Marc Jacob

Conçues stratégiquement pour couvrir les besoins actuels et futurs des ingénieurs IA, les solutions OVHcloud boostent les projets de la création de modèles d’IA à l’inférence des derniers modèles de LLM. Ainsi, le Groupe offre un catalogue complet de GPUs NVIDIA à l’état de l’art dans l’univers Public Cloud, lesquels sont disponibles à la demande depuis des datacenters respectueux de l’environnement, avec notamment les GPUs NVIDIA H100 Tensor Core, GPUs NVIDIA L4 Tensor Core et les GPUs NVIDIA L40S. Qu’il s’agisse de provisionner et gérer des instances GPU ou de les exploiter depuis les services OVHcloud Managed Kubernetes, les ingénieurs MLOps profitent de la profondeur du portefeuille d’offres PaaS OVHcloud et notamment en matière de bases de données managées (comme Vector DB, pgvector et Qdrant), Kafka ainsi que l’Object Storage High-Performance.

La poursuite de la mise en œuvre de la feuille de route IA ambitieuse d’OVHcloud se traduit par la capacité d’exécuter des projets IA sur les GPUs NVIDIA L40S dans l’univers Public Cloud aux côtés des GPUs NVIDIA H100 et L4 déjà disponibles. Les GPU NVIDIA L40S combinent puissance de calcul IA et accélération graphique et média de pointe pour prendre en charge une vaste panoplie de scénarii de l’inférence de LLM à l’entraînement en passant par les graphismes, le rendu et la vidéo.

Serveurs Bare Metal dédiés maintenant avec GPU NVIDIA L40S

Pour répondre aux besoins de puissance IA en matière de serveurs dédiés, OVHcloud a également lancé de nouveaux serveurs dédiés Bare Metal avec en leur cœur la puce NVIDIA L40S. Disponible dans la gamme High Grade, le nouveau serveur HGR-AI-2 vise les cas d’usage tels l’apprentissage profond, l’apprentissage machine et le calcul haute performance. La gamme est équipée avec un processeur AMD EPYC 9354 en configuration bi-processeur, offrant 64 cœurs et 128 threads avec 384 Go de mémoire DDR5 (jusqu’à 2,3 To). Pour les charges de travail IA les plus intensives, le HGR-AI-2 possède deux GPUs NVIDIA L40S 48 Go et il est possible de configurer le serveur à la commande avec 4x GPUs NVIDIA L40S 48 Go.

Outils faciles d’emploi pour les charges IA

Pour simplifier d’avantage l’IA et son appropriation par les entreprises, les solutions d’IA OVHcloud sont présentes à chaque étape de la chaîne de valeur de l’IA de l’idéation à la production. Les services AI Notebooks, AI Training et AI Deploy sont simples à utiliser et se présentent comme des solutions serverless conçues pour permettre l’expérimentation avec les données, entraîner les modèles et les déployer en production. Ces solutions logicielles interviennent dans les couches hautes et s’appuient sur des technologies répondant aux standards de l’industries. Elles sont pensées pour assister les data scientists et ingénieurs en machine learning qui n’auront pas besoin de gérer les sujets complexes d’infrastructures et d’adaptation de celle-ci à la montée en charge, le tout avec une facturation à la minute.

Nouveaux modèles open-source Llama et Mistral disponibles dans AI Endpoints

La solution serverless OVHcloud AI Endpoints offre l’accès à un ensemble de modèles d’IA via des endpoints API, ce qui permet de s’adresser aux utilisateurs néophytes. Avant de placer les calls API, les développeurs bénéficient d’un bac à sable pour tester leurs Endpoints. Tout comme les solutions appréciées que sont OVHcloud AI Notebooks, AI Training et AI Deploy, AI Endpoints s’appuie sur l’infrastructure du Group, respectant pleinement la confidentialité des données (in/out). Le Groupe a par ailleurs ajouter des modèles open-source particulièrement demandés comme Mixtral 8x22b et Llama 3 qui peuvent être déployés depuis le service OVHcloud AI Endpoints.

– Prix et disponibilité

Les nouveaux GPU NVIDIA et notamment les NVIDIA H100, L4 et L40S sont disponibles dès à présent dans l’univers Public Cloud pour les projets d’IA.

Les serveurs dédiés Bare Metal HGR-AI-2 avec GPU NVIDIA L40S sont maintenant disponibles en France et au Canada avec un prix mensuel à partir de 2969,99 euros.

Les nouveaux modèles et notamment Mixtral 8x22b et Llama 3 sont disponibles maintenant à travers OVHcloud AI Endpoints.