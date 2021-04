Cloudera collabore avec NVIDIA

avril 2021 par Marc Jacob

Cloudera annonce que Cloudera Data Platform (CDP) va intégrer RAPIDS Accelerator pour Apache Spark 3.0. Déployé sur les plates-formes informatiques NVIDIA, ce logiciel permet aux entreprises de dynamiser les pipelines de données et de repousser les limites de performance des flux de données et d’apprentissage automatique (ML).

Cela leur permet d’adopter plus rapidement l’IA et d’obtenir de meilleurs résultats commerciaux, sans modifier le moindre code. Avec la sortie en début d’année des prototypes ML appliqués (AMP) dans CDP et la puissance de calcul de NVIDIA, des clients comme l’Internal Revenue Service et l’Office for National Statistics UK disposent de nouvelles fonctionnalités. Ils peuvent non seulement lancer des modèles de ML entièrement configurés, mais aussi accélérer le traitement des données et l’entraînement de modèles à moindre coût pour tout déploiement sur site, dans le cloud public ou dans le cloud hybride.

Les data engineers utilisent des sets de données à une ampleur et une échelle jamais vues auparavant, notamment pour transformer les modèles de chaîne d’approvisionnement, répondre à des niveaux accrus de fraude ou concevoir de nouvelles lignes de produits. Pour les data scientists, les obstacles créés par ces flux massifs ont un impact direct sur le coût et la vitesse à laquelle les entreprises peuvent développer et exploiter des modèles dans l’ensemble de leur organisation. L’intégration de Cloudera et de NVIDIA devrait donner aux entreprises la capacité de répondre rapidement aux défis commerciaux émergents et de fournir des analyses approfondies.

Pour toute entreprise confrontée à des volumes élevés de données, un data pipeline accéléré par un processeur graphique (GPU) offre la possibilité de développer des modèles. Ainsi, une organisation peut renforcer sa capacité à se transformer en utilisant l’intelligence artificielle (IA). Apache Spark 3 accéléré par GPU fonctionne de manière totalement fluide sur CDP, permettant aux organisations de prendre en charge les besoins en calcul intensif (HPC), IA et data science - de la recherche à la production - avec une open plateforme sécurisée et extensible pour le machine learning.

RAPIDS Accelerator pour Apache Spark sera disponible dans CDP Private Cloud cet été. NVIDIA et Cloudera déploieront d’autres offres accélérées dans CDP au fil du temps, en commençant par Accelerated Deep Learning et Machine Learning dans CDP Public Cloud en mai.