Rechercher
Contactez-nous Suivez-nous sur Twitter En francais English Language
 











Abonnez-vous gratuitement à notre NEWSLETTER

Newsletter FR

Newsletter EN

Vulnérabilités

Se désabonner

Cloudera lance Kudu, nouveau système de stockage Hadoop qui accélère l’analyse des données

septembre 2015 par Marc Jacob

Cloudera annonce la disponibilité de la version bêta publique de Kudu, un nouveau système de stockage orienté colonnes pour Hadoop, accélérant l’analyse des données. Complétant les options de stockage Hadoop existantes – HDFS et Apache HBase – Kudu est le premier moteur de stockage Hadoop natif qui supporte à la fois les accès aléatoires à basse latence et les analyses haut-débit, et qui simplifie considérablement les architectures Hadoop pour des utilisations en temps réel de plus en plus répandues. Une version bêta publique est disponible immédiatement sous licence open source Apache et sera transféré vers l’incubateur de l’Apache Software Foundation dans le futur.

Jusqu’à aujourd’hui, les développeurs étaient forcés de choisir entre une analyse rapide avec HDFS et une mise à jour efficace avec HBase. Avec l’augmentation des volumes de données en streaming, les entreprises ont de plus en plus besoin de combiner les deux fonctionnalités pour construire des applications analytiques en temps réel basées sur des données variables – ce qui a encouragé les développeurs à créer des architectures complexes à l’aide des options de stockage disponibles. Kudu vient compléter les fonctionnalités de HDFS et HBase, en fournissant des fonctions d’insertion et d’actualisation rapides, ainsi que des scans de colonnes particulièrement efficaces. Cette combinaison puissante facilite la gestion de flux d’analyses en temps réel reposant sur une couche unique de stockage, ce qui élimine le besoin d’architectures complexes.

L’architecture de Kudu aide les développeurs à rationaliser la construction d’applications analytiques, en supportant les cas d’usages les plus courants comme l’analyse de séries temporelles, l’analyse de données machines et le reporting en ligne. De plus, Kudu est conçu pour tirer parti des dernières évolutions des matériels hardware et des traitements en mémoire. Il délivre d’excellentes performances CPU, tire parti des mémoires RAM et Flash, et améliore la gestion des E/S en tant que véritable base de données orientée colonnes. Enfin, composant ouvert et natif d’Hadoop, Kudu est intégré avec et fournit de meilleures performances de requêtage pour les environnements analytiques les plus puissants. Les utilisateurs tirent déjà largement parti de ceux-ci – dont Impala et Spark – pour des applications analytiques de bout en bout reposant sur une plate-forme unique.

Kudu a été conçu par Cloudera et Intel qui ont anticipé l’évolution du paysage hardware. Intel a contribué activement à Kudu, afin de s’assurer qu’il tire le meilleur parti de ses technologies de processeurs et de mémoire actuelles et futures. Kudu a été conçu pour utiliser les innovations développées à travers « pmem », le projet de mémoire persistante d’Intel.

En tant que projet open source, Kudu a suscité une large implication de la communauté. Xiaomi, l’un des principaux fabricants mondiaux de smartphones, est l’un des premiers bêta-testeurs de Kudu et a contribué activement au projet. D’autres entreprises, comme AtScale, Splice Machine et Zoomdata ont également enrichi Kudu.

Pour aider les entreprises à être orientée vers les données, l’architecture Hadoop doit fonctionner à la même vitesse que sont créées et modifiées les données. Avec Kudu, la communauté Hadoop entre dans la nouvelle génération d’applications Hadoop, dotées d’un système de stockage capable d’assurer des analyses accélérées.


Voir les articles précédents

    

Voir les articles suivants