Cloudera annonce une série d'évolutions de sa plateforme de données hybride articulées autour de trois leviers, stabilité à long terme, mise à l'échelle du calcul à la demande, et interopérabilité ouverte des données sans duplication. La plateforme étend son support jusqu'en 2032 et intègre un optimiseur automatisé pour les tables Apache Iceberg.
Les investissements en IA des organisations s'accélèrent à un rythme soutenu, les dépenses mondiales augmentent, et les directions informatiques qui modernisent leur patrimoine de données font face à une tension opérationnelle persistante. La fréquence des cycles de mise à jour, l'augmentation des coûts d'infrastructure et la fragmentation croissante des environnements hybrides absorbent une part croissante des ressources disponibles. Les équipes data consacrent davantage de temps à maintenir la plateforme qu'à produire de la valeur analytique ou à faire avancer les projets d'IA.
Le support garanti jusqu'en 2032 par Cloudera permet aux DSI de planifier leur feuille de route data sans contrainte de renouvellement forcé. Les mises à jour simultanées sur les déploiements sur site et dans le cloud assurent la cohérence du patrimoine hybride sans imposer de refonte d'architecture. Résultat, les migrations disruptives sont remplacées par des transitions progressives, ce qui libère les équipes pour les projets à forte valeur ajoutée.
Iceberg optimisé automatiquement, calcul déclenché à la demande
Le cœur technique de cette version repose sur deux nouveaux mécanismes. Le Cloudera Lakehouse Optimizer prend en charge l'optimisation automatique des tables Apache Iceberg (compactage, nettoyage des fichiers, accélération des requêtes) avec un minimum d'intervention manuelle. Pour les équipes data qui gèrent des lacs de données de grande taille, cette automatisation réduit la charge tout en améliorant les performances analytiques sans reparamétrage périodique.
Le second mécanisme, Cloudera Cloud Bursting, permet d'activer des ressources de calcul cloud à la demande pour absorber les pics de charge de travail, sans déplacer les données depuis leur emplacement d'origine. Les données restent sur site, sous les politiques de sécurité et de gouvernance existantes, tandis que la capacité de traitement s'étend temporairement dans le cloud. Cette approche répond directement aux contraintes FinOps des organisations qui refusent de surdimensionner leur infrastructure sur site pour des pics prévisibles mais intermittents.
Partage de données sans copie sur les plateformes externes
L'interopérabilité des données constitue le troisième axe de cette mise à jour. La plateforme permet désormais un accès en lecture aux tables Iceberg en direct depuis des plateformes externes, outils analytiques tiers, environnements de science des données, services cloud partenaires, sans copie ni duplication. Les données partagées restent sous la gouvernance et le contrôle d'accès de Cloudera, ce qui évite la prolifération de copies non maîtrisées et le risque de désynchronisation entre versions.
Pour les organisations multi-cloud ou hybrides qui collaborent avec des équipes utilisant des outils hétérogènes, cette capacité réduit un point de friction courant : la nécessité d'exporter ou de répliquer les données pour les rendre accessibles à des consommateurs externes. Elle renforce également la traçabilité des accès aux données, dimension centrale pour les organisations soumises aux obligations du RGPD et aux exigences de gouvernance des données portées par l'AI Act.
Support 2032 et horizon IA : l'argument de continuité pour les DSI
Cette mise à jour renforce une stratégie que Cloudera résume par trois propriétés combinées : stabilité, mise à l'échelle et interopérabilité ouverte au sein d'une architecture unique. « Nos clients souhaitent bénéficier de la flexibilité du cloud, du degré de contrôle d'un datacenter et de capacités de mise à l'échelle non disruptives. Cette mise à jour répond à ces trois exigences au sein d'une seule et même plateforme unifiée, conçue pour l'IA et l'analyse de données modernes », indique Leo Brunnick, chief product officer chez Cloudera.
Pour les DSI en phase de rationalisation de leur stack data, l'horizon de support 2032 est un argument de planification budgétaire. Il réduit l'incertitude sur le coût total de possession et permet d'aligner la feuille de route data avec les cycles d'investissement pluriannuels. La valeur du Cloudera Lakehouse Optimizer reste directement corrélée à la densité du parc de tables Apache Iceberg géré sur la plateforme, les organisations qui ont déjà standardisé sur Iceberg en tireront le bénéfice immédiat.























