Lors de l’événement Evolve25 à Londres, Cloudera a détaillé sa stratégie de convergence entre intelligence artificielle, cloud hybride et gouvernance des données. Une approche tournée vers les grandes organisations régulées, mais qui esquisse aussi une vision des plateformes auto-adaptatives et multi-agents.
Cloudera reste peu visible aux yeux des utilisateurs finaux, mais son influence n’en est pas moins structurante dans les architectures critiques des entreprises. Historiquement ancrée dans l’univers Hadoop, la plateforme continue de gérer plus de 25 exaoctets de données pour les institutions financières, les services publics ou les industriels. « Nous sommes les opérateurs discrets des systèmes les plus complexes, résume Sergio Gago, CTO de Cloudera, et nous savons que ce sont les fondations techniques, pas les paillettes marketing, qui conditionnent l’impact réel de l’IA sur le terrain. »
Avec une croissance à deux chiffres dans les services publics et un investissement R&D supérieur à 300 millions de dollars, Cloudera capitalise sur ses fondations big data pour répondre aux nouveaux impératifs : performance, flexibilité opérationnelle, et adoption rapide de l’IA en production. La couche applicative est volontairement laissée aux partenaires, mais tout le socle stockage, traitement, catalogue, pipeline, inférence, est maîtrisé dans une logique de convergence ouverte.
AI in a Box, Octopi et Tycoon, les briques d’un futur automatisé
Trois piliers techniques marquent l’évolution de l’offre Cloudera :
• AI in a Box : une offre conjointe avec Dell et Nvidia, embarquant une plateforme IA clé en main sur GPU, destinée à l’inférence privée en datacenter. « Cette solution permet d’allier la performance matérielle, la souveraineté logicielle et une intégration directe dans l’existant », précise Franck O’Dowd, Chief Commercial Officer.
• Tycoon : un plan de contrôle Kubernetes unifié, permettant d’orchestrer des charges de travail sur AWS, Azure, GCP ou dans plusieurs centres de données. « C’est notre clé pour fournir une expérience cloud-native, y compris dans des environnements souverains ou contraints », ajoute Sergio Gago.
• Octopi : une plateforme d’observabilité et de migration, qui permet de découvrir, de tracer, de migrer et d’automatiser les pipelines existants. « Avec Octopi, nos clients découvrent parfois des jeux de données oubliés depuis des années. C’est une solution d’hygiène numérique autant que d’innovation », souligne le CTO.
Ces fondations techniques permettent à Cloudera d’envisager une fédération des données sans copie, compatible Iceberg et S3, avec un catalogue unifié et traçable, la base nécessaire à l’agentification et à l’industrialisation responsable de l’IA.
Ce que Cloudera entend par « IA hybride »
Le terme « IA hybride », fréquemment utilisé par Cloudera lors d’Evolve25, désigne une approche articulée autour de deux axes : l’hybridation infrastructurelle (exécution cloud privé/public, sur site, edge) et l’hybridation fonctionnelle (orchestration de flux IA opérés par des agents, avec gouvernance humaine dans la boucle). Contrairement aux offres « AI-first » des hyperscalers ou aux « copilotes métier » des éditeurs applicatifs, l’IA hybride selon Cloudera n’est ni une couche ajoutée au-dessus des données, ni un outil métier isolé, mais un mode opératoire intégré à la plateforme de données elle-même.
« Nos clients veulent pouvoir exécuter l’IA là où les contraintes réglementaires, économiques ou techniques l’imposent. Sur site, dans un cloud souverain, dans leur datacenter ou à la périphérie. L’hybridité, c’est la réalité du terrain », affirme Charles Sansbury. Cette flexibilité géographique est complétée par une capacité à déclencher l’intelligence dans différents contextes fonctionnels : moteur de règles, inférence sur GPU locaux, agents orchestrés en tâche de fond, etc. Cloudera ne vend pas une IA centralisée, mais une capacité distribuée d’inférence, d’orchestration et de traçabilité.
« le bon traitement, au bon endroit, avec la bonne gouvernance »
D’un point de vue stratégique, cette approche hybride permet à Cloudera de s’adresser à un segment bien spécifique, les grandes organisations distribuées, soumises à des contraintes de coût marginal et de gouvernance autonome. À rebours des solutions 100 % cloud-native ou packagées métier, l’IA hybride revendiquée par Cloudera permet une adaptation fine aux réalités opérationnelles des DSI, avec une promesse : « le bon traitement, au bon endroit, avec la bonne gouvernance ».
En cela, Cloudera ne cherche pas à concurrencer frontalement les hyperscalers ou les éditeurs SaaS, mais à se positionner comme la colonne vertébrale agent-compatible de l’IA d’entreprise, capable de faire dialoguer les flux d’un ServiceNow, les règles d’un SAP, les traitements d’un moteur LLM privé, et les contraintes d’un datacenter certifié. C’est cette capacité d’orchestration distribuée et industrialisable que l’entreprise résume sous l’appellation d’« IA hybride ».
De l’application à l’agent : l’interface cède la place à l’intelligence
À l’heure de l’IA générative, l’application devient une interface jetable, remplacée par des agents contextuels connectés aux lacs de données. « Si vos données sont bien organisées, vous n’avez plus besoin d’application. Un agent devient votre outil RH, votre copilote conformité, votre analyste financier », explique Sergio Gago. Cette bascule redéfinit le rôle de la plateforme technique, désormais chargée de garantir l’intégrité des flux, l’auditabilité des inférences, et la cohérence des accès.
Cloudera se positionne ici comme le socle de confiance : fédération transparente des sources, exécution localisée en fonction des contraintes réglementaires, inférence sur site ou en cloud selon les coûts marginaux. « Nos clients veulent des IA productives, pas des démos. Nous leur offrons les outils pour industrialiser, migrer, tracer et corriger leurs pipelines de manière automatique », insiste le CTO.
Une position médiane assumée entre infrastructure et applicatif
Face à la consolidation des écosystèmes IA autour d’architectures intégrées, Cloudera défend une posture originale. Ni fournisseur d’infrastructure, ni éditeur d’applications, l’entreprise revendique un rôle de socle transversal d’orchestration des données. « Nous ne poussons rien à nos clients, nous les laissons orchestrer », résume Charles Sansbury. Une formule qui illustre sa volonté de laisser le choix entre cloud public, cloud privé, edge ou sur site, sans compromis sur l’expérience ni la sécurité.
Cloudera n’a pas vocation à produire des cas d’usage métiers, mais à fournir la fabrique pour les concevoir. « Nous ne construisons pas les applications, nous donnons la carte des recettes pour que nos clients et nos partenaires les composent eux-mêmes », détaille le CTO. En clair, Cloudera outille les éditeurs de demain, mais ne cherche pas à le devenir.
Cette approche diffère à la fois des hyperscalers, qui cherchent à verrouiller les flux dans leurs environnements, et des éditeurs applicatifs, qui montent en gamme sans interopérabilité. « Nous sommes ouverts, agnostiques, et compatibles avec Iceberg, Trino, Ozone, Glue. Même nos concurrents intègrent certains de nos modules », revendique Gago.
Vers une plateforme de données auto-pilotée par l’IA
Au-delà des infrastructures, Cloudera prépare l’étape suivante, celle de la cogouvernance automatisée. « Nous voulons que notre plateforme détecte, corrige et optimise les flux de données à la volée, avec un humain dans la boucle quand nécessaire », confie Sergio Gago. Des expériences internes sont en cours autour de pipelines auto-correcteurs, de gestion dynamique des charges RAG, et de création de données synthétiques supervisées.
Cette ambition d’une « plateforme d’IA pour l’IA » rejoint une conviction partagée par Charles Sansbury : « L’IA n’est pas une solution en surcouche. Elle doit devenir le moteur même de la gouvernance, du déploiement et de la supervision des données à l’échelle. » Dans ce modèle, le rôle des agents n’est plus seulement celui d’interfaces, mais celui d’opérateurs autonomes d’un système de plus en plus auto-adaptatif.