La start-up a créé une plateforme sur le cloud pour rendre le Big Data immédiatement disponible.
Les start-up d'origine indienne qui tentent de s'imposer sur la Silicon Valley, comme celles créées par des résidents américains d'origine indienne qui se développent en exploitant les ressources en ingénieurs de l'Inde, affichent presque toutes le même profil : une réelle désinvolture dans l'attitude, un fouillis organisationnel qui trouve toujours sa solution, une grande capacité de travail, et un condensé d'intelligence.
QuBole n'échappe pas à cette description, et l'entame de notre rencontre avec la start-up s'est traduite par une nouvelle aventure..., pour se terminer en admiration pour le travail accompli et l'offre qui en découle. Vous l'avez compris, QuBole est une start-up américaine, créée par des indiens, dont la plupart de l'équipe de développement est basée à Bengalore, en Inde.
Big Data as a Service
Mais venons en à ce qui nous a séduit chez cette start-up : elle propose une approche verticale du Big Data Hadoop. Soit une plateforme sur un cloud public, pour le coût réduit, la simplicité et l'élasticité, pour déployer une infrastructure Hadoop dans le nuage.
Pour l'utilisateur qui accède au service, il suffit d'indiquer quelle plateforme de cloud public il choisit – Amazon, Google ou Microsoft Azure – puis de se laisser guider pour définir l'infrastructure et les applications à déployer. Un cluster de 10 à 1000 nodes peut être créé en quelques minutes. Et enfin de payer la consommation des ressources analytiques au temps exploité, comme tout service SaaS qui se respecte.
Un 'use case' Big Data simplifié
Les trois points forts de QuBole sont, tout d'abord, l'automatisation de la création de la plateforme Hadoop sur un cloud public. Puis le support de l'infrastructure déployée, jusqu'à sa reconfiguration en cas de changements, que ce soit chez l'opérateur du cloud (Amazon, Google, Microsoft) ou chez le client. Enfin la maîtrise du coût, QuBole se chargeant par exemple d'éteindre le cluster Hadoop lorsque les requêtes (query) ont été exécutées.
La force de QuBole, au delà de proposer un point d'entrée unique pour un cloud Hadoop, est de proposer aux développeurs une plateforme qui se révèle non pas plus puissante – on y retrouve les mêmes outils de la stack Hadoop – mais plus rapide que celles qui sont proposées nativement par les clouds privés, comme Amazon EMR (cluster) et AWS Big Data. L'autoscaling, l'automatisation des ressources consommées, a été également particulièrement soignée, avec des mécanismes de qualification des instances.
Un écosystème qui s'enrichit
Le moteur de Big Data repose sur la stack Hadoop, avec Hive, Presto (Facebook), Spark, etc. Les développeurs Hadoop peuvent embarquer QuBole dans leurs applications via un SDK et des API. Des connecteurs sont également proposés pour les outils de visualisation, comme Tableau ou Excell. Quant aux données, elles sont automatiquement et gratuitement cryptées.
Une particularité, qui n'aura pas échappé aux connaisseurs du monde Hadoop, nous n'avons pas évoqué de distribution. En effet, QuBole ne repose sur aucune d'entre elles (Hortonworks, Cloudera, MapR, IBM ou Pivotal), la start-up a choisi le support de Apache Hadoop. « La qualité d'Apache Hadoop ne donne pas toujours de sens à utiliser une distribution », nous a commenté Shrikanth Shankar, vice-président Engineering.
L'exemple Pinterest
QuBole affiche une forte progression. La start-up affiche aujourd'hui mensuellement 86 Po de transactions et 250.000 machines virtuelles. Son plus gros client aligne un cluster de 1800 nodes !
Et justement, nous avons pu évoquer le retour d'expérience de Pinterest, le célèbre site de partage d'images. Celui-ci a retenu le Big Data et QuBole pour la création de ses index de recherche. Le site souhaitait étendre rapidement l'usage du Big Data vers ses développeurs afin de faciliter l'accès aux données. Pour sa stabilité, sa scalabilité et sa rapidité, QuBole a remplacé Amazon EMR.