À l’occasion du Snowflake World Tour à Paris, nous avons eu l’opportunité d’interviewer Benoît Dageville, cofondateur de Snowflake, pour discuter des dernières évolutions de la plateforme, des enjeux de gestion des données pour les entreprises modernes, et de la place grandissante de l’Intelligence Artificielle dans la stratégie des entreprises.

IT Social : Benoît, merci de nous accorder cet entretien. Lors de votre présentation ce matin, vous avez mentionné l’évolution de Snowflake de simple Data Warehouse vers une plateforme de Data Cloud complète. Pouvez-vous nous expliquer cette transformation et ce que cela implique pour vos clients ?

Benoît Dageville : À l’origine, Snowflake a été conçu comme un entrepôt de données pour le cloud. Mais très rapidement, nous avons vu que les besoins de nos clients allaient bien au-delà de l’entrepôt traditionnel. L’évolution a été naturelle vers ce que nous appelons aujourd’hui le Data Cloud. Cela inclut la capacité de traiter des données structurées et non structurées, de construire des pipelines, de réaliser des analyses avancées et d’intégrer de l’IA et des applications. En fait, nous sommes passés d’un modèle de Data Warehouse à une plateforme intégrée qui permet de stocker, gérer et analyser toutes les données de l’entreprise, tout en gardant une flexibilité totale de l’infrastructure.

IT Social : Vous avez beaucoup parlé de la gestion des données non structurées. Pourquoi ce focus, et quelles sont les solutions que Snowflake propose dans ce domaine ?

Benoît Dageville : La gestion des données non structurées est un défi pour de nombreuses entreprises. Elles possèdent d’énormes quantités de documents, vidéos, images, etc., mais elles ont du mal à en extraire de la valeur. C’est là que nos nouvelles fonctionnalités comme Cortex Search et nos technologies d’indexation vectorielle interviennent. Avec Cortex Search, les entreprises peuvent facilement indexer leurs documents, générer des embeddings via notre technologie ARTICS et utiliser le Similarity Search pour retrouver des informations précises. Cela ouvre la voie à des applications telles que des chatbots sur des manuels internes ou des recherches basées sur des mots-clés et des concepts, et non plus seulement sur des termes exacts.

IT Social : Vous mentionnez l’IA comme un pilier central de cette transformation. Quelle est la place de l’IA dans cette architecture, et comment vos clients peuvent-ils
en bénéficier ?

Benoît Dageville : L’IA est effectivement un des trois piliers de notre stratégie, avec les data et les applications. Nous avons intégré des fonctionnalités d’IA directement dans la plateforme, ce qui permet de créer des modèles et des pipelines d’IA sans nécessiter d’infrastructure supplémentaire. Par exemple, nos clients peuvent utiliser Cortex pour automatiser l’extraction de texte, la classification des documents, ou même créer des modèles de machine learning pour prévoir des tendances à partir de leurs données. Notre objectif est de rendre l’IA accessible à tous, même à ceux qui n’ont pas de background technique, en démocratisant son utilisation via des outils simples et intuitifs.

IT Social : Vous parlez souvent d’architecture data-driven et de la fin des silos de données. Comment Snowflake permet-il cette transition pour ses clients ?

Benoît Dageville : L’un des plus grands défis pour les entreprises est la multiplication des silos de données, surtout quand elles utilisent plusieurs fournisseurs de cloud. Notre architecture découple le compute et le storage, ce qui permet aux données d’être centralisées dans un espace unique, tout en offrant la flexibilité d’y accéder avec différents moteurs de calcul (CPU, GPU, conteneurs, etc.). Nous proposons également des solutions comme Iceberg pour standardiser le format des données et le catalogue Polaris pour une gouvernance unifiée des données, même si elles proviennent de différentes sources. L’objectif est de connecter les entreprises entre elles, mais aussi de simplifier l’accès aux données entre les différents services d’une même organisation.

IT Social : Vous avez évoqué la montée en puissance de la collaboration via des marketplaces de données. Pouvez-vous nous en dire plus sur cette vision ?

Benoît Dageville : Absolument. Le marketplace de Snowflake permet aux entreprises de partager et de collaborer sur des données en temps réel, sans avoir à copier ni déplacer ces données. Imaginez-le comme un Google Docs des données. Cela permet de réduire les coûts associés à la duplication des datasets, de maintenir une gouvernance stricte et de faciliter l’échange de données avec les partenaires, les fournisseurs et même les clients. Nous voyons cela comme un élément clé pour détruire les silos de données et pour encourager une collaboration plus étroite au sein des écosystèmes data.

IT Social : L’un des sujets qui revient souvent est l’interopérabilité des formats de données. Comment Snowflake gère-t-il cet enjeu avec les autres acteurs du marché comme Databricks ?

Benoît Dageville : L’interopérabilité est cruciale, surtout dans un environnement où les entreprises utilisent de plus en plus de formats open source comme Iceberg. Nous avons fait le choix d’embrasser ces standards et de les intégrer de manière native dans Snowflake, plutôt que de développer nos propres formats propriétaires. Nous avons également contribué à l’écosystème open source avec des projets comme Polaris, un catalogue ouvert qui permet de gérer des métadonnées de manière indépendante de tout fournisseur. Nous croyons qu’il est important de collaborer sur ces sujets pour éviter la fragmentation et permettre à nos clients de choisir la solution qui correspond le mieux
à leurs besoins.

IT Social : Et pour finir, quelle est la prochaine étape pour Snowflake ?

Benoît Dageville : Nous continuons à innover sur nos trois piliers : la gestion des données, l’IA, et les applications. Cette année, nous allons lancer Unistore, qui est notre solution transactionnelle hybride, permettant de traiter des données analytiques et transactionnelles dans le même système. Nous travaillons aussi sur l’amélioration de nos capacités de streaming de données et d’IA générative pour faciliter encore plus la création d’applications intelligentes. À long terme, nous voulons transformer Snowflake en une plateforme où les applications peuvent s’exécuter de manière native, tout en assurant que les données ne sortent jamais de notre écosystème. En somme, nous voulons créer un environnement où les données, l’IA et les applications cohabitent de manière fluide, intégrée et sécurisée.