Conçu par Databricks et faisant partie de l’écosystème Delta Lake, Delta Sharing permet aux utilisateurs de partager des ensembles de données à travers les frontières organisationnelles sans avoir à copier ou déplacer physiquement les données. Pour rappel, Delta Lake est une couche de stockage open source, conçue pour améliorer les performances, la gestion et la fiabilité des lacs de données. Développée par Databricks et bâtie sur Apache Spark, elle apporte des fonctionnalités de gestion transactionnelle avancées aux fichiers stockés dans des systèmes distribués, tels qu’Amazon S3, Azure Data Lake Storage ou Google Cloud Storage.
Une approche ouverte et sécurisée du partage de données
Ces solutions, basées sur l’open source, offrent plusieurs avantages dans le contexte d’une exploitation systématique des données pour la collaboration et l’analytique. Tout d’abord, elles favorisent une approche ouverte et sécurisée du partage et de la collaboration basée sur les données et grâce au protocole opensource. Ensuite, elles simplifient le partage des données et la collaboration, permettant aux équipes de travailler ensemble de manière plus efficace. De plus, elles permettent un partage des données en temps réel entre différentes plates-formes, évitant ainsi la réplication des données et optimisant la gouvernance des données grâce à une gestion centralisée des accès.Le nouveau connecteur exploite la puissance de Delta Lake, la couche de stockage open source qui permet de créer des pipelines de données. Le connecteur Tableau Delta Sharing est désormais disponible sur Tableau Exchange, la place de marché des solutions intégrées aux technologies Tableau. Cette intégration permet une gestion, un partage et une analyse des données de bout en bout, s’intégrant aux fonctions de gestion des données de Tableau, notamment Tableau Prep, Tableau Catalog et Tableau Server.
Par ailleurs, Tableau a dévoilé « Explore in Tableau » pour naviguer dans ses données en un seul clic et découvrir des informations. Cette fonctionnalité permet de se connecter à des sources de données en temps réel, sans quitter son navigateur, améliorant ainsi l’efficacité de la recherche d’informations et la prise de décision sur la base de ces informations.
Fonctionnement de Delta Sharing
Architecture ouverte
Delta Sharing repose sur un protocole ouvert de partage de données, ce qui signifie que tout système prenant en charge le protocole peut participer au partage de données. Cela facilite l’intégration avec une variété de plateformes de données existantes, qu’elles soient basées sur le cloud ou sur site.Intégration avec Delta Lake
Delta Sharing utilise Delta Lake, une couche de stockage qui repose sur des formats de fichiers parquet optimisés pour les grandes données. Delta Lake dispose de plusieurs fonctionnalités critiques telles que :- Transactions ACID assure la cohérence, l’isolation et la durabilité des transactions de données, garantissant ainsi l’intégrité des données même dans des environnements distribués complexes.
- Gestion des métadonnées : Delta Lake gère les métadonnées de façon centralisée, ce qui permet à Delta Sharing de suivre les versions des ensembles de données partagées et de gérer les accès de façon sécurisée.