Selon des études récentes, bien que 81 % des organisations ont augmenté leurs investissements dans les données et l’analytique au cours des deux dernières années, plus de 40 % continuent de lutter contre des problèmes tels que la mauvaise qualité des données et l’utilisation d’outils disparates. Dans ce contexte, Google Cloud a profité de son événement annuel, Next ’23,pour lancer BigQuery Studio, un service agréé au sein de son entrepôt de données dans le cloud. La plateforme est conçue pour accélérer les flux de travail en fournissant un environnement intégré et sécurisé pour l’analytique.

Il s’agit pour Google de proposer un espace de travail collaboratif pour faciliter le développement et le déploiement des modèles d’IA en simplifiant et en accélérant les flux de travail relatifs à l’analytique et l’inférence. Outre la tendance à lancer des architectures de référence, comprenant des outils (matériels et logiciels) au sein d’architectures hyperconvergées, pour le déploiement de l’IA en entreprise, les fournisseurs s’efforcent de proposer des solutions unifiant les interfaces et proposant un espace collaboratif unique.

L’objectif est d’accélérer l’adoption par le marché via des solutions qui abstraient autant que faire se peut la complexité, ceci pour accélérer les flux de travail des données vers l’IA, de l’ingestion et la préparation des données à l’analyse, l’exploration et la visualisation, jusqu’à l’entraînement et l’inférence ML. Les équipes peuvent ainsi consacrer davantage de ressources à des tâches complexes telles que la construction d’un métamodèle cohérent pour l’ensemble de l’entreprise.  

Une seule plateforme pour les gouverner tous

BigQuery Studio sert de hub unifié qui rationalise les opérations allant de l’ingestion des données à la formation et à l’inférence en apprentissage machine (ML). Il permet de coder en SQL, Python, Spark ou même en langage naturel au sein de l’écosystème BigQuery, de mettre en œuvre les meilleures pratiques de développement logiciel telles que CI/CD, l’historique des versions et le contrôle de source, et d’activer l’application uniforme des politiques de sécurité et des informations de gouvernance.

Cette approche intégrée atténue le besoin de basculer entre différents outils et langages, accélérant ainsi le temps de rentabilité des investissements des organisations dans les données et l’IA. BigQuery Studio intègre à la fois des interfaces SQL et de notebook, ce qui en fait un espace de travail polyvalent pour les ingénieurs de données, les analystes et les scientifiques. En exploitant la technologie Colab Enterprise, les utilisateurs peuvent naviguer en toute transparence de l’analyse des données à l’analytique prédictive, en utilisant leur langage de codage habituel.  

Un assistant-codeur intégré

Il est à noter que BigQuery Studio offre également une compatibilité à travers les environnements cloud tels que Google Cloud, AWS et Azure, pris en charge par BigLake et son support intégré pour Apache Parquet, Delta Lake et Apache Iceberg. La solution favorise la collaboration avec des fonctionnalités telles que la connectivité sécurisée aux dépôts de code externes. De plus, la plateforme présente Duet AI, un assistant alimenté par l’IA qui offre un chat contextuel et des suggestions de code, éliminant les obstacles traditionnels de recherche et d’essai et d’erreur.

Au chapitre de la qualité et de la sécurité des données, la plateforme de Google est encore en chantier. L’éditeur devrait présenter bientôt les nouvelles fonctions dans ces domaines, comme la présentation d’informations sous forme de métadonnées personnalisées et des protocoles de gouvernance durcis, tels que le suivi de la lignée des données et l’application de la qualité. Les analystes de données peuvent également utiliser les modèles fondamentaux de Vertex AI directement dans BigQuery pour des tâches telles que l’analyse du sentiment, ceci sans partager de données à l’extérieur. BigQuery Studio est maintenant ouvert pour l’aperçu client.