Vast Data a dévoilé une architecture destinée à être « la base de la recherche assistée par l'IA », la plateforme Vast Data. C'est la nouvelle offre d'infrastructure de données de Vast qui intègre les fonctions de stockage, de base de données et de moteurs de calcul virtualisés, tout cela au sein d'un système évolutif conçu pour le marché de l’IA et du déploiement à grande échelle de l’apprentissage profond.

Ce système d'information est « défini par les données », explique Vast Data. Autrement dit, il est conçu pour permettre le stockage de données structurées et non structurées, tout en assurant le traitement et la distribution de ces dernières depuis un système unifié. Selon Vast Data, cette approche vise à « réduire la divergence entre les architectures centrées sur les événements et celles centrées sur les données ». Elle offre une accessibilité fluide aux données, qui peuvent être traitées dans n'importe quel centre de données, qu'il soit privé ou public. De plus, elle favorise une meilleure compréhension des données en intégrant directement une couche sémantique interrogeable.  

Unification des architectures orientées événements et celles orientées données

« Au final, cette stratégie permet un calcul perpétuel et récursif des données en temps réel, s'adaptant et évoluant à chaque interaction », affirme l’éditeur. L'objectif est de combler le fossé entre les architectures orientées événements et celles axées sur les données en offrant une accessibilité universelle aux données. Les données peuvent ainsi être traitées dans n'importe quel centre de données, qu'il soit privé ou public. En outre, elle favorise une meilleure compréhension des données en intégrant directement une couche sémantique interrogeable. Finalement, cette stratégie permet un calcul perpétuel et récursif des données en temps réel, s'adaptant et évoluant à chaque interaction.

Pour renforcer les fonctionnalités de sa plateforme destinées à capturer et servir les données, Vast a développé le VastDataStore, une architecture de stockage scalable pour les données non structurées. Ce système est conçu pour répondre aux besoins des architectures informatiques les plus performantes du moment, comme les supercalculateurs d'IA NVIDIA DGX SuperPOD, ainsi que les plateformes de big data et de HPC.  

Unification de l’accès aux données dispersées via la virtualisation

Parallèlement, pour structurer les données naturellement non structurées, Vast a instauré une couche de base de données sémantique, la VastDataBase. C'est une couche qui combine les caractéristiques d'une base de données, d'un entrepôt de données et d'un lac de données dans un système de gestion de base de données simple, distribué et unifié.

La plateforme Vast Data met en place un processus d'enrichissement des données brutes non structurées en informations structurées et interrogeables grâce à l'ajout de fonctions et de déclencheurs via le VastDataEngine. Ce dernier est un moteur d'exécution de fonctions globales qui unifie les centres de données et les régions cloud dans un cadre informatique global. En somme, il représente une couche d’abstraction de la disparité géographique des données. Il fonctionne sur le DataStore avec des flux en temps réel de contenu enrichi, de données IoT et de texte. Le DataEngine prend des décisions en corrélant toutes les métadonnées d'un parc de stockage Vast, en accédant à tous les emplacements mondiaux du parc et en incluant les données d'archive.

Cela permet à la plateforme Vast Data d'unifier les services de stockage, de base de données et de moteur de calcul virtualisé dans un système évolutif qui a été conçu dès le départ pour le marché de l'IA et pour favoriser l’architecture par la convergence. Enfin, VastDataSpace, un espace global de noms, permet à chaque site de stocker, d'extraire et de traiter des données à partir de n'importe quel endroit tout en conservant les performances. DataStore, DataBase et DataSpace sont disponibles au sein de la plateforme de données de Vast. Le DataEngine sera disponible en 2024.