Les modèles d’IA sont entraînés sur des ensembles de données massifs, qui peuvent être très volumineux. Le stockage est nécessaire pour entreposer ces ensembles de données afin que les modèles puissent y accéder pendant l’entraînement. Il fournit la capacité nécessaire pour conserver et traiter les grandes quantités de données requises pour l’apprentissage automatique. Une fois qu’un modèle d’IA est formé, il doit être stocké afin qu’il puisse être utilisé pour effectuer des prédictions ou des analyses. Le stockage performant est nécessaire pour entreposer ces modèles afin qu’ils soient accessibles aux utilisateurs et aux applications.
Doubler les capacités de lecture/écriture de PowerScale OneFS
« La performance du stockage joue un rôle essentiel dans la réussite des stratégies d’IA et d’IA générative, explique Arthur Lewis, président Global Infrastructure Solutions Group chez Dell. Nos clients attendent de nous que nous repoussions sans cesse les limites de l’innovation en matière de stockage, notamment en supprimant les freins à l’accès aux données, qui limitent la performance et l’évolutivité des applications gourmandes en ressources informatiques. Nous répondons à ces besoins en offrant un accès rapide, efficace et sécurisé aux données, en les transformant en un véritable gisement de possibilités en matière d’IA et d’IA générative ».Avec les optimisations apportées au logiciel PowerScale OneFS, les entreprises peuvent maintenant appuyer leurs projets sur les nouveaux systèmes de stockage all-flash PowerScale basés sur des serveurs Dell PowerEdge. Les performances en streaming devraient « doubler, en lecture et en écriture », selon Dell. Les nouveaux systèmes Dell PowerScale all-flash et la nouvelle fonction escale out intelligente seront disponibles au niveau mondial au cours du premier semestre 2024.
PowerScale bientôt certifié sur les systèmes DGX de Nvidia
Le fabricant a par ailleurs amélioré les performances en lecture/écriture aléatoire de PowerScale OneFS en optimisant la façon dont il gère les blocs de données. Il a en outre ajouté la prise en charge de la réplication de données et de la protection des données à chaud, et a augmenté la capacité de PowerScale OneFS en ajoutant la prise en charge des disques NVMe et des disques SSD de grande capacité.Dell annonce également que PowerScale est en cours de validation pour fonctionner avec les systèmes DGX SuperPod de Nvidia. Les DGX SuperPod sont des infrastructures de calcul haute performance spécifiquement conçues pour l’IA. Cette validation devrait être finalisée au cours du premier semestre de 2024. Grâce à la collaboration entre Dell et Nvidia, les clients pourront alors profiter de l’infrastructure Nvidia DGX, du stockage Dell PowerScale et des réseaux Quantum-2 InfiniBand et Spectrum Ethernet de Nvidia, afin de bénéficier d’un stockage plus rapide. Elles intègrent la plateforme logicielle Nvidia AI Enterprise pour fournir une solution de computation IA complète.
Une flexibilité accrue dans les environnements multicloud
Alors que près de 87 % des entreprises adoptent des stratégies multicloud, Dell laisse à ses clients la liberté de traiter leurs données là où ils le souhaitent : sur site, à la périphérie (Edge) ou dans des clouds publics. C’est ce qui explique que Dell APEX File Storage for Microsoft Azure, le dernier-né de la gamme Dell APEX Storage for Public Cloud, a également reçu les mêmes optimisations, notamment l’amélioration des performances en lecture/écriture aléatoire via une meilleure gestion des blocs de données, l’ajout de la prise en charge des disques NVMe et des disques SSD de grande capacité, ainsi que l’intégration de la réplication des données.Les clients pourront ainsi utiliser Azure OpenAI Service et Azure AI Vision pour leurs besoins d’apprentissage automatique. Par ailleurs, la collaboration avec Databricks permet aux clients de faire leur choix parmi une variété de grands modèles de langage (LLM) et utiliser les bibliothèques de Databricks MosaicML pour réentraîner un modèle de base avec leurs données propriétaires stockées dans Dell APEX File Storage. L’intégration de Dell APEX for File Storage aux solutions Databricks et MosaicML est disponible sur AWS dès aujourd’hui, et sur Microsoft Azure au cours du premier semestre 2024.
Cette collaboration avec Databricks repose sur les partenariats de l’écosystème de gestion des données de Dell pour aider les entreprises à accélérer leurs initiatives d’IA et d’analyse. De plus, avec le data lakehouse ouvert prévu par Dell, les clients peuvent extraire des enseignements des données indépendamment de leur emplacement grâce à l’intégration du logiciel analytique de Starburst aux serveurs Dell PowerEdge et aux systèmes de stockage de fichiers et en mode objet, Dell PowerScale, Dell ECS et Dell ObjectScale.