La solution a pour but de simplifier le processus d’intégration de l’IA et du ML en rassemblant les capacités de déploiement et d’administration au sein d’une plateforme software defined, permettant de faciliter ces opérations. La nouvelle offre est une plateforme full-stack IA définie par logiciel et proposant des services pour aider les entreprises à dimensionner et configurer l’infrastructure matérielle et logicielle adaptée au déploiement d’un ensemble de LLM en utilisant les principaux frameworks opensource d’IA et de MLOps sur la plateforme Cloud Nutanix. Cela permet aux clients de déployer rapidement une infrastructure prête pour l’IA afin d’affiner et d’exécuter des transformateurs génératifs préentraînés (GPT), y compris des LLM.
Nutanix GPT-in-a-Box est ainsi une plateforme de services « full-stack et AI-ready » dont l’objectif est de proposer une infrastructure matérielle et logicielle software defined, adaptée au déploiement de grands modèles de langage (LLM) utilisant des frameworks d’IA et de MLOps opensource sur la Nutanix Cloud Platform.
Un environnement pour affiner les modèles LLM
La plateforme comprend Nutanix Cloud Infrastructure, le stockage Nutanix Files and Objects, l’hyperviseur Nutanix AHV et la plateforme Kubernetes avec l’accélération GPU NVIDIA, qui peut être mise à l’échelle à grande ou petite échelle. Pour sa part, Nutanix Services permet aux clients de dimensionner leur cluster et de déployer une pile technologique avec les principaux frameworks opensource de deep learning et de MLOps, un serveur d’inférence, et un ensemble de grands modèles de langage tels que Llama2, Falcon GPT, et MosaicML. Les scientifiques des données et les administrateurs ML peuvent immédiatement utiliser ces modèles avec leur choix d’applications, d’interface utilisateur de terminal améliorée ou de CLI standard.GPT-In-a-Box s’appuie sur l’expertise de Nutanix en matière d’infrastructure évolutive dans le cloud public, de datacenters et de cas d’utilisation Edge. Elle offre l’environnement pour affiner et exécuter des applications d’IA tout en gardant le contrôle sur les données.
« Alors que les clients cherchent à concevoir et à déployer des solutions d’IA générative, ils se retrouvent à lutter pour équilibrer l’expertise approfondie requise pour installer, configurer et exécuter ces charges de travail avec des préoccupations concernant la sécurité de leurs données et la protection de la propriété intellectuelle de l’entreprise, et ce, tout en contrôlant les coûts, déclare Greg Macatee, analyste de recherche principal chez IDC. Avec GPT-in-a-Box, Nutanix offre aux clients une solution clé en main et facile à utiliser pour leurs cas d’utilisation de l’IA, offrant aux entreprises qui luttent pour l’adoption de l’IA générative une voie facilitée pour le déploiement. »