AWS fait évoluer ses plateformes de calcul haute performance en intégrant des GPU Nvidia A100

Par

04/11/2020

Les nouvelles instances de calcul haute performance et d’apprentissage automatique d’AWS, baptisées P4, reposent sur les GPU A100 de Nvidia. Ces instances sont alimentées par les derniers processeurs Intel Cascade Lake et disposent de huit des derniers GPU Nvidia A100 Tensor Core, chacun étant connecté à tous les autres par NVLink et avec la prise en charge de Nvidia GPUDirect.

Disponibles pour l’heure seulement dans certaines régions des États-Unis, les instances P4 sont intégrées dans les grappes EC2 UltraClusters, qui peuvent supporter les charges de travail en matière d’apprentissage et de calcul intensif, comme le traitement du langage naturel, la détection et la classification des objets, l’analyse et la compréhension des scènes, l’analyse sismique, les prévisions météorologiques, la modélisation financière, etc. La prise en charge par les GPU A100 de Nvidia GPUDirect permet la mise en réseau à 400 Gb/s, la structure réseau à l’échelle du pétabit et l’accès aux services AWS tels que S3, Amazon FSx for Lustre et AWS ParallelCluster. Les clients peuvent créer à la demande des grappes EC2 UltraClusters avec 4 000 GPU ou plus.

Jusqu’à 2,5 fois plus de puissance

Avec une puissance de calcul de 2,5 PetaFLOPS en virgule flottante et 320 Go de mémoire GPU à haut débit, les instances peuvent fournir jusqu’à 2,5 fois la performance d’apprentissage profond actuelle, et jusqu’à 60 % de réduction des coûts d’apprentissage par rapport aux instances P3 introduites en 2017.

Les instances P4 comprennent 1,1 To de mémoire système et 8 To de stockage SSD basé sur NVME qui peut fournir jusqu’à 16 gigaoctets de débit en lecture par seconde. Au niveau du réseau, les clients de ces instances auront accès à quatre connexions de 100 Gb/s à un réseau dédié, à l’échelle du pétabit, non bloquant (accessible via EFA) qui a été conçu spécifiquement pour les instances P4, ainsi qu’à une bande passante EBS de 19 Gb/s pouvant supporter jusqu’à 80 K IOPS.

AWS fait évoluer ses plateformes de calcul haute performance en intégrant des GPU Nvidia A100

Jusqu’à 2,5 fois plus de puissance

Derniers articles de fond

Des entreprises développent des agents IA pour se défaire des applications...

Maliciels générés par IA : la mutation agentique de la menace cyber

Les faux acheteurs agentiques menacent la saison commerciale de fin d’année

Derniers livres blancs

7 bonnes raisons de révolutionner son infrastructure avec l’hyperconvergence

Passer de l’EDR au XDR : quand franchir le pas

Protégez vos données sensibles avec un Cloud 100% français et sécurisé

Dernières actualités

IA, ouverture, immuabilité : Veeam Data Platform v13 accélère la modernisation de...

Auchan numérise sa logistique avec des palettes connectées Smart Green Pallet...

Qualité de services mobiles, Orange domine le classement 2025 de l’Arcep

Espagne : Meta condamné à verser 479 millions d’euros pour « détournement...

Derniers Articles de fond

Des entreprises développent des agents IA pour se défaire des applications...

Maliciels générés par IA : la mutation agentique de la menace cyber

Les faux acheteurs agentiques menacent la saison commerciale de fin d’année

Dernières Actualités

IA, ouverture, immuabilité : Veeam Data Platform v13 accélère la modernisation de...

Auchan numérise sa logistique avec des palettes connectées Smart Green Pallet...

Qualité de services mobiles, Orange domine le classement 2025 de l’Arcep

Dernières Expériences

Mise en place d’une gouvernance de la donnée – Ready For...

Identifier et choisir une solution EDR/MDR – Ready For IT 2025

Tout sur l’AFCDP durant Ready For IT 2025