Amazon Web Services vient d’annoncer la disponibilité générale de son nouveau processeur de cloud computing, le Graviton4. Basé sur l’architecture Arm, ce processeur représente un bond en avant significatif en termes de puissance et d’efficacité énergétique. Conçu par Annapurna Labs, une filiale d’Amazon, il promet quatre fois les performances de son prédécesseur, Graviton1, tout en consommant 60 % d’énergie en moins, comparé à des instances EC2 similaires utilisant Graviton3.

Ce processeur est basé sur l’architecture Arm et comporte 96 cœurs Arm Neoverse V2, améliorant les instructions par cycle d’horloge (IPC) par rapport aux cœurs Neoverse V1 de Graviton3.

Il est fabriqué en utilisant la technologie de processus N4 de TSMC. Cette nouvelle génération offre une bande passante mémoire de 536,7 Go/s, soit une augmentation de 75 % par rapport aux 306 Go/s de Graviton3. Le N4 est un procédé de fabrication de semi-conducteurs, basé sur la technologie 5 nm de TSMC, mais avec des améliorations pour augmenter la densité des transistors, les performances et l’efficacité énergétique. Les cœurs N4 présentent de meilleures performances en termes de vitesse d’horloge plus élevée et de consommation d’énergie réduite par rapport aux générations précédentes.

R8g, des instances EC2 pour le Graviton4

Parallèlement à cette annonce, AWS lance de nouvelles instances EC2, les instances R8g. Construites sur le système AWS Nitro, ces instances déchargent les fonctions de virtualisation du CPU, de stockage et de réseau vers du matériel et des logiciels dédiés. Ceci afin d’améliorer les performances et la sécurité des charges de travail. Ces instances R8g proposent des tailles d’instances plus grandes, avec jusqu’à trois fois plus de vCPU (jusqu’à 48xlarge) et de mémoire (jusqu’à 1,5 To) que les instances R7g basées sur Graviton3.

Selon AWS, « ces nouvelles instances sont jusqu’à 30 % plus rapides pour les applications web, 40 % plus rapides pour les bases de données et 45 % plus rapides pour les grandes applications Java par rapport aux instances R7g ». Les instances R8g sont disponibles en 12 tailles différentes, y compris deux tailles en métal nu (bare metal). Elles offrent jusqu’à
50 Gb/s de bande passante réseau améliorée et jusqu’à 40 Gb/s de bande passante vers l’Amazon Elastic Block Store (Amazon EBS).

Le support réseau Elastic Fabric Adapter (EFA) est proposé sur les tailles 24xlarge, 48xlarge et bare metal, et le support Elastic Network Adapter (ENA) Express est disponible sur les tailles d’instance supérieures à 12xlarge. Ces instances sont actuellement disponibles dans les régions AWS suivantes : US East (N. Virginia), US East (Ohio), US West (Oregon) et Europe (Francfort).

Une solution polyvalente pour une variété de charges de travail

Grâce à des caractéristiques améliorées, l’architecture des Graviton4 dispose de capacités optimisées pour les charges de travail intensives en mémoire. Outre l’amélioration du nombre d’instructions traitées par cycle d’horloge des cœurs Neoverse V2, le système de cache repensé, notamment avec un cache L3 plus grand, améliore les performances.

Cette configuration est profitable pour les charges de travail conventionnelles (Analytique et Big Data, les applications web à haute performance…), mais pas pour le ML et l’IA. Certes, Graviton4 améliore les performances globales des modèles d’IA, grâce à une meilleure gestion des ressources, notamment du cache,​ mais il ne se positionne pas face à des architectures dédiées.

En effet, malgré ces améliorations, les processeurs Graviton4 se positionnent plutôt comme des solutions polyvalentes pour une variété de charges de travail, y compris certaines applications d’intelligence artificielle et d’apprentissage automatique. Cependant, ils ne sont pas spécifiquement conçus pour concurrencer directement les processeurs spécialisés d’AWS (Trainium et Inferentia) ni les unités de traitement concurrentes, comme les NPU et les GPU qui sont spécifiquement optimisés pour les tâches d’IA intensives.