Le marché des puces spécialisées dans l'IA est en plein essor et se segmente en plusieurs catégories en fonction des architectures, des cas d'usage et du type de déploiement. Les concepteurs de puce, les fondeurs et les fabricants travaillent sur des modèles qui leur permettent, chacun selon sa culture et le poids de son histoire, d’adresser différents cas d’usage. Comprendre cette segmentation permet aux entreprises de choisir stratégiquement le meilleur accélérateur d'IA pour leurs besoins. Ceci est vrai pour les charges de travail d’IA et d’apprentissage profond qui reposent sur les centres de données, ou les cas d’usage locaux, partiellement ou complètement indépendants des accès aux ressources dans le cloud (données et capacités de computation essentiellement).
Par exemple, les cas d’usage tels que le traitement d'images et de vidéos, la détection d'objets et la reconnaissance faciale reposent fortement sur la puissance brute des DLP comme Nvidia Tesla, le Tensor Processing Unit (TPU) de Google et le Nervana Neural Engine d'Intel, excellent dans les calculs matriciels complexes qui alimentent les réseaux neuronaux profonds. Leur conception sur mesure offre des performances inégalées pour des tâches telles que le traitement d'images et de vidéos, la reconnaissance vocale et la traduction linguistique. Leur capacité à traiter de vastes quantités de données les rend idéaux pour des applications dans la sécurité, l'imagerie médicale et les véhicules autonomes.
IDC recense trois catégories de PC IA basés sur les NPU
Par ailleurs, les puces de traitement neuronal, les NPU, sont spécifiquement conçues pour accélérer les opérations liées à l’IA dans les terminaux (PC, smartphones…). Le modèle n’est pas encore pleinement opérationnel, car ces plateformes ne sont pas optimisées pour cela, mais les NPU représentent une solution possible. C’est le cas aussi de processeurs spécialisés en IA, comme Gaudi d’Intel, qui peut être fourni sous forme de Soc enfichable dans des serveurs dans des slots PCIe. Certes, leur objectif principal est de permettre la montée en charge dans des fermes de calcul, sans avoir à modifier les plateformes d’accueil, mais il n’est pas inenvisageable à terme de les voir propulser des stations de travail.Pour l’heure, ces stations de travail dédiées à l'IA exploitent le plus souvent des GPU pour l'entraînement et des NPU pour l'inférence, offrant ainsi un équilibre entre puissance de calcul et efficacité énergétique. Ces stations sont adaptées pour les développeurs d'IA, les chercheurs et les professionnels du créatif qui nécessitent des calculs intensifs localement. C’est une première étape dans la généralisation de ces machines suralimentées.
Dans une récente publication prospective, IDC a recensé trois catégories de PC IA basés sur les NPU. IDC définit ces machines comme des ordinateurs équipés de fonctionnalités spécifiques grâce à des systèmes-sur-puce (SoC). La première catégorie de PC IA sont livrés avec un matériel IA activé. Ils comprennent un NPU offrant une performance de plus de 40 Téra Operations par seconde (TOPS), facilitant l'exécution de tâches d’IA spécifiques directement dans les applications. Qualcomm, Apple, AMD, et Intel commercialisent déjà des puces dans cette catégorie.
PC IA : de 50 millions d'unités en 2024 à plus de 167 millions en 2027
Les PC IA de prochaine génération représent la seconde catégorie. Ils embarquent un NPU avec des performances de 40–60 TOPS et un système d'exploitation orienté IA, permettant des fonctionnalités IA constantes et étendues tant dans le système d'exploitation que dans les applications. Qualcomm, AMD et Intel ont annoncé des puces à venir pour cette catégorie, avec une distribution prévue pour débuter en 2024. Microsoft prévoit de lancer des mises à jour importantes pour Windows 11 afin d'exploiter pleinement ces NPU à haute performance.Enfin, les PC IA avancés proposeront une performance NPU de > 60 TOPS. Bien que les fabricants de puces n'ont pas encore annoncé de produits correspondants, IDC s'attend à leur apparition prochaine. Ces modèles avancés seront intégrés dans les futures mises à jour.
IDC anticipe ainsi une croissance significative dans le secteur des PC intégrant l'intelligence artificielle, conçus pour gérer directement des opérations d'IA générative. Les chiffres envisagés indiquent une croissance des ventes, passant de près de 50 millions d'unités en 2024 à plus de 167 millions en 2027. D'ici à la fin de cette période, le cabinet d'étude estime que les PC IA représenteront environ 60 % du total des expéditions de PC à l'échelle mondiale.
En fin de compte, la segmentation sur le marché des puces spécialisées dans les domaines de l'intelligence artificielle reflète la diversification croissante des besoins et des applications de l’inférence et de la formation de modèles, que ce soit au sein des centres de données ou dans les stations de travail spécifiques. Cette segmentation est cruciale pour comprendre non seulement l'évolution technologique, mais aussi les différentes stratégies adoptées par les fabricants pour répondre aux exigences de performance, d'efficacité énergétique et de coût. Les entreprises doivent appréhender les spécificités de chaque technologie pour choisir l'accélérateur d'IA le plus adapté à leurs besoins.