Une nouvelle course aux puces est engagée avec l’IA (Intelligence Artificielle), une nouvelle ruée vers l’or pour les designers et les fondeurs de semi-conducteurs. Avec un quasi-exclus, le x86 !
Le marché des processeurs informatiques est étonnant : lorsque vous pensez que les jeux sont faits - comme la domination d’Intel sur l’univers x86 ou celle de Nvidia sur celui des processeurs graphiques – il y a toujours un trublion qui vient remettre en cause le monde monolithique des fondeurs (fabricants de puces).
Ainsi, AMD moribond dans les années 90 a refait surface en concurrent x86 face au quasi-monopolistique Intel ; tandis que ce dernier a laminé le marché des processeurs RISK, ce qui a permis à IBM de sauver la ligne Power ; ARM règne sur le monde des puces pour les mobiles ; et Nvidia s’est fait une place sur le front des calculateurs grâce aux fonctionnalités de parallélisation de ses composants graphiques (GPU).
Mais voici qu’émerge une vague colossale qui pourrait bien une nouvelle fois changer la donne dans le monde des puces informatiques : l’IA (Intelligence Artificielle) et ses déclinaisons Machine Learning et Deep Learning. Et cette vague, il n’est pas un concepteur ou un fabricant de processeurs et de puces informatiques qui veut la rater… L’avenir de l’IA serait-il dans silicium ?
L’inadaptation des puces existantes
Cela n’a rien de nouveau, l’évolution exponentielle du nombre de composants intégrés dans un processeur de quelques centimètres au carré a permis d’ajouter régulièrement à la fois de la mémoire interne et des fonctionnalités. Ces dernières ajoutent de la performance ‘mécanique’ aux processeurs. Si une fonction est présente sur une puce, c’est autant que le logiciel n’a pas à traiter.
Seulement, la technologie des semi-conducteurs dans les processeurs commence à dater, d’au moins une quarantaine d’années pour le x86 par exemple, et leur mode de fonctionnement n’est pas adapté aux nouveaux usages, en particulier l’IA. Celle-ci reposant principalement sur l’exécution d’algorithmes de calcul, lorsqu’une tâche sur un processeur x86 prend 12 étapes, ce sont 11 de trop ! Idem sur un GPU, même avec la parallélisation qui permet de démultiplier les calculs en simultané, les 3 étapes du GPU en font encore 2 de trop !
Certes, cela ne signifie pas que les puces classiques ne peuvent pas faire tourner de l’IA, simplement elles ne sont pas adaptées à cet usage, et donc à la ‘mécanisation’ de l’IA au travers du silicium dans le matériel. La puce A11 d’Apple, qui équipe les iPhone de dernière génération, intègre dans le silicium des fonctionnalités de Machine Learning, mais elle reste un processeur ‘classique’, ce qui en fait une puce hybride qui fait bien mais loin de ce que l’on pourrait attendre d'une puce spécialisée.
La taille du problème
Autre phénomène concernant l’IA, elle se répand dans de nombreux domaines qui restent bien loins de l’informatique, et donc ne nécessitent pas d’embarquer un ordinateur classique. C’est le cas par exemple de l’IoT et des objets connectés, qui ont pour certains besoins de réaliser des analyses sur des algorithmes, mais avec des puces plus réduite, en taille (et encore!) mais surtout en prix.
C’est le cas également dans les véhicules, en particulier les voitures autonomes, qui embarquent de l’IA mais qui ont surtout besoin de puces spécialisées pour des actions également spécialisées. Ce n’est pas pour rien qu’Elon Musk, le CEO de Tesla, a recruté Jim Keller, ancien ingénieur AMD puis responsable des puces chez Apple, et lui a confié la mission de concevoir des puces pour ses automobiles.
Les usages de l’IA prennent de multitudes de formes – par exemple la reconnaissance d’image, la reconnaissance faciale, le décryptage de la voix – sans autre limite que la capacité de concevoir les algorithmes qui les accompagnent. Autant de tâches, et pourquoi pas autant de configurations et donc de processeurs ? Sans aller jusque là, l’IA ouvre de nouvelles opportunités aux designers et aux fondeurs, sous réserve que la taille du marché spécifique à chacune de ces puces soit suffisante pour justifier de la démarche industrielle !
Pas de concurrence… avec le compute !
Voici quelques exemples de développements en cours. Nous les avons placés par ordre alphabétique. Notons cependant qu’un pan complet des projets et du marché nous échappe, la Chine ! Le gouvernement chinois a fait de l’IA une priorité, mais en dehors de la reconnaissance faciale omniprésente, comme nous avons pu le constater sur place, et de l'annonce d'un premier processeur dédié à l'IA mais qui n'a pu être testé, quid des développements en cours ? Des surprises pourraient bien venir de là bas…
- Amazon travaille sur une puce IA pour son assistant Alexa.
- Apple travaille sur un processeur IA appelé Neuronal Engine qui va alimenter Siri et FaceID.
- ARM a introduit deux nouveaux processeurs, processeur d'apprentissage machine (ML) et un processeur de détection d'objets (OD), qui se spécialisent dans la reconnaissance d'image.
- Google dispose d’une puce IA pour les réseaux de neurones appelée Tensor Processing Unit (TPU), disponible pour les applications IA sur Google Cloud Platform.
- IBM développe un processeur IA spécifique, et a pris une licence NVLink auprès de Nvidia pour de l’IA à haut débit.
- Intel est entré sur le marché de l’IA avec les rachats des startups Nervana Systems (qui équipera les prochaines puces IA Spring Crest), puis Movidius (traitement d'image).
- Microsoft prépare une puce IA pour son casque Hololens de réalité virtuelle et augmentée (VR/AR), et potentiellement d'autres appareils.
Ce qui ressort de ces projets, c’est que l’écosystème x86 ne suit pas ! Cela concerne tout autant les processeurs que les technologies qui les entourent. Par exemple, les serveurs x86 sont encore livrés avec PCIe Gen 3, la génération de réseau interne dans le chipset mise sur le marché il y a 7 ans, et qui depuis n’a pas été mise à jour alors que la Gen 4 est disponible. Concrètement, cela se traduit dans la bande passante qui ne progresse pas, mais qui pourrait doubler si elle basculait en Gen 4. Et cela se résume simplement : les technologies obsolètes (x86) restent réservées aux PC, aux serveurs et aux datacenters…
Des opportunités vraiment nouvelles
L’IA représente donc pour l’écosystème des semi-conducteurs de nouvelles opportunités, en rupture puisque ses acteurs peuvent partir d’une page quasi-blanche, pour réinventer les technos sans penser à la rétroactivité qui a toujours miné le monde du x86 et des PC et serveurs. De repenser également les plateformes IA en associant le matériel, le logiciel et les algorithmes.
Avec un autre point qui change également la donne : une partie des concepteurs de ces puces dédiées à l’IA ne les créent plus pour arroser le marché, mais pour se les réserver à leurs propres usages. C’est l’exemple des puces Apple Ax réservées aux iPhone et iPad. Ce qui est une porte entrouverte pour les bricoleurs de génie de startups qui recherchent la niche et le composant spécifique pour l’équiper, avec le secret espoir de se faire racheter par un géant…
L’IA est un nouveau marché, avec des technologies pour la plupart en devenir, et avec de nouvelles opportunités pour de nouveaux acteurs. D’ailleurs, tout le monde n’a pas encore franchi la ligne de départ, pourtant elle est déjà derrière nous. Demeure une question : combien de temps restera-t-il sur un mode dynamique et exponentiel, avant qu’une nouvelle vague le submerge, celle de la consolidation ?
Image d’entête 936732894 @ iStock hakule