Les puces sur mesure des géants du cloud distancent NVIDIA en croissance

En 2026, les ASIC de Google, Amazon, Meta et Microsoft croissent trois fois plus vite que les GPU NVIDIA, marquant un tournant historique pour le marché des puces IA.

HardwareDéveloppeurs

Les puces sur mesure des géants du cloud distancent NVIDIA en croissance

Pour la première fois depuis le début de l'ère IA, les processeurs conçus en interne par les hyperscalers croissent plus vite que les GPU NVIDIA. C'est le constat que dressent les analystes du secteur ce mois de mai 2026, sur la base des chiffres de livraison du premier semestre. Un basculement qui ne remet pas en cause la domination de NVIDIA à court terme, mais dessine une trajectoire inédite.

Vue en contre-plongée d'une puce ASIC sur circuit imprimé sombre avec reflets terracotta

Des chiffres qui parlent d'eux-mêmes

Les ASIC (circuits intégrés spécifiques) des fournisseurs cloud progressent de 44,6 % en 2026, contre 16,1 % pour les GPU de NVIDIA. L'écart, proche de trois contre un, est le plus large jamais enregistré. La part de marché des ASIC dans les serveurs IA passe ainsi de 24 % en 2025 à 27,8 % cette année, tandis que celle des GPU recule de 75,9 % à 69,7 %. Les analystes de TrendForce et Techtimes s'accordent sur une projection commune : d'ici 2028, les livraisons d'ASIC dépasseront celles de GPU pour la première fois dans l'histoire du secteur.

Cette dynamique s'explique par l'orientation des budgets d'approvisionnement des hyperscalers. Google, Amazon, Meta et Microsoft sont simultanément les plus gros clients de NVIDIA et les plus actifs dans la conception de leurs propres puces. À mesure que ces puces maison atteignent leur pleine maturité de production, les allocations budgétaires dérivent vers l'interne.

Un écosystème de puces maison qui gagne en maturité

Les quatre grandes familles de puces ASIC atteignent des niveaux de performance comparables aux GPU haut de gamme sur les charges de travail d'inférence. Google déploie son TPU v7 Ironwood (4 614 TFLOPS, 192 Go HBM3e), qui représente une continuité avec la stratégie de séparation des tâches entre entraînement et inférence déjà visible avec le TPU 8. Amazon monte en cadence avec son Trainium 3 depuis le deuxième trimestre 2026. Meta a lancé le MTIA 400, qui affiche 6 pétaflops FP8. Microsoft complète le tableau avec sa puce Maia, déployée sur Azure.

Derrière ces quatre projets, un acteur unique consolide sa position : Broadcom. La firme détient environ 60 % des partenariats de conception ASIC pour l'inférence IA à l'échelle des hyperscalers. Elle a déclaré 8,4 milliards de dollars de revenus dans les semi-conducteurs IA au premier trimestre de son exercice 2026, en hausse de 106 % sur un an.

NVIDIA n'est pas inerte face à cette pression. Le Vera Rubin NVL72, entré en production début 2026, promet 50 pétaflops FP4 et une réduction du coût par token d'inférence jusqu'à dix fois par rapport à la génération Blackwell. Mais même avec cette plateforme, la part de NVIDIA dans l'inférence pourrait reculer de plus de 90 % à 20-30 % d'ici 2028 selon plusieurs cabinets d'analyse.

Ce que ça signifie pour vous

Pour les développeurs et les équipes qui consomment de l'inférence IA via le cloud, ce basculement se traduit progressivement par davantage de concurrence sur les prix. Les hyperscalers qui amortissent leurs propres puces ont intérêt à en maximiser l'utilisation, ce qui pousse les tarifs vers le bas. La diversité des architectures disponibles implique aussi une fragmentation croissante : optimiser une application pour le TPU de Google ne garantit pas les mêmes performances sur Trainium d'Amazon. Ces investissements s'inscrivent dans la vague des 700 milliards de dollars de capex annoncés par les hyperscalers en 2026, dont la majeure partie va à l'infrastructure IA. La puce ne sera bientôt plus un avantage concurrentiel externe : elle devient un actif stratégique interne.

Sources : TechTimes · Tom's Hardware · Introl Blog · Oplexa