Tech & Sciences
Le rack serveur Nvidia NVL72, basé sur l’architecture Vera Rubin, atteint un coût matériel estimé à 7,8 millions de dollars, réservé aux hyperscalers américains et programmes souverains.

Le nouveau rack serveur d’intelligence artificielle de Nvidia, baptisé NVL72, affiche un coût matériel unitaire estimé à environ 7,8 millions de dollars, selon une analyse de Morgan Stanley. Ce tarif place cet équipement hors de portée pour quiconque en dehors des hyperscalers américains ou des programmes souverains disposant de financements conséquents. Conçu autour de l’architecture Vera Rubin de Nvidia, ce rack devrait être disponible auprès des clients dans la seconde moitié de l’année 2026.
Chaque rack NVL72 intègre 72 GPU Rubin et 36 CPU Vera. Morgan Stanley évalue le prix d’un seul GPU Rubin à environ 55 000 dollars, soit 57 % plus cher que les puces Blackwell actuellement en circulation. À eux seuls, ces GPU représentent près de 4 millions de dollars sur le total de 7,8 millions.
Le poste mémoire constitue une part majeure des coûts. Chaque GPU Rubin est équipé de 288 Go de mémoire HBM4 à haute bande passante, tandis que chaque CPU Vera est associé à 1,5 To de mémoire LPDDR5X. Au total, un rack complet embarque 20,7 To de mémoire vidéo et 54 To de mémoire système. Morgan Stanley souligne une hausse de 435 % des coûts liés à la mémoire par rapport à la génération précédente, en raison de la complexité accrue de fabrication de la HBM4 comparée à la HBM3e utilisée dans les systèmes Blackwell.
Les coûts des circuits imprimés (PCB) ont également augmenté de 233 %. La transmission des données entre les puces à des vitesses très élevées impose des tolérances de fabrication que les chaînes d’approvisionnement actuelles peinent encore à maîtriser. Nvidia établit ainsi de nouvelles normes de production à chaque génération, ce qui se reflète dans les tarifs pratiqués par les fournisseurs.
Par ailleurs, les contraintes d’approvisionnement en HBM4 sont déjà un facteur limitant. Les analystes de KeyBanc ont indiqué que ni Micron ni SK Hynix ne sont actuellement en mesure de satisfaire les objectifs de qualification et les engagements de volume, ce qui pourrait réduire la production de racks en 2026 de 12 000–14 000 unités prévues à environ 6 000.
Les principaux clients du NVL72 sont des acteurs comme AWS, Google Cloud, Microsoft Azure et CoreWeave, qui ont tous annoncé des déploiements de Rubin pour la seconde moitié de 2026. Ce segment de clientèle correspond au prix de 7,8 millions de dollars par rack. L’arrêt du centre de données Stargate UK d’OpenAI en avril 2026, invoquant des coûts énergétiques élevés et des retards réglementaires, illustre la concentration de ce marché. En effet, le prix de l’électricité au Royaume-Uni est environ 4,4 fois supérieur à celui des États-Unis, et les processus d’approbation des réseaux peuvent allonger les délais de plusieurs années.
Pour le reste des acteurs, la plateforme Rubin symbolise la direction prise par les investissements dans le matériel d’intelligence artificielle. Les GPU destinés aux consommateurs et aux stations de travail représentent une activité secondaire pour Nvidia face à l’ampleur des dépenses dans l’infrastructure. Selon les analystes de Morgan Stanley, ces coûts élevés deviennent la norme dans l’industrie, ce qui signifie que « l’IA abordable » restera une question de logiciels et de services cloud dans un avenir proche, plutôt qu’une question de matériel.


