Selon des documents internes que s’est procuré Business Insider, Amazon a mis en place une plateforme destinée à répartir le plus efficacement possible les précieux processeurs graphiques (GPU).

L’an dernier, Amazon s’est retrouvé confronté à une pénurie critique en processeurs graphiques, menaçant les développements de ses projets IA, notoirement gourmands en ressources informatiques.
Le pic de cette pénurie a été atteint en décembre. Plus de 1 000 instances AWS P5 contenant jusqu’à huit GPU Nvidia H100 manquent à l’appel. Les prévisions internes ne tablaient alors que sur une amélioration progressive courant 2025.
Le projet Greenland
L’entreprise a alors mis en place le projet Greenland : une plateforme destinée à répartir les GPU entre les équipes, dans le but de maximiser leur utilisation, et de les réaffecter en cas de sous-utilisation.
Cette plateforme est régie selon des principes stricts. Toute demande interne de GPU doit s’accompagner d’un justificatif de retour sur investissement (ROI). Ainsi, chaque projet est évalué et priorisé en fonction de critères précis : maturité de l’initiative ou encore potentiel de rentabilité par GPU.
Les GPU sont considérés comme trop précieux pour être attribués selon le principe du « premier arrivé premier servi ». Ils doivent être utilisés en priorité pour les projets les plus susceptibles de générer une croissance du cash flow à long terme.
En parallèle à ces initiatives, Amazon développe ses propres puces Trainium. Celles-ci doivent prendre le relais, avec une montée en puissance prévue pour fin 2025.
Aujourd’hui, Amazon a confirmé que ses équipes disposent d’un plein accès aux GPU via AWS : « Nous avons la capacité nécessaire pour continuer à innover, assure un porte-parole à Business Insider.
Silicon / 24 avril 2025