Les dépenses d’investissement en IA se décentralisent : une seconde vague de transformation des infrastructures technologiques est en cours

Marchés
Mis à jour: 01/07/2026 06:07

En 2026, l’investissement mondial dans les infrastructures d’IA atteint un point d’inflexion structurel décisif.

Au cours des trois dernières années, le récit central de la course à la puissance de calcul en IA s’est concentré sur un objectif unique : les hyperscalers ont massivement étendu leurs centres de données et acquis des GPU, faisant grimper les dépenses d’investissement (CapEx) à des niveaux historiques, sans réelle considération pour les coûts. En 2026, le CapEx cumulé des quatre principaux fournisseurs de cloud — Amazon, Microsoft, Google (Alphabet) et Meta — devrait atteindre 725 milliards de dollars, soit une hausse de 77 % sur un an par rapport à 410 milliards en 2025. Si l’on inclut Nvidia, Apple, Tesla et d’autres membres des « Magnificent Seven », ce chiffre approche 754,2 milliards de dollars. Gartner prévoit que les dépenses mondiales en IA atteindront 2 590 milliards de dollars en 2026, en progression de 47 % sur un an.

Cependant, la seule logique d’échelle n’est plus au cœur des préoccupations. Une transformation plus profonde s’opère : le CapEx en IA passe d’une forte concentration à une large distribution. DIGITIMES a désigné la « distribution » comme le mot-clé technologique de 2026, marquant une double mutation vers la décentralisation, tant sur le marché de l’IA que dans sa chaîne d’approvisionnement. Ce mouvement n’est pas uniquement géographique : il s’agit d’une restructuration complète des acteurs de l’investissement, des architectures techniques et des structures industrielles.

La fin de la concentration : la « facture » de 725 milliards de dollars et l’anxiété du retour sur investissement

Pour comprendre le point de départ de la distribution, il faut d’abord reconnaître le sommet de la concentration.

En 2026, les quatre principaux hyperscalers devraient investir entre 650 et 700 milliards de dollars en CapEx, soit environ 40 % du CapEx total des entreprises du Russell 1000 — le double du niveau de 2024. Voici le détail : Amazon vise environ 200 milliards de dollars, Microsoft maintient une prévision de 190 milliards, Alphabet a relevé sa projection à 175–185 milliards, et Meta prévoit un budget de 125–145 milliards.

La rapidité de ces révisions à la hausse est en soi un signal fort. En seulement six mois, les attentes du marché pour le CapEx cloud de 2026 ont bondi de près de 80 %. Barclays estime que le CapEx des grands fournisseurs de cloud atteindra 919 milliards de dollars en 2027 et environ 1 160 milliards en 2028. CreditSights estime qu’environ 75 % du CapEx des hyperscalers en 2026 — soit près de 450 milliards de dollars — seront consacrés à l’infrastructure IA.

Pourtant, cette expansion continue des investissements centralisés se heurte à la question du retour sur investissement. En juin 2026 (heure de Pékin), le cours de l’action Microsoft a chuté de près de 20 % en un mois, effaçant près de 1 300 milliards de dollars de capitalisation boursière sur les huit derniers mois. Les investisseurs scrutent le CapEx prévu de 190 milliards de dollars pour 2026 — dont environ deux tiers seront alloués à des actifs à cycle court comme les GPU et CPU, qui se déprécient rapidement et sont directement liés aux revenus à court terme. La marge brute de Microsoft Cloud a été révisée à la baisse, à 64 %, soit une diminution de 4 points sur un an. Un rapport de juin de Goldman Sachs souligne que les investissements technologiques aux États-Unis représentent désormais environ 4,9 % du PIB, dépassant le pic observé lors de la bulle Internet autour de l’an 2000.

Les rendements marginaux des investissements concentrés diminuent, offrant ainsi la motivation la plus directe pour une transition vers la distribution.

Le point d’inflexion de l’inférence : pourquoi la puissance de calcul doit devenir distribuée

La logique sous-jacente de la distribution du CapEx en IA commence par l’évolution de la structure de la demande en puissance de calcul.

Lors du GTC 2026, Jensen Huang, PDG de Nvidia, a été clair : les charges de travail d’inférence IA seront mille milliards de fois supérieures à celles de l’entraînement, inaugurant l’ère de l’inférence à grande échelle. IDC prévoit qu’en 2027, les tâches d’inférence représenteront plus de 70 % de la demande totale de calcul intelligent. TrendForce apporte plus de précisions : en 2026, la puissance de calcul dédiée à l’inférence IA devrait croître de 122 % sur un an, bien plus vite que les 56 % de croissance pour l’entraînement.

L’entraînement et l’inférence ont des exigences d’infrastructure fondamentalement différentes. L’entraînement est centralisé, à haute densité et de longue durée — il s’adapte naturellement aux centres de données hyperscale. L’inférence, en revanche, est distribuée, faible latence et très concurrente, nécessitant des réponses en temps réel. Lorsqu’un agent IA doit réaliser une inférence et retourner un résultat en quelques dizaines de millisecondes, la latence physique liée à l’envoi de données du périphérique vers un centre de données centralisé et retour devient un goulot d’étranglement insurmontable.

Les architectes d’Akamai soulignent que les scénarios de jeu exigent une latence du premier jeton inférieure à 15 millisecondes, les recommandations e-commerce environ 20 millisecondes, alors que la latence réseau entre les centres de données centralisés et les utilisateurs finaux atteint souvent plusieurs dizaines de millisecondes, rendant l’interaction en temps réel impossible. En déploiement centralisé, 1 GW de puissance de calcul nécessite 75 Tbit/s de bande passante sortante (Blackwell), et la prochaine génération Vera Rubin aura besoin de 135 Tbit/s ; réparti sur 20 nœuds, chacun n’a besoin que de 3,75 Tbit/s. Il s’agit d’un calcul dicté par les lois de la physique, non d’une stratégie commerciale.

Parallèlement, les interactions multimodales génèrent un trafic sortant massif, et le coût élevé et persistant de la bande passante sur le cloud public devient le « tueur invisible » de la rentabilité des activités IA. À cela s’ajoutent le durcissement des réglementations sur la localisation des données dans l’UE (RGPD), en Asie du Sud-Est et au Moyen-Orient, rendant les déploiements centralisés de moins en moins capables d’équilibrer expérience utilisateur, coûts et conformité. La puissance de calcul IA ne se limite plus au cloud central : elle évolue vers une architecture distribuée à trois niveaux — cœur, régional et périphérie.

Des quatre géants à l’ensemble de la chaîne de valeur : l’élargissement des acteurs du CapEx

La deuxième dimension de la distribution réside dans l’élargissement des participants à l’investissement.

Depuis trois ans, l’investissement dans les infrastructures IA était dominé par les quatre grands fournisseurs de cloud et Nvidia. Mais en 2026, le paysage change. Selon Zhongtai Securities, le CapEx IA cumulé des MAG7 atteindra environ 754,2 milliards de dollars en 2026, tandis que le CapEx IA domestique chinois totalisera environ 805,8 milliards de yuans (environ 110 milliards de dollars). Ensemble, le CapEx IA de la Chine et des États-Unis contribuera à hauteur de 1 007,6 milliards de yuans au PIB chinois, soit 0,68 % du PIB, et apportera environ 0,33 point de croissance. La chaîne de valeur IA a dépassé les chaînes d’investissement urbain comme principal moteur marginal de la croissance du PIB.

L’implication des entreprises s’accélère. La dernière enquête de RBC montre que les sociétés adoptent rapidement l’IA, la plupart passant de l’expérimentation à la production à grande échelle. Une enquête auprès d’entreprises japonaises révèle que 47,8 % ont atteint le déploiement complet de l’IA, avec un taux de 62,7 % pour les grandes entreprises. Si l’adoption reste limitée parmi les PME (environ 12 % au Japon), un taux de 64,7 % parmi les grandes entreprises indique que le déploiement de l’IA est passé de la preuve de concept à l’industrialisation.

La participation souveraine est également significative. Lors de l’assemblée générale des actionnaires de Nvidia en juin 2026 (heure de Pékin), Jensen Huang a révélé que près de 40 pays et régions, représentant un PIB cumulé de 50 000 milliards de dollars, construisent des « usines d’IA » reposant sur l’infrastructure Nvidia. L’investissement dans les infrastructures IA évolue d’une « affaire interne aux entreprises technologiques » à une « compétition stratégique de niveau national ».

La distribution se reflète aussi dans les structures de financement. Zhongtai Securities note que les géants américains de l’IA sont entrés dans une phase où le CapEx est tiré par l’endettement. Les hyperscalers ne comptent plus uniquement sur leur flux de trésorerie disponible, mais recourent à la dette pour amplifier leurs investissements. Ce changement implique que la soutenabilité du CapEx dépend désormais non seulement des flux de trésorerie des entreprises, mais aussi des conditions générales du marché du crédit.

La périphérie en première ligne : déploiement de l’infrastructure IA distribuée

La manifestation la plus concrète de la distribution se trouve dans le edge computing.

En 2026, l’IA en périphérie passe du concept au déploiement à grande échelle. Akamai et Nvidia ont lancé un « AI mesh » commun, transformant le réseau d’Akamai de plus de 4 400 nœuds périphériques mondiaux en une plateforme d’inférence IA distribuée. Akamai évolue ainsi de leader mondial de la distribution cloud à la plus grande plateforme d’inférence IA distribuée, ayant déjà déployé à grande échelle des GPU NVIDIA Blackwell RTX 6000 PRO dans le monde entier.

Cette transformation n’est pas isolée. En juin 2026 (heure de Pékin), la société chinoise d’intelligence périphérique Yuntian Chuangxiang a bouclé un tour de financement Série E de plus d’un milliard de yuans, mené par le China Internet Investment Fund. L’entreprise a également annoncé une évolution de « fournisseur de services d’intelligence périphérique » vers une stratégie de « maillage intelligent temps réel » à l’ère de l’AGI. Antimatter a levé 300 millions d’euros pour déployer ses 100 premiers micro-centres de données distribués Policloud en 2026. NXP a renforcé son portefeuille d’IA périphérique en acquérant Kinara, ajoutant ainsi des NPU autonomes.

IDC prévoit qu’en 2027, plus de 80 % des entreprises auront déployé une infrastructure périphérique distribuée, la construction en périphérie dépassant celle des centres de données centraux. Cela signifie que la périphérie n’est plus un simple complément du cloud computing : elle devient un élément central de l’infrastructure IA.

La logique métier de l’IA en périphérie est claire : les tâches d’inférence sont bien plus sensibles à la latence que l’entraînement, et les nœuds périphériques sont naturellement plus proches des sources de données et des utilisateurs. Pour les entreprises, les déploiements en périphérie répondent aussi aux enjeux de conformité des données (données locales), de coûts de bande passante (réduction des transmissions cloud) et de fiabilité (reprise locale après sinistre). Ces défis sont difficiles à résoudre simultanément dans une architecture centralisée, mais les architectures distribuées offrent des solutions opérationnelles.

L’ère de l’infrastructure multi-couches : un basculement structurel de la logique d’investissement

L’infrastructure IA passe d’une structure « centralisée unique » à une structure « distribuée multi-couches », avec des implications profondes pour la logique d’investissement.

Premièrement, la structure de la demande en puces évolue. L’entraînement reste dominé par les GPU Nvidia — les revenus data center de Nvidia devraient atteindre 193,7 milliards de dollars sur l’exercice 2026, en hausse de 68 % sur un an. Mais la demande diversifiée en inférence ouvre de nouveaux marchés pour les ASIC et puces périphériques. Les institutions anticipent des livraisons d’ASIC à hauteur de 7,7 millions d’unités en 2026, captant 45 % de part de marché et dépassant les GPU pour atteindre 58 % en 2027. Broadcom pourrait détenir environ 60 % du marché des ASIC pour serveurs IA en 2027.

Deuxièmement, la répartition géographique des investissements en infrastructure évolue. Les centres de données hyperscale continuent de croître — l’investissement cumulé mondial dans les data centers devrait atteindre 1 600 milliards de dollars d’ici 2030 — mais la construction de nœuds périphériques progresse encore plus rapidement. La puissance de calcul IA ne se limite plus au cloud central, mais se répartit sur les niveaux cœur, régional et périphérique.

Troisièmement, le cycle de retour sur investissement change. Les investissements dans les data centers centralisés sont intensifs en capital avec des périodes d’amortissement longues, souvent de plusieurs années. Les déploiements IA en périphérie sont généralement plus petits, plus rapides à mettre en œuvre et plus proches des cas d’usage métier, permettant une évaluation plus fine des retours. Cette différence modifie la logique de valorisation sur les marchés financiers pour l’IA — passant de « qui dépense le plus » à « qui dépense le plus efficacement ».

Selon Research and Markets, le marché mondial de l’infrastructure IA passera de 71,88 milliards de dollars en 2025 à 90,91 milliards en 2026. Mais ce chiffre ne couvre que le segment matériel restreint. Si l’on inclut les déploiements IA en entreprise, le edge computing et les solutions sectorielles, l’ampleur du CapEx IA distribué dépasse largement ce montant.

Risques et contraintes : la route vers la distribution n’est pas linéaire

La tendance à la distribution du CapEx IA est claire, mais non exempte de contraintes.

Les goulets d’étranglement côté offre restent aigus. La série Blackwell de Nvidia est en pénurie, la demande dépassant l’offre depuis plusieurs trimestres. Des composants clés comme la HBM ont été réservés par les grands clients jusqu’en 2026, voire 2027. Bernstein Research note que la hausse des prix de la HBM à elle seule pourrait augmenter le CapEx IA des hyperscalers d’environ 30 %.

L’infrastructure énergétique constitue une autre contrainte majeure. La demande en électricité des data centers IA pousse les réseaux existants à leurs limites. Raccorder un cluster centralisé de 1 GW au réseau est en soi un projet de plusieurs années. Si les architectures distribuées réduisent la consommation électrique par nœud, elles imposent de nouvelles exigences aux capacités d’accès distribué du réseau.

Le risque géopolitique est également important. Les contrôles américains sur l’exportation de puces IA avancées continuent d’impacter la chaîne d’approvisionnement mondiale. Le rapport du T1 de l’exercice 2027 de Nvidia exclut explicitement les revenus issus des activités data center en Chine. Malgré la forte interdépendance du CapEx IA sino-américain, l’incertitude politique accroît les tensions dans la chaîne d’approvisionnement.

Enfin, les marchés financiers se montrent de moins en moins patients face au retour sur investissement IA. Goldman Sachs souligne que la contradiction centrale de la bulle IA s’intensifie : les fondamentaux restent solides, mais le marché a déjà intégré trop de croissance future. Depuis novembre 2022, la capitalisation des entreprises liées à l’IA a bondi de 27 000 milliards de dollars, bien au-delà des 9 000 milliards estimés par les repères macroéconomiques. Si les investissements distribués ne se traduisent pas plus rapidement en revenus et profits, le sentiment de marché pourrait passer de la « remise en question de l’échelle » à la « remise en question de la logique ».

Conclusion

La distribution du CapEx IA n’est pas un rejet de la concentration, mais plutôt son complément et son prolongement.

L’entraînement nécessite toujours des centres de données hyperscale ; l’inférence migre vers la périphérie. Les géants redoublent d’efforts, tandis que les entreprises et les États rejoignent le mouvement. Les GPU restent la référence pour l’entraînement, tandis que les ASIC et puces périphériques ouvrent de nouveaux horizons. Nous entrons dans l’ère de l’infrastructure multi-couches : chaque niveau a sa fonction, et chaque acteur occupe une niche écologique distincte.

L’année 2026 marque un tournant clé dans cette transformation structurelle. DIGITIMES prévoit que la croissance du CapEx mondial du marché IA ralentira de 66 % en 2025 à 31 % en 2026, mais un ralentissement ne signifie pas stagnation. Au contraire, une croissance plus mesurée signale souvent un passage de la « croissance expansive » à la « construction raffinée ». L’infrastructure IA évolue d’un marché centralisé « winner-takes-all » vers un écosystème de « collaboration en couches ».

Pour les investisseurs, comprendre la portée de ce basculement structurel est sans doute plus important que de suivre les chiffres du CapEx du prochain trimestre. La distribution du CapEx IA redéfinit la logique d’investissement à long terme du cloud computing, de la conception de puces, de l’architecture IT d’entreprise et même de la politique industrielle nationale. La destination finale de ce changement reste inconnue, mais sa direction est désormais claire.

FAQ

Q1 : Quel est le moteur principal du CapEx IA distribué ?

La croissance explosive de la demande en inférence est le moteur central. En 2026, la puissance de calcul d’inférence IA devrait croître de 122 % sur un an, bien plus vite que les 56 % de l’entraînement. Les exigences de faible latence et de forte concurrence des tâches d’inférence révèlent les limites physiques des centres de données centralisés, rendant le recours aux nœuds périphériques inévitable. Les enjeux de conformité des données et de coûts de bande passante poussent également la puissance de calcul vers la périphérie.

Q2 : Quels sont les chiffres précis du CapEx des quatre principaux fournisseurs de cloud en 2026 ?

Amazon : environ 200 milliards de dollars ; Microsoft : environ 190 milliards ; Alphabet : 175–185 milliards ; Meta : 125–145 milliards. Le total avoisine 725 milliards de dollars, en hausse de 77 % par rapport à 2025. Environ 75 % de ce montant sera dédié à l’infrastructure liée à l’IA.

Q3 : Quel est le lien entre l’IA en périphérie et le cloud computing ?

Ils sont complémentaires, non substituables. Le cloud central gère l’entraînement des grands modèles et l’inférence complexe, tandis que les nœuds périphériques assurent la réponse en temps réel à faible latence, le prétraitement des données et la conformité locale. La puissance de calcul IA évolue vers une architecture distribuée à trois niveaux — cœur, régional et périphérie — formant un écosystème collaboratif.

Q4 : Quel est l’impact du CapEx IA distribué sur l’industrie des puces ?

L’entraînement reste dominé par les GPU Nvidia — les revenus data center devraient atteindre 193,7 milliards de dollars sur l’exercice 2026. Mais la demande en inférence ouvre de nouveaux marchés pour les ASIC et puces périphériques, avec des livraisons d’ASIC attendues à 7,7 millions d’unités en 2026 et une part supérieure à celle des GPU dès 2027. La demande en puces évolue d’un modèle « leader unique » à un paysage « multi-acteurs ».

Q5 : Combien de temps la forte croissance de l’investissement dans l’infrastructure IA peut-elle se poursuivre ?

Barclays prévoit que le CapEx des grands fournisseurs de cloud atteindra 919 milliards de dollars en 2027 et environ 1 160 milliards en 2028. La direction de Nvidia a relevé le plafond annuel du CapEx de l’industrie IA à 4 000 milliards de dollars pour 2030. Mais la croissance ralentit — de 66 % en 2025 à 31 % en 2026 — à mesure que le secteur passe de la « croissance expansive » à la « construction raffinée ».

The content herein does not constitute any offer, solicitation, or recommendation. You should always seek independent professional advice before making any investment decisions. Please note that Gate may restrict or prohibit the use of all or a portion of the Services from Restricted Locations. For more information, please read the User Agreement
Liker le contenu