Pendant des années, l'hypothèse autour de l'infrastructure de l'IA était facile à accepter. Les calculs sérieux seraient construits là où le cloud hyperscale, la densité de développeurs et le capital se trouvaientPendant des années, l'hypothèse autour de l'infrastructure de l'IA était facile à accepter. Les calculs sérieux seraient construits là où le cloud hyperscale, la densité de développeurs et le capital se trouvaient

La prochaine couche de calcul de l'IA viendra probablement de l'extérieur de la Silicon Valley

2026/05/31 00:43
Temps de lecture : 8 min
Pour tout commentaire ou toute question concernant ce contenu, veuillez nous contacter à l'adresse suivante : crypto.news@mexc.com

Pendant des années, l'hypothèse concernant l'infrastructure d'IA était facile à accepter. Les capacités de calcul sérieuses seraient construites là où le Cloud computing hyperscale, la densité de développeurs et le capital étaient déjà concentrés : la Californie, Seattle, Londres et un petit cercle de pôles technologiques établis.

Il y avait une raison pratique à cette géographie. L'entraînement et le déploiement de l'IA à grande échelle nécessitent que les centres de données, le calcul, la capacité réseau, l'énergie et une infrastructure avancée fonctionnent ensemble. Une analyse de l'OCDE note que cela a poussé les entreprises d'IA vers des services exploités par les plus grands fournisseurs de Cloud computing. Avec le temps, cette dépendance s'est durcie en concentration de marché. Au troisième trimestre 2025, Synergy Research Group a établi la part combinée d'Amazon, Microsoft et Google dans les dépenses mondiales d'infrastructure cloud d'entreprise à 63 pourcent.

AI's Next Compute Layer Is Likely to Come From Outside Silicon Valley

Cette logique semble désormais moins solide. Le calcul devient plus coûteux, plus énergivore et plus difficile d'accès en dehors d'un petit groupe de fournisseurs dominants. Les développeurs commencent à se confronter à des questions que le Cloud computing hyperscale leur permettait largement d'ignorer. D'où viendra l'énergie ? Les puces peuvent-elles être livrées dans cette juridiction ? Quelles lois s'appliquent aux données une fois qu'elles sont déplacées ?

Ces questions trouvent désormais des réponses dans des endroits différents, et la plupart d'entre eux ne se trouvent pas dans la Silicon Valley.

Ce que la rareté enseigne

Dans les marchés cloud établis, la réponse par défaut à la demande croissante en IA consiste à ajouter davantage de capacité via des contrats cloud plus importants, une construction de centres de données plus dense et une dépendance accrue à la même pile centralisée.

Cette réponse devient de plus en plus difficile à mettre à l'échelle. Les centres de données ont consommé environ 1,5 pourcent de l'électricité mondiale en 2024, suffisamment pour faire de l'énergie l'un des points de pression de l'infrastructure d'IA. L'Agence internationale de l'énergie prévoit que cette part atteigne près de 3 pourcent d'ici 2030, rendant plus difficile de considérer le calcul comme une couche cachée derrière les produits d'IA.

Dans une grande partie du monde en développement, cette pression était déjà le point de départ. Les développeurs y ont rarement eu la possibilité de considérer l'accès au calcul, à l'énergie et à la distribution comme le problème de quelqu'un d'autre ; ils ont dû en tenir compte dans leur conception. Il en résulte un schéma plus discret qui ne fait pas l'objet d'une grande attention dans la couverture de la Silicon Valley : une infrastructure d'IA sérieuse est désormais construite dans des endroits où la rareté est traitée comme un problème de conception plutôt que comme une réflexion après coup.

À quoi cela ressemble en pratique

Le schéma est le plus visible dans quatre régions.

En Inde, Yotta Data Services exploite Shakti Cloud sur plus de 16 000 GPU NVIDIA H100 et est en bonne voie de doubler ce chiffre d'ici fin 2025. Plus de la moitié de la puissance de calcul derrière la Mission IndiaAI — l'initiative gouvernementale visant à construire des modèles fondamentaux indigènes — repose sur le matériel de Yotta. En février 2026, la plateforme multilingue nationale BHASHINI a migré des hyperscalers étrangers vers Shakti Cloud, enregistrant une amélioration des performances d'environ 40 pourcent. BHASHINI assure la traduction en temps réel dans 11 langues indiennes à l'échelle de la population ; les personnes qui la gèrent avaient décidé qu'une infrastructure qu'elles ne pouvaient pas contrôler n'était pas le bon endroit où la placer.

À travers l'Afrique, Cassava Technologies, fondée par l'entrepreneur zimbabwéen Strive Masiyiwa, déploie 12 000 GPU NVIDIA dans des centres de données en Afrique du Sud, en Égypte, au Kenya, au Maroc et au Nigéria. Cassava est le premier partenaire cloud NVIDIA sur le continent ; avant ce déploiement, NVIDIA estimait qu'environ 80 de ses GPU étaient installés sur l'ensemble du continent africain. La contrainte n'était pas seulement le prix du calcul ; c'était l'absence fondamentale de silicium avancé. La réponse de Cassava est un réseau panafricain fonctionnant sur sa propre dorsale en fibre optique, conçu pour que les startups, les chercheurs et les gouvernements africains n'aient pas à transiter par l'Europe ou les États-Unis pour entraîner et déployer l'IA.

Au Brésil, le projet gouvernemental SoberanIA réserve 500 MW pour une usine d'IA souveraine dans le Piauí, entièrement alimentée par des énergies renouvelables, avec Scala Data Centers comme principal partenaire d'infrastructure. Le Brésil s'est engagé à attirer jusqu'à 370 milliards de dollars d'investissements dans les centres de données au cours de la prochaine décennie, liés aux incitations fiscales du programme REDATA pour les projets s'approvisionnant à 100 pourcent en énergie renouvelable. Environ 65 pourcent des données brésiliennes sont encore stockées à l'étranger. Le pari est que l'abondance de l'énergie hydroélectrique et solaire offre au Brésil un type de calcul que les États-Unis et la Chine doivent travailler plus dur à construire — propre par défaut, bon marché par géographie.

Les Émirats arabes unis empruntent la voie la plus coûteuse. Core42, qui fait partie du groupe G42, vend de la capacité d'inférence sur un mélange de puces NVIDIA et Qualcomm depuis Abu Dhabi, et le pays s'est engagé conjointement avec les États-Unis pour un campus d'IA de 10 miles carrés et 5 gigawatts qui devrait être partiellement opérationnel d'ici la fin de la décennie. L'argumentaire émirati est simple : les pays qui souhaitent une IA souveraine mais ne peuvent pas construire eux-mêmes la pile sous-jacente peuvent en louer une auprès d'un gouvernement ami. Le Middle East Institute décrit cela comme une stratégie délibérée d'intégration verticale — posséder les puces, l'énergie, les centres de données et les relations étrangères en un seul bloc.

Ces projets ne partagent ni une politique ni un modèle de propriété. Ce qu'ils partagent, c'est une hypothèse de départ selon laquelle l'accès au calcul, à l'énergie, aux terres et à l'approvisionnement en puces sont des problèmes de conception de premier ordre plutôt que des externalités. Cette hypothèse produit une infrastructure différente.

Pourquoi l'inférence change la carte

L'entraînement de grands modèles récompense encore les clusters denses, les budgets en capital importants et l'accès à des puces avancées. Ce travail est peu susceptible de quitter prochainement les plus grandes installations hyperscale.

L'inférence est un problème différent. Les modèles sont utilisés en continu, par des clients, des appareils, des agents et des systèmes d'entreprise. McKinsey s'attend à ce que l'inférence dépasse l'entraînement dans les centres de données d'IA d'ici 2030, représentant plus de la moitié du calcul d'IA et environ 30 à 40 pourcent de la demande totale des centres de données.

L'inférence pose des questions différentes de celles de l'entraînement. Plutôt que de savoir où le plus grand cluster peut être construit, les questions deviennent : où le calcul doit-il se situer, à quelle vitesse peut-il répondre, avec quelle fiabilité les charges de travail peuvent-elles être acheminées, et quelles lois régissent les données pendant ce processus. Ces questions ont des réponses géographiques que la concentration hyperscale ne gère pas bien, surtout pour les milliards de personnes qui ne vivent pas à une faible latence d'un centre de données américain ou européen.

Le tissu de calcul que la demande d'inférence requiert est plus large que ce que le Cloud computing hyperscale seul peut fournir. La capacité GPU distribuée, les clusters d'inférence régionaux, les clouds souverains et les néoclouds émergents dans des endroits tels que Mumbai, Nairobi, São Paulo et Abu Dhabi ne sont pas des substituts à l'hyperscale. Ils sont la couche que l'hyperscale ne peut pas servir seul.

Ce que cela signifie pour la carte

L'ancienne carte de l'infrastructure d'IA était dessinée autour des endroits où la capacité cloud était déjà concentrée. Cette carte avait du sens lorsque le calcul était considéré comme bon marché et abondant.

La prochaine carte aura l'air différente. Elle sera dessinée autour des endroits qui ont appris à construire quand le calcul était coûteux et stratégique, et où la question de savoir qui contrôle la pile n'a jamais été théorique. Les entreprises et les gouvernements qui font ce travail ne rattrapent pas leur retard sur la Silicon Valley ; ils sont arrivés au problème en premier, parce qu'ils y étaient obligés.

—-

Ilman Shazhaev est fondateur et PDG de Dizzaract, une société d'infrastructure d'IA dont le siège est à Abu Dhabi. Il est membre du panel d'experts ONU/ONUDC conseillant sur les applications de l'IA dans les économies en développement et a rédigé 46 articles scientifiques et 10 brevets d'invention enregistrés.

Commentaires
Opportunité de marché
Logo de Gensyn
Cours Gensyn(AI)
$0.02876
$0.02876$0.02876
-1.23%
USD
Graphique du prix de Gensyn (AI) en temps réel

SPACEX(PRE) Launchpad

SPACEX(PRE) LaunchpadSPACEX(PRE) Launchpad

Inscrivez-vous pour tenter un tirage gratuit

Clause de non-responsabilité : les articles republiés sur ce site proviennent de plateformes publiques et sont fournis à titre informatif uniquement. Ils ne reflètent pas nécessairement les opinions de MEXC. Tous les droits restent la propriété des auteurs d'origine. Si vous estimez qu'un contenu porte atteinte aux droits d'un tiers, veuillez contacter crypto.news@mexc.com pour demander sa suppression. MEXC ne garantit ni l'exactitude, ni l'exhaustivité, ni l'actualité des contenus, et décline toute responsabilité quant aux actions entreprises sur la base des informations fournies. Ces contenus ne constituent pas des conseils financiers, juridiques ou professionnels, et ne doivent pas être interprétés comme une recommandation ou une approbation de la part de MEXC.

SPACEX(PRE) Launchpad

SPACEX(PRE) LaunchpadSPACEX(PRE) Launchpad

Inscrivez-vous pour tenter un tirage gratuit