Comment les modèles d'IA chinois utilisent-ils des tokens pour « exporter » de l'électricité ?

Auteur : Black Lobster, Deep Tide TechFlow

Titre original : Token à l’étranger, vendre l’électricité chinoise au monde entier


En été 1858, un câble en cuivre traversant l’Atlantique sous-marin reliait Londres et New York.

La signification de cet événement ne réside pas dans la vitesse de transmission, mais dans la structure de pouvoir : celui qui pose le câble sous-marin peut siphonner le flux d’informations. L’Empire britannique, grâce à ce réseau mondial de télégraphes, tenait dans ses mains le renseignement colonial, le prix du coton, les nouvelles de guerre.

La puissance de l’empire ne reposait pas seulement sur sa flotte, mais aussi sur ce câble.

Plus de cent soixante ans plus tard, cette logique se répète de manière inattendue.

En 2026, les grands modèles chinois commencent discrètement à dominer le marché mondial des développeurs. Selon les dernières données d’OpenRouter, 61 % de la consommation de tokens des dix principaux modèles provient de modèles chinois, dont les trois premiers sont entièrement chinois. Les requêtes API quotidiennes des développeurs de San Francisco, Berlin, Singapour traversent le câble sous-marin du Pacifique pour atteindre les centres de données en Chine, où la puissance de calcul est consommée, l’électricité circule, et le tout revient.

L’électricité n’a jamais quitté le réseau électrique chinois, mais sa valeur est livrée à l’étranger via les tokens.

Grande migration des modèles IA

Le 24 février 2026, OpenRouter publie une donnée hebdomadaire : la consommation totale de tokens des dix premiers modèles est d’environ 8,7 trillions, dont 5,3 trillions pour les modèles chinois, soit 61 %. MiniMax M2.5 domine avec 2,45 trillions de tokens, suivi de Kimi K2.5 et Zhìpǔ GLM-5, tous chinois.

Données du 26 février

Ce n’est pas une coïncidence, un déclencheur a tout mis en marche.

Au début de cette année, OpenClaw a émergé, un outil open source permettant à l’IA de réellement « travailler » : il contrôle directement l’ordinateur, exécute des commandes, et réalise en parallèle des workflows complexes. En quelques semaines, ses étoiles sur GitHub ont dépassé 210 000.

Les professionnels de la finance, comme John, ont rapidement installé OpenClaw, connecté l’API d’Anthropic, et commencé à surveiller automatiquement le marché boursier, envoyant des signaux de trading. Quelques heures plus tard, il regarde son solde : quelques dizaines de dollars, tout disparu.

C’est la nouvelle réalité apportée par OpenClaw. Avant, converser avec une IA coûtait quelques tokens pour une session, négligeable. Après l’intégration d’OpenClaw, l’IA exécute simultanément plusieurs sous-tâches en boucle, utilisant le contexte à répétition, la consommation de tokens devient exponentielle. La facture s’accélère comme une voiture sous le capot, le niveau d’essence baisse, impossible de s’arrêter.

Une astuce circule dans la communauté : utiliser un jeton OAuth pour relier directement le compte d’abonnement d’Anthropic ou de Google à OpenClaw, transformant la limite mensuelle « illimitée » en carburant gratuit pour l’agent IA, méthode adoptée par de nombreux développeurs.

Les contre-mesures officielles arrivent rapidement.

Le 19 février, Anthropic met à jour ses conditions, interdisant explicitement l’utilisation des abonnements Claude pour des outils tiers comme OpenClaw. Pour accéder aux fonctionnalités de Claude, il faut passer par le canal de facturation API. Google a également massivement bloqué les comptes d’abonnement via OpenClaw pour accéder à Antigravity et Gemini AI Ultra.

« Le monde souffre depuis longtemps de Qin », dit John, qui s’est tourné vers les grands modèles nationaux.

Sur OpenRouter, le modèle chinois MiniMax M2.5 obtient un score de 80,2 % en tâches d’ingénierie logicielle, contre 80,8 % pour Claude Opus, la différence est minime. Mais le prix est radicalement différent : 0,3 dollar par million de tokens pour le premier, 5 dollars pour le second, soit un écart d’environ 17 fois.

John a changé, le workflow continue, mais la facture a diminué d’un ordre de grandeur. Cette migration se produit partout dans le monde.

Chris Clark, COO d’OpenRouter, explique simplement : la part de marché massive des modèles open source chinois s’explique par leur utilisation exceptionnelle dans les workflows d’agents des développeurs américains.

L’exportation d’électricité

Pour comprendre l’essence de l’exportation de tokens, il faut d’abord saisir la structure de coût d’un token.

Il paraît léger : un token équivaut à environ 0,75 mot anglais. Une conversation ordinaire avec une IA consomme quelques milliers de tokens. Mais quand ces tokens s’accumulent en trillions, la réalité physique devient lourde.

Les coûts de token se décomposent en deux éléments principaux : la puissance de calcul et l’électricité.

La puissance de calcul correspond à l’amortissement des GPU. Acheter une H100 de Nvidia coûte environ 30 000 dollars, sa durée de vie en inférence correspond à l’amortissement. L’électricité est le carburant du centre de données : à pleine charge, chaque GPU consomme environ 700 watts, plus le refroidissement. La facture électrique annuelle d’un grand centre IA peut facilement dépasser plusieurs centaines de millions de dollars.

Dessinez cette réalité sur une carte.

Un développeur américain envoie une requête API depuis San Francisco. Les données traversent le câble sous-marin du Pacifique pour atteindre un centre de données en Chine. Le GPU commence à travailler, l’électricité circule depuis le réseau chinois, la déduction se fait, la réponse revient. Tout cela en une ou deux secondes.

L’électricité n’a jamais quitté le réseau chinois, mais sa valeur, via le token, est livrée à l’étranger.

Il y a une magie que le commerce traditionnel ne peut égaler : le token n’a pas de forme physique, ne passe pas par la douane, n’est pas soumis aux taxes, et n’est même pas comptabilisé dans les statistiques commerciales officielles. La Chine exporte massivement des services de puissance de calcul et d’électricité, mais dans les données commerciales officielles, c’est presque invisible.

Le token devient un dérivé de l’électricité, l’exportation de tokens est en réalité une exportation d’électricité.

Cela est facilité par le prix de l’électricité en Chine, environ 40 % inférieur à celui des États-Unis, une différence physique facilement réplicable par la concurrence.

De plus, les grands modèles IA chinois disposent aussi d’avantages en algorithmes et en « compétition interne ».

DeepSeek V3, avec son architecture MoE, n’active qu’une partie des paramètres lors de l’inférence. Des tests indépendants montrent que ses coûts sont environ 36 fois inférieurs à ceux de GPT-4o. MiniMax M2.5, avec ses 229 milliards de paramètres, n’active que 10 milliards.

Au sommet, la compétition interne : Alibaba, ByteDance, Baidu, Tencent, Moon Shadow, Zhìpǔ, MiniMax… une dizaine d’entreprises se livrent une guerre de prix, les prix sont tombés bien en dessous du seuil de rentabilité, la perte est devenue la norme.

En détail, cela ressemble à l’exportation chinoise, utilisant la chaîne d’approvisionnement et la compétition interne pour faire chuter le prix du token.

De Bitcoin à Token

Avant les tokens, il y eut une autre forme d’exportation d’électricité.

Vers 2015, les gestionnaires de centrales électriques du Sichuan, du Yunnan et du Xinjiang ont commencé à accueillir des visiteurs étranges.

Ils louaient des usines abandonnées, y installaient des machines, et faisaient fonctionner 24h/24. Ces machines ne produisaient rien, sauf une seule chose : résoudre un problème mathématique infini, et parfois, en résolvant cette équation sans fin, obtenir un bitcoin.

C’était la première forme d’exportation d’électricité : utiliser l’électricité bon marché de l’eau et du vent, via le calcul de hachage des mineurs, pour échanger contre des actifs numériques mondiaux, puis les convertir en dollars sur une plateforme d’échange.

L’électricité ne traversait aucune frontière, mais sa valeur, via le bitcoin, circulait dans le marché mondial.

Pendant ces années, la puissance de calcul chinoise représentait plus de 70 % du total mondial de minage de bitcoin. L’hydroélectricité et le charbon chinois, par ce détour, participaient à une redistribution mondiale du capital.

En 2021, tout s’est arrêté brutalement. La régulation a frappé fort, les mineurs se sont dispersés, la puissance de calcul a migré vers le Kazakhstan, le Texas et le Canada.

Mais cette logique n’a jamais disparu, elle attendait simplement un nouveau support. Jusqu’à l’émergence de ChatGPT, avec ses grands modèles concurrents, les anciennes fermes de minage se sont transformées en centres de données IA, les machines en GPU de puissance, et les bitcoins en tokens. La seule constante : l’électricité.

L’exportation de bitcoin et celle de tokens sont structurellement similaires, mais aujourd’hui, le token a une valeur commerciale plus grande.

Le minage de bitcoin est une simple opération mathématique, le bitcoin produit est un actif financier, sa valeur repose sur la rareté et la confiance du marché, sans lien avec la « production » réelle. La puissance de calcul n’a pas de productivité intrinsèque, c’est plutôt un produit dérivé d’un mécanisme de confiance.

Les grands modèles d’IA, eux, produisent une véritable prestation cognitive : code, analyses, traductions, créations. La valeur du token provient directement de son utilité pour l’utilisateur. C’est une intégration plus profonde : si le workflow d’un développeur dépend d’un modèle, le coût de changement augmente avec le temps.

Une différence clé : le minage de bitcoin a été expulsé de Chine, tandis que l’exportation de tokens est une décision volontaire des développeurs mondiaux.

Guerre des tokens

La première ligne de câble sous-marin, posée en 1858, représentait la souveraineté de l’Empire britannique sur l’autoroute de l’information. Qui possède l’infrastructure, peut définir les règles du jeu.

L’exportation de tokens est aussi une guerre sans déclaration officielle, avec de nombreux obstacles.

La souveraineté des données est le premier mur : une requête API d’un développeur américain traitée par un centre de données chinois voit ses données physiquement transiter par la Chine. Pour un développeur individuel ou une petite application, ce n’est pas un problème. Mais pour des données sensibles d’entreprise, financières ou gouvernementales, c’est une faiblesse. C’est pourquoi la pénétration des modèles chinois est forte dans les outils de développement et applications personnelles, mais quasi inexistante dans les systèmes centraux des entreprises.

Les interdictions sur les puces constituent le deuxième mur : la Chine fait face à des restrictions à l’exportation de GPU haut de gamme Nvidia. Les architectures MoE et les optimisations algorithmiques ne peuvent qu’atténuer partiellement cette faiblesse, mais le plafond existe toujours.

Mais ces obstacles ne sont que le début, un plus grand champ de bataille se forme.

Les tokens et les modèles IA sont devenus une nouvelle dimension stratégique dans la compétition sino-américaine, comparable à celle des semi-conducteurs ou d’Internet au XXe siècle, voire plus ancienne : la course à l’espace.

En 1957, l’URSS lança Spoutnik 1, provoquant un choc aux États-Unis. Rapidement, le programme Apollo fut lancé, mobilisant des ressources équivalentes à plusieurs milliers de milliards de dollars actuels, pour ne pas perdre la course spatiale.

La logique de la compétition IA est étonnamment similaire, mais son intensité dépasse largement celle de la course spatiale. L’espace est une dimension physique, invisible pour le grand public. L’IA infiltre les vaisseaux sanguins de l’économie : chaque ligne de code, chaque contrat, chaque système décisionnel gouvernemental peut contenir un grand modèle d’un pays. Celui dont le modèle devient l’option par défaut pour les développeurs mondiaux détient une influence structurelle sur l’économie numérique globale.

C’est précisément ce qui inquiète Washington face à l’expansion des tokens chinois.

Quand la bibliothèque de code, le workflow d’agent, la logique produit d’un développeur s’appuient sur une API chinoise, le coût de migration croît exponentiellement avec le temps. Même si la législation américaine limite ces usages, les développeurs résisteront en utilisant leurs pieds, comme ils ne peuvent aujourd’hui abandonner GitHub.

Le lancement du token n’est peut-être que le début de cette longue compétition. La Chine n’a pas revendiqué vouloir tout bouleverser, elle offre simplement ses services à moindre coût, à chaque développeur disposant d’une clé API dans le monde entier.

Cette fois, ce sont les équipes de codeurs à Hangzhou, Pékin, Shanghai, et les clusters de GPU tournant jour et nuit dans un sud du pays, qui ont posé le câble.

Ce combat n’a pas de compte à rebours, il se déroule 24h/24, chaque token étant un point de bataille, chaque terminal de développeur un champ de guerre.

BTC-1,44%
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
0/400
Aucun commentaire
  • Épingler

Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)