Wie können chinesische KI-Modelle mit Token „Strom“ exportieren?

Question

Autor: Black Lobster, Deep Tide TechFlow

Originaltitel: Token-Expansion: Verkaufe Chinas Strom an die ganze Welt

Im Sommer 1858 wurde ein Kupferkabel quer über den Atlantik verlegt und verband London mit New York.

Der Sinn dieser Aktion lag nie in der Geschwindigkeit der Übertragung, sondern in der Machtstruktur: Wer das Kabel verlegt, kann im Informationsfluss profitieren. Das British Empire nutzte dieses globale Telegrafennetz, um Kolonialinformationen, Baumwollpreise und Kriegsmeldungen zu kontrollieren.

Das Empire war nicht nur durch seine Flotte stark, sondern auch durch dieses Kabel.

Über 160 Jahre später wiederholt sich dieses Prinzip auf eine unerwartete Weise.

2026 frisst sich Chinas große Modelle still und heimlich in den globalen Entwicklermarkt. Laut den neuesten Daten von OpenRouter verbrauchen die Top-10-Modelle auf der Plattform 61 % der Token, die chinesischen Modelle dominieren die Top 3. Entwickler in San Francisco, Berlin und Singapur senden täglich API-Anfragen, die durch transozeanische Glasfaserkabel nach China gelangen. Die Rechenleistung und der Strom fließen dort, die Ergebnisse werden zurückgesendet.

Der Strom verlässt nie das chinesische Netz, doch sein Wert wird durch Token grenzüberschreitend übertragen.

Große KI-Modell-Migration

Am 24. Februar 2026 veröffentlichte OpenRouter wöchentliche Daten: Die Top-10-Modelle verbrauchen insgesamt etwa 8,7 Billionen Token, davon entfallen 5,3 Billionen auf chinesische Modelle – 61 %. MiniMax M2.5 führt mit 2,45 Billionen Token, gefolgt von Kimi K2.5 und Zhipu GLM-5, alle aus China.

Aktuelle Daten vom 26. Februar

Dies ist kein Zufall, sondern ein Auslöser, der alles in Brand setzt.

Anfang des Jahres erschien OpenClaw, ein Open-Source-Tool, das KI wirklich „arbeiten“ lässt: Es kann direkt den Computer steuern, Befehle ausführen und komplexe Workflows parallel abarbeiten. Innerhalb weniger Wochen erreichte es über 210.000 Sterne auf GitHub.

Finanzexperte John installierte OpenClaw sofort und integrierte die Anthropic API. Er begann, den Aktienmarkt automatisch zu überwachen und rechtzeitig Handelssignale zu liefern. Nach einigen Stunden starrte er auf sein Kontoguthaben – nur noch ein paar Dollar.

Das ist die neue Realität, die OpenClaw schafft. Früher kostete ein Gespräch mit KI nur wenige Token, die Gebühren waren vernachlässigbar. Nach der Integration läuft die KI im Hintergrund mit mehreren Subaufgaben, ruft ständig Kontextinformationen ab und wiederholt Berechnungen – der Token-Verbrauch wächst exponentiell. Die Rechnung steigt wie ein Auto mit offenem Motor, das immer schneller wird, während der Tank leerer wird.

In Entwicklergemeinschaften kursiert ein „Geheimtipp“: Mit OAuth-Tokens kann man Abonnements bei Anthropic oder Google direkt an OpenClaw anbinden und so die monatlichen Flatrates in kostenlose Treibstoffe für KI-Agenten verwandeln – eine beliebte Methode.

Offizielle Gegenmaßnahmen folgten rasch.

Am 19. Februar aktualisierte Anthropic die Nutzungsbedingungen und verbot ausdrücklich die Verwendung von Claude-Abonnementnachweisen in Drittanbieter-Tools wie OpenClaw. Für den Zugriff auf Claude-Funktionen müsse man API-Gebühren zahlen. Google sperrte großflächig Abonnements, die OpenClaw für den Zugang zu Antigravity und Gemini AI Ultra nutzten.

„Die Welt leidet schon lange unter Qin“, so Jhon, und wandte sich den chinesischen Großmodellen zu.

Auf OpenRouter schneidet das chinesische Modell MiniMax M2.5 bei Software-Engineering-Aufgaben mit 80,2 % ab, Claude Opus erreicht 80,8 %. Der Unterschied ist kaum messbar. Doch der Preis ist enorm: Für eine Million Token kostet der chinesische Ansatz 0,3 USD, das französische Modell 5 USD – ein Faktor von etwa 17.

Jhon wechselte, die Workflows liefen weiter, die Kosten sanken um eine Größenordnung. Diese Migration findet weltweit gleichzeitig statt.

Chris Clark, COO von OpenRouter, erklärt: „Der Grund, warum chinesische Open-Source-Modelle so viel Marktanteil gewinnen, liegt darin, dass sie in den von US-Entwicklern genutzten Agenten-Workflows eine außergewöhnlich hohe Rolle spielen.“

Strom-Expansion

Um die Essenz der Token-Expansion zu verstehen, muss man die Kostenstruktur eines Tokens kennen.

Ein Token wirkt leicht, entspricht etwa 0,75 englischen Wörtern. Ein durchschnittliches Gespräch mit KI verbraucht nur wenige Tausend Token. Doch wenn diese Token in Billionen gezählt werden, wird die physische Realität deutlich.

Die Kosten für einen Token bestehen im Wesentlichen aus zwei Komponenten: Rechenleistung und Strom.

Rechenleistung ist die Abschreibung der GPUs. Für eine Nvidia H100, die etwa 30.000 USD kostet, entspricht die Lebensdauer bei Inferenzen den Abschreibungskosten. Der Strom ist der Treibstoff für den Betrieb des Rechenzentrums: Bei voller Auslastung verbraucht jede GPU etwa 700 Watt, plus Kühlung. Ein großes KI-Rechenzentrum kann jährlich mehrere Hundert Millionen Dollar an Stromkosten verursachen.

Stellen wir uns das physisch vor.

Ein US-Entwickler sendet eine API-Anfrage aus San Francisco. Die Daten reisen durch den transozeanischen Kabelstrang nach China, wo die GPU-Cluster arbeiten. Der Strom fließt vom chinesischen Netz zu den Chips, die Inferenzen werden durchgeführt, die Ergebnisse werden zurückgesendet. Der gesamte Vorgang dauert vielleicht nur eine oder zwei Sekunden.

Der Strom verlässt nie das chinesische Netz, doch sein Wert wird durch Token grenzüberschreitend übertragen.

Hier liegt eine magische Eigenschaft: Token haben keine physische Form, brauchen keinen Zoll, werden nicht besteuert und tauchen in keiner offiziellen Handelsstatistik auf. China exportiert enorme Rechen- und Stromdienstleistungen, ist aber in den offiziellen Handelsdaten fast unsichtbar.

Token sind eine Derivatform von Strom – Token-Expansion ist im Grunde Strom-Expansion.

Das verdankt sich auch den niedrigen Stromkosten in China: Die Gesamtkosten sind etwa 40 % niedriger als in den USA, eine physische Kostendifferenz, die leicht kopiert werden kann.

Außerdem verfügen chinesische KI-Modelle über algorithmische und „Involution“-Vorteile.

DeepSeek V3 nutzt eine MoE-Architektur, bei der nur Teile der Parameter aktiviert werden. Tests zeigen, dass die Inferenzkosten etwa 36 % niedriger sind als bei GPT-4o. MiniMax M2.5 mit 229 Milliarden Parametern aktiviert nur 10 Milliarden.

Oben drauf: Branchenwettbewerb. Alibaba, ByteDance, Baidu, Tencent, MingYue An, Zhipu, MiniMax… Über ein Dutzend Firmen ringen auf derselben Spur. Die Preise sind längst unterhalb der Gewinnzone, Verluste sind Branchenstandard.

Ähnlich wie bei der chinesischen Fertigung nutzen sie die Lieferketten- und Brancheninvolutions-Vorteile, um die Token-Preise massiv zu drücken.

Vom Bitcoin zum Token

Vor der Token-Expansion gab es bereits eine Form der Strom-Expansion.

Um 2015 begannen die Betreiber der Kraftwerke in Sichuan, Yunnan und Xinjiang, ungewöhnliche Gäste zu empfangen.

Sie mieteten verlassene Fabriken, installierten unzählige Maschinen, liefen 24/7. Die Maschinen produzierten nichts, außer unaufhörlich eine mathematische Aufgabe zu lösen. Manchmal wurde daraus eine Bitcoin.

Dies war die erste Form der Strom-Expansion: Billiges Wasser- und Windstrom wurde durch Mining-Hardware in digitale Vermögenswerte umgewandelt, die weltweit gehandelt wurden. Über Börsen wurde daraus US-Dollar.

Der Strom selbst passierte keine Grenzen, doch sein Wert wurde durch Bitcoin in den globalen Markt eingespeist.

In diesen Jahren dominierte China mit über 70 % der weltweiten Bitcoin-Mining-Leistung. Chinas Wasserkraft und Kohlekraft beteiligten sich auf diese indirekte Weise an einer globalen Kapitalumverteilung.

2021 endete das abrupt. Regulierungen wurden verschärft, Miner zerstreuten sich, die Rechenleistung wanderte nach Kasachstan, Texas und Kanada.

Doch die Logik blieb bestehen: Mit dem Aufstieg der großen Modelle und ChatGPT wurde aus den Bitcoin-Minenstätten eine neue Infrastruktur für KI. Die Mining-Hardware wurde zu GPU-Rechenzentren, die produzierten Bitcoins zu Tokens. Das Stromnetz blieb gleich.

Bitcoin-Expansion und Token-Expansion sind auf fundamentaler Ebene gleich, doch Token haben heute einen höheren kommerziellen Wert.

Mining ist reine Mathematik, das Ergebnis – Bitcoin – ist ein Finanzinstrument. Sein Wert basiert auf Knappheit und Marktakzeptanz, nicht auf der reinen Rechenleistung. Rechenleistung ist kein Produktivfaktor, sondern eher ein Vertrauensmechanismus.

Große Modelle hingegen liefern echte kognitive Dienste: Code, Analysen, Übersetzungen, Kreativität. Der Wert eines Tokens ergibt sich direkt aus seinem Nutzen für den Nutzer. Sobald Entwickler-Workflows auf ein Modell angewiesen sind, steigen die Wechselkosten mit der Zeit.

Ein weiterer Unterschied: Bitcoin-Mining wurde aus China vertrieben, während Token-Expansion eine bewusste Wahl der globalen Entwickler ist.

Token-Krieg

Die 1858 verlegte Unterseekabel repräsentierten die Souveränität Großbritanniens über die Hochgeschwindigkeits-Informationsautobahn. Wer die Infrastruktur kontrolliert, bestimmt die Spielregeln.

Token-Expansion ist ebenfalls ein Krieg ohne offizielle Kriegserklärung, mit erheblichen Widerständen.

Datensouveränität ist die erste Barriere: Wenn ein US-Entwickler eine API-Anfrage durch ein chinesisches Rechenzentrum schickt, fließt die Daten physisch durch China. Für Einzelentwickler und kleine Apps ist das kein Problem. Für Unternehmen mit sensiblen Daten, Finanzinformationen oder staatlichen Anforderungen ist das eine harte Grenze. Deshalb ist die Durchdringung chinesischer Modelle im Entwickler- und Privatbereich hoch, im Unternehmenskern kaum vorhanden.

Chips-Embargo ist die zweite Barriere: China steht Exportkontrollen für Nvidia-GPUs gegenüber. MoE-Architekturen und Algorithmus-Optimierungen können diese Nachteile nur teilweise ausgleichen. Das Limit ist sichtbar.

Doch diese Hindernisse sind nur der Anfang. Größere Schlachten stehen bevor.

Token und KI-Modelle sind zu neuen strategischen Konfliktfeldern zwischen China und den USA geworden – vergleichbar mit den Halbleiter- und Internetkriegen des 20. Jahrhunderts, ja sogar mit einem älteren Bild: dem Weltraumwettlauf.

1957 schoss die Sowjetunion Sputnik ins All, die USA reagierten mit dem Apollo-Programm, investierten Milliarden, um im Weltraum nicht zu verlieren.

Der KI-Wettlauf ist erstaunlich ähnlich, doch die Intensität wird die des Raumfahrtwettbewerbs bei Weitem übertreffen. Der Weltraum ist physisch, für den Durchschnittsmenschen kaum spürbar. KI durchdringt die Wirtschaft bis in die kleinsten Kapillaren: Jede Codezeile, jeder Vertrag, jedes Regierungssystem könnte von einem großen chinesischen Modell gesteuert werden. Wer das Modell zur Standardinfrastruktur für Entwickler macht, gewinnt unbemerkt eine strukturelle Macht im globalen digitalen Ökosystem.

Genau das macht die chinesische Token-Expansion für Washington so bedrohlich.

Wenn die Code-Bibliothek, der Agenten-Workflow und die Produktlogik eines Entwicklers um ein chinesisches Modell herum aufgebaut sind, steigen die Migrationskosten exponentiell. Selbst wenn die US-Gesetzgebung restriktiv wird, werden Entwickler mit den Füßen abstimmen – so wie heute kein Programmierer GitHub aufgeben kann.

Die Token-Expansion ist vielleicht nur der Anfang eines langen Spiels. Chinesische Großmodelle haben nichts angekündigt, um alles zu revolutionieren. Sie liefern einfach günstiger Dienste an jeden Entwickler weltweit, der einen API-Key besitzt.

Dieses Mal sind es die Teams in Hangzhou, Beijing und Shanghai, die die Kabel verlegen, und die GPU-Cluster, die Tag und Nacht in einer südlichen Provinz laufen.

Der Wettkampf hat keinen Countdown. Er läuft 24 Stunden am Tag, gemessen in Token, auf jedem Entwicklerterminal.

BTC-2,39%

Original anzeigen

Wie können chinesische KI-Modelle mit Token „Strom“ exportieren?

Trendthemen

BuyTheDipOrWaitNow?

BTCTechnicalRecoveryAfterBreakdown

Hot Gate Fun

超级关天博

关天博

BAbyPunch

BAbyPunch

PUNCH

PUNCH

潘趣猴

潘趣猴

D

多彩人生

Anheften