Título original: Token en expansión internacional, vendiendo electricidad china al mundo entero
En el verano de 1858, un cable de cobre atravesó el fondo del Atlántico, conectando Londres y Nueva York.
El significado de este hecho nunca estuvo en la velocidad de transmisión, sino en la estructura de poder: quien instalaba el cable submarino, podía extraer agua de la corriente de información. El Imperio Británico, con su red global de telégrafos, controlaba la inteligencia de las colonias, los precios del algodón y las noticias de guerra.
La fuerza del imperio no solo residía en su flota, sino también en ese cable.
Más de ciento sesenta años después, esa lógica se está reproduciendo de una manera inesperada.
En 2026, los grandes modelos de China están silenciosamente conquistando el mercado global de desarrolladores. Datos recientes de OpenRouter muestran que el 61% del consumo de tokens en los diez principales modelos de la plataforma proviene de modelos chinos, con los tres primeros lugares completamente dominados por China. Los desarrolladores en San Francisco, Berlín y Singapur envían solicitudes API a través del cable submarino del Pacífico, llegando a los centros de datos en China, donde se consume poder de cómputo y electricidad, y los resultados regresan.
La electricidad nunca salió de la red eléctrica china, pero su valor se ha entregado transfronterizamente a través de los tokens.
La gran migración de modelos de IA
El 24 de febrero de 2026, OpenRouter publicó datos semanales: el consumo total de tokens de los diez principales modelos en la plataforma fue de aproximadamente 8.7 billones, con modelos chinos dominando con 5.3 billones, un 61%. MiniMax M2.5 lideró con 2.45 billones de tokens, seguido por Kimi K2.5 y GLM-5 de Zhitu, todos de China.
Datos del 26 de febrero
No fue casualidad; un detonante encendió todo.
A principios de año, surgió OpenClaw, una herramienta de código abierto que permite a la IA “trabajar” realmente, controlando directamente la computadora, ejecutando comandos y realizando flujos de trabajo complejos en paralelo. En pocas semanas, alcanzó más de 210,000 estrellas en GitHub.
Un profesional financiero, John, instaló OpenClaw de inmediato y conectó la API de Anthropic, comenzando a monitorear automáticamente la bolsa y reportando señales de trading. Horas después, miró su saldo y se quedó unos segundos en shock: solo unos pocos dólares, ya no estaban.
Esta es la nueva realidad que trae OpenClaw. Antes, chatear con IA costaba unos pocos tokens por conversación, sin importar. Pero ahora, con OpenClaw, la IA ejecuta varias tareas en segundo plano, llamando contextos repetidamente y haciendo iteraciones, y el consumo de tokens se vuelve exponencial. La factura se acelera como un coche con el capó abierto, el nivel de gasolina bajando sin parar.
En la comunidad de desarrolladores circula un “truco”: usar tokens OAuth para conectar directamente las cuentas de suscripción de Anthropic o Google a OpenClaw, transformando el límite mensual en combustible gratuito para el agente de IA. Muchos adoptan esta estrategia.
Las autoridades respondieron rápidamente.
El 19 de febrero, Anthropic actualizó su acuerdo, prohibiendo explícitamente usar las credenciales de suscripción de Claude en herramientas de terceros como OpenClaw, exigiendo que el acceso a Claude sea mediante API con cobro. Google también bloqueó en masa las cuentas de suscripción a Antigravity y Gemini AI Ultra conectadas a través de OpenClaw.
“El mundo ha sufrido mucho por Qin”, pensó John, y se volcó en los grandes modelos nacionales.
En OpenRouter, el modelo chino MiniMax M2.5 obtuvo un puntaje de 80.2% en tareas de ingeniería de software, frente a 80.8% de Claude Opus, una diferencia casi insignificante. Pero el precio es muy diferente: el primero cuesta 0.3 dólares por millón de tokens, el segundo 5 dólares, una diferencia de aproximadamente 17 veces.
John cambió de modelo, y su flujo de trabajo siguió funcionando, pero la factura se redujo en un orden de magnitud. Esta migración se está produciendo en todo el mundo.
El COO de OpenRouter, Chris Clark, explicó claramente que la cuota de mercado de los modelos de código abierto chinos se debe a su alta participación en los flujos de trabajo de los desarrolladores en EE. UU.
La expansión de la electricidad
Para entender la esencia de la expansión de tokens, primero hay que comprender la estructura de costos de un token.
Parece muy liviano: un token equivale aproximadamente a 0.75 palabras en inglés. Una conversación normal con IA consume solo unos pocos miles de tokens. Pero cuando estos tokens se acumulan en billones, la realidad física se vuelve pesada.
Los costos de un token se dividen en dos componentes principales: poder de cómputo y electricidad.
El poder de cómputo es la depreciación de las GPU. Comprar una Nvidia H100 cuesta unos 30,000 dólares, y su vida útil, en términos de inferencia, representa el costo de depreciación. La electricidad es el combustible que mantiene en marcha los centros de datos: cuando las GPU están a plena carga, consumen unos 700 vatios cada una, más los costos de refrigeración. Un gran centro de datos de IA puede tener una factura eléctrica que supera fácilmente cientos de millones de dólares al año.
Ahora, dibuja este proceso en un mapa.
Un desarrollador en San Francisco envía una solicitud API. Los datos viajan desde California, cruzan el Pacífico por un cable submarino, llegan a un centro de datos en China, donde las GPU trabajan, la electricidad fluye desde la red china hacia los chips, y la inferencia termina. La respuesta regresa, todo en uno o dos segundos.
La electricidad nunca salió de la red china, pero su valor se ha entregado transfronterizamente a través de los tokens.
Aquí hay una magia que ningún comercio convencional puede igualar: los tokens no tienen forma física, no pasan por aduanas, no pagan aranceles, ni siquiera están en las estadísticas comerciales oficiales. China exporta una gran cantidad de servicios de computación y electricidad, pero en los datos oficiales de comercio, casi es invisible.
Los tokens se han convertido en derivados de la electricidad; en esencia, la expansión de tokens es la expansión de la electricidad.
Esto también se debe a los bajos costos de electricidad en China, que son aproximadamente un 40% más bajos que en EE. UU., una diferencia física que los competidores pueden copiar fácilmente.
Además, los grandes modelos chinos tienen ventajas en algoritmos y en la “competencia interna”.
DeepSeek V3, con su arquitectura MoE, activa solo parte de los parámetros durante la inferencia. Pruebas independientes muestran que su costo de inferencia es aproximadamente 36 veces menor que GPT-4o. MiniMax M2.5, con 229 mil millones de parámetros, activa solo 10 mil millones en la misma escala.
En la cima de la competencia, empresas como Alibaba, ByteDance, Baidu, Tencent, Moon Shadow, Zhitu, MiniMax… más de una docena de compañías compiten en la misma carrera, y los precios han caído por debajo de los márgenes de rentabilidad, siendo común operar con pérdidas para ganar cuota de mercado.
Al analizarlo, esto es similar a la estrategia de exportación de manufactura china: aprovechar la cadena de suministro y la competencia interna para reducir drásticamente los precios de los tokens.
De Bitcoin a tokens
Antes de los tokens, hubo otra forma de expansión de electricidad.
Alrededor de 2015, los gestores de plantas hidroeléctricas en Sichuan, Yunnan y Xinjiang comenzaron a recibir visitantes extraños.
Alquilaron fábricas abandonadas, llenándolas de máquinas, y operaban 24 horas al día. Estas máquinas no producían nada, solo resolvían un problema matemático infinito, y de vez en cuando, calculaban un bitcoin.
Era la primera forma de expansión de electricidad: convertir electricidad barata de agua y viento en activos digitales que circulan globalmente, y luego vender en exchanges por dólares.
La electricidad no cruzaba fronteras, pero su valor, a través de Bitcoin, se movía en el mercado mundial.
En esos años, China representaba más del 70% de la potencia minera global de Bitcoin. La electricidad hidroeléctrica y de carbón participaba en una redistribución global de capital mediante esta vía indirecta.
Pero en 2021, todo terminó abruptamente. La regulación cayó con fuerza, los mineros se dispersaron, y la potencia de minería se trasladó a Kazajistán, Texas y Canadá.
Pero esa lógica nunca desapareció; solo esperaba una nueva forma. Cuando surgió ChatGPT y los grandes modelos comenzaron a competir, las antiguas granjas mineras se transformaron en centros de datos de IA, las máquinas de minería en GPU de cómputo, y los bitcoins en tokens. Lo que permaneció constante fue la electricidad.
La expansión de Bitcoin y la de tokens son lógicamente similares, pero hoy los tokens tienen mayor valor comercial.
Minar Bitcoin es un cálculo matemático puro, y su valor como activo financiero proviene de su escasez y consenso de mercado, sin relación con “qué se calcula”. La potencia de cómputo en sí misma no produce nada, es más bien un subproducto de un mecanismo de confianza.
La inferencia en grandes modelos, en cambio, sí produce servicios cognitivos reales: código, análisis, traducción, creatividad. El valor de los tokens proviene directamente de su utilidad para el usuario. Es una integración más profunda: si un desarrollador depende de un modelo en su flujo de trabajo, cambiarlo con el tiempo se vuelve cada vez más costoso.
Y hay una diferencia clave: la minería de Bitcoin fue expulsada de China, mientras que la expansión de tokens es una elección activa de los desarrolladores globales.
La guerra de tokens
La misma línea de cable submarino de 1858 representa la soberanía del Imperio Británico sobre la autopista de la información: quien posee la infraestructura, puede definir las reglas del juego.
La expansión de tokens también es una guerra sin declaración formal, con muchas resistencias.
La soberanía de datos es la primera barrera: una solicitud API de un desarrollador estadounidense, procesada en un centro de datos chino, implica que los datos físicamente pasan por China. Para desarrolladores individuales y aplicaciones pequeñas, esto no es un problema, pero en escenarios que involucran datos sensibles, financieros o regulatorios, es una barrera difícil. Por eso, la penetración de modelos chinos en herramientas de desarrollo y aplicaciones personales es alta, pero en sistemas empresariales críticos casi inexistente.
Las prohibiciones en chips son la segunda barrera: China enfrenta restricciones en la exportación de GPU de alta gama de Nvidia. La arquitectura MoE y las optimizaciones algorítmicas solo pueden mitigar parcialmente esta desventaja, pero el techo aún existe.
Pero estas resistencias son solo el comienzo; un campo de batalla mayor se está formando.
Los tokens y los modelos de IA ya son una nueva dimensión en la competencia estratégica entre EE. UU. y China, comparable a la era de los semiconductores o Internet del siglo XX, e incluso más cercano a una metáfora más antigua: la carrera espacial.
En 1957, la Unión Soviética lanzó Sputnik, sorprendiendo a EE. UU., que respondió con el programa Apollo, invirtiendo miles de millones de hoy en día para no quedar atrás en la carrera espacial.
La lógica de la competencia en IA es sorprendentemente similar, pero mucho más intensa. La exploración espacial es física, y la gente no la siente directamente; en cambio, la infiltración de IA en la economía es en las microvasculaturas: cada línea de código, cada contrato, cada sistema de decisión gubernamental puede estar respaldado por un modelo de un país. Quien tenga el modelo que se convierta en la infraestructura predeterminada para desarrolladores globales, tendrá una influencia estructural en la economía digital mundial.
Eso es lo que realmente inquieta a Washington respecto a la expansión de tokens china.
Cuando un desarrollador construye su repositorio, flujo de agentes y lógica de producto en torno a un API chino, el costo de migración crece exponencialmente con el tiempo. En el futuro, incluso si EE. UU. legisla para restringirlo, los desarrolladores resistirán con los pies, igual que hoy no hay programador que pueda abandonar GitHub.
La expansión actual de tokens quizás sea solo el comienzo de esta larga competencia. China no ha declarado que quiera derrocar nada; simplemente, con precios más bajos, ha llevado sus servicios a cada desarrollador con una API Key en todo el mundo.
Esta vez, quienes han tendido los cables son los ingenieros en Hangzhou, Beijing, Shanghai, y los clusters de GPU que operan día y noche en alguna provincia del sur.
No hay cuenta regresiva en esta competencia; sucede las 24 horas del día, en cada terminal de cada desarrollador, en cada token.
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
¿Cómo pueden los modelos de IA de China utilizar tokens para "exportar" electricidad?
Autor: Cangrejo negro, Deep Tide TechFlow
Título original: Token en expansión internacional, vendiendo electricidad china al mundo entero
En el verano de 1858, un cable de cobre atravesó el fondo del Atlántico, conectando Londres y Nueva York.
El significado de este hecho nunca estuvo en la velocidad de transmisión, sino en la estructura de poder: quien instalaba el cable submarino, podía extraer agua de la corriente de información. El Imperio Británico, con su red global de telégrafos, controlaba la inteligencia de las colonias, los precios del algodón y las noticias de guerra.
La fuerza del imperio no solo residía en su flota, sino también en ese cable.
Más de ciento sesenta años después, esa lógica se está reproduciendo de una manera inesperada.
En 2026, los grandes modelos de China están silenciosamente conquistando el mercado global de desarrolladores. Datos recientes de OpenRouter muestran que el 61% del consumo de tokens en los diez principales modelos de la plataforma proviene de modelos chinos, con los tres primeros lugares completamente dominados por China. Los desarrolladores en San Francisco, Berlín y Singapur envían solicitudes API a través del cable submarino del Pacífico, llegando a los centros de datos en China, donde se consume poder de cómputo y electricidad, y los resultados regresan.
La electricidad nunca salió de la red eléctrica china, pero su valor se ha entregado transfronterizamente a través de los tokens.
La gran migración de modelos de IA
El 24 de febrero de 2026, OpenRouter publicó datos semanales: el consumo total de tokens de los diez principales modelos en la plataforma fue de aproximadamente 8.7 billones, con modelos chinos dominando con 5.3 billones, un 61%. MiniMax M2.5 lideró con 2.45 billones de tokens, seguido por Kimi K2.5 y GLM-5 de Zhitu, todos de China.
Datos del 26 de febrero
No fue casualidad; un detonante encendió todo.
A principios de año, surgió OpenClaw, una herramienta de código abierto que permite a la IA “trabajar” realmente, controlando directamente la computadora, ejecutando comandos y realizando flujos de trabajo complejos en paralelo. En pocas semanas, alcanzó más de 210,000 estrellas en GitHub.
Un profesional financiero, John, instaló OpenClaw de inmediato y conectó la API de Anthropic, comenzando a monitorear automáticamente la bolsa y reportando señales de trading. Horas después, miró su saldo y se quedó unos segundos en shock: solo unos pocos dólares, ya no estaban.
Esta es la nueva realidad que trae OpenClaw. Antes, chatear con IA costaba unos pocos tokens por conversación, sin importar. Pero ahora, con OpenClaw, la IA ejecuta varias tareas en segundo plano, llamando contextos repetidamente y haciendo iteraciones, y el consumo de tokens se vuelve exponencial. La factura se acelera como un coche con el capó abierto, el nivel de gasolina bajando sin parar.
En la comunidad de desarrolladores circula un “truco”: usar tokens OAuth para conectar directamente las cuentas de suscripción de Anthropic o Google a OpenClaw, transformando el límite mensual en combustible gratuito para el agente de IA. Muchos adoptan esta estrategia.
Las autoridades respondieron rápidamente.
El 19 de febrero, Anthropic actualizó su acuerdo, prohibiendo explícitamente usar las credenciales de suscripción de Claude en herramientas de terceros como OpenClaw, exigiendo que el acceso a Claude sea mediante API con cobro. Google también bloqueó en masa las cuentas de suscripción a Antigravity y Gemini AI Ultra conectadas a través de OpenClaw.
“El mundo ha sufrido mucho por Qin”, pensó John, y se volcó en los grandes modelos nacionales.
En OpenRouter, el modelo chino MiniMax M2.5 obtuvo un puntaje de 80.2% en tareas de ingeniería de software, frente a 80.8% de Claude Opus, una diferencia casi insignificante. Pero el precio es muy diferente: el primero cuesta 0.3 dólares por millón de tokens, el segundo 5 dólares, una diferencia de aproximadamente 17 veces.
John cambió de modelo, y su flujo de trabajo siguió funcionando, pero la factura se redujo en un orden de magnitud. Esta migración se está produciendo en todo el mundo.
El COO de OpenRouter, Chris Clark, explicó claramente que la cuota de mercado de los modelos de código abierto chinos se debe a su alta participación en los flujos de trabajo de los desarrolladores en EE. UU.
La expansión de la electricidad
Para entender la esencia de la expansión de tokens, primero hay que comprender la estructura de costos de un token.
Parece muy liviano: un token equivale aproximadamente a 0.75 palabras en inglés. Una conversación normal con IA consume solo unos pocos miles de tokens. Pero cuando estos tokens se acumulan en billones, la realidad física se vuelve pesada.
Los costos de un token se dividen en dos componentes principales: poder de cómputo y electricidad.
El poder de cómputo es la depreciación de las GPU. Comprar una Nvidia H100 cuesta unos 30,000 dólares, y su vida útil, en términos de inferencia, representa el costo de depreciación. La electricidad es el combustible que mantiene en marcha los centros de datos: cuando las GPU están a plena carga, consumen unos 700 vatios cada una, más los costos de refrigeración. Un gran centro de datos de IA puede tener una factura eléctrica que supera fácilmente cientos de millones de dólares al año.
Ahora, dibuja este proceso en un mapa.
Un desarrollador en San Francisco envía una solicitud API. Los datos viajan desde California, cruzan el Pacífico por un cable submarino, llegan a un centro de datos en China, donde las GPU trabajan, la electricidad fluye desde la red china hacia los chips, y la inferencia termina. La respuesta regresa, todo en uno o dos segundos.
La electricidad nunca salió de la red china, pero su valor se ha entregado transfronterizamente a través de los tokens.
Aquí hay una magia que ningún comercio convencional puede igualar: los tokens no tienen forma física, no pasan por aduanas, no pagan aranceles, ni siquiera están en las estadísticas comerciales oficiales. China exporta una gran cantidad de servicios de computación y electricidad, pero en los datos oficiales de comercio, casi es invisible.
Los tokens se han convertido en derivados de la electricidad; en esencia, la expansión de tokens es la expansión de la electricidad.
Esto también se debe a los bajos costos de electricidad en China, que son aproximadamente un 40% más bajos que en EE. UU., una diferencia física que los competidores pueden copiar fácilmente.
Además, los grandes modelos chinos tienen ventajas en algoritmos y en la “competencia interna”.
DeepSeek V3, con su arquitectura MoE, activa solo parte de los parámetros durante la inferencia. Pruebas independientes muestran que su costo de inferencia es aproximadamente 36 veces menor que GPT-4o. MiniMax M2.5, con 229 mil millones de parámetros, activa solo 10 mil millones en la misma escala.
En la cima de la competencia, empresas como Alibaba, ByteDance, Baidu, Tencent, Moon Shadow, Zhitu, MiniMax… más de una docena de compañías compiten en la misma carrera, y los precios han caído por debajo de los márgenes de rentabilidad, siendo común operar con pérdidas para ganar cuota de mercado.
Al analizarlo, esto es similar a la estrategia de exportación de manufactura china: aprovechar la cadena de suministro y la competencia interna para reducir drásticamente los precios de los tokens.
De Bitcoin a tokens
Antes de los tokens, hubo otra forma de expansión de electricidad.
Alrededor de 2015, los gestores de plantas hidroeléctricas en Sichuan, Yunnan y Xinjiang comenzaron a recibir visitantes extraños.
Alquilaron fábricas abandonadas, llenándolas de máquinas, y operaban 24 horas al día. Estas máquinas no producían nada, solo resolvían un problema matemático infinito, y de vez en cuando, calculaban un bitcoin.
Era la primera forma de expansión de electricidad: convertir electricidad barata de agua y viento en activos digitales que circulan globalmente, y luego vender en exchanges por dólares.
La electricidad no cruzaba fronteras, pero su valor, a través de Bitcoin, se movía en el mercado mundial.
En esos años, China representaba más del 70% de la potencia minera global de Bitcoin. La electricidad hidroeléctrica y de carbón participaba en una redistribución global de capital mediante esta vía indirecta.
Pero en 2021, todo terminó abruptamente. La regulación cayó con fuerza, los mineros se dispersaron, y la potencia de minería se trasladó a Kazajistán, Texas y Canadá.
Pero esa lógica nunca desapareció; solo esperaba una nueva forma. Cuando surgió ChatGPT y los grandes modelos comenzaron a competir, las antiguas granjas mineras se transformaron en centros de datos de IA, las máquinas de minería en GPU de cómputo, y los bitcoins en tokens. Lo que permaneció constante fue la electricidad.
La expansión de Bitcoin y la de tokens son lógicamente similares, pero hoy los tokens tienen mayor valor comercial.
Minar Bitcoin es un cálculo matemático puro, y su valor como activo financiero proviene de su escasez y consenso de mercado, sin relación con “qué se calcula”. La potencia de cómputo en sí misma no produce nada, es más bien un subproducto de un mecanismo de confianza.
La inferencia en grandes modelos, en cambio, sí produce servicios cognitivos reales: código, análisis, traducción, creatividad. El valor de los tokens proviene directamente de su utilidad para el usuario. Es una integración más profunda: si un desarrollador depende de un modelo en su flujo de trabajo, cambiarlo con el tiempo se vuelve cada vez más costoso.
Y hay una diferencia clave: la minería de Bitcoin fue expulsada de China, mientras que la expansión de tokens es una elección activa de los desarrolladores globales.
La guerra de tokens
La misma línea de cable submarino de 1858 representa la soberanía del Imperio Británico sobre la autopista de la información: quien posee la infraestructura, puede definir las reglas del juego.
La expansión de tokens también es una guerra sin declaración formal, con muchas resistencias.
La soberanía de datos es la primera barrera: una solicitud API de un desarrollador estadounidense, procesada en un centro de datos chino, implica que los datos físicamente pasan por China. Para desarrolladores individuales y aplicaciones pequeñas, esto no es un problema, pero en escenarios que involucran datos sensibles, financieros o regulatorios, es una barrera difícil. Por eso, la penetración de modelos chinos en herramientas de desarrollo y aplicaciones personales es alta, pero en sistemas empresariales críticos casi inexistente.
Las prohibiciones en chips son la segunda barrera: China enfrenta restricciones en la exportación de GPU de alta gama de Nvidia. La arquitectura MoE y las optimizaciones algorítmicas solo pueden mitigar parcialmente esta desventaja, pero el techo aún existe.
Pero estas resistencias son solo el comienzo; un campo de batalla mayor se está formando.
Los tokens y los modelos de IA ya son una nueva dimensión en la competencia estratégica entre EE. UU. y China, comparable a la era de los semiconductores o Internet del siglo XX, e incluso más cercano a una metáfora más antigua: la carrera espacial.
En 1957, la Unión Soviética lanzó Sputnik, sorprendiendo a EE. UU., que respondió con el programa Apollo, invirtiendo miles de millones de hoy en día para no quedar atrás en la carrera espacial.
La lógica de la competencia en IA es sorprendentemente similar, pero mucho más intensa. La exploración espacial es física, y la gente no la siente directamente; en cambio, la infiltración de IA en la economía es en las microvasculaturas: cada línea de código, cada contrato, cada sistema de decisión gubernamental puede estar respaldado por un modelo de un país. Quien tenga el modelo que se convierta en la infraestructura predeterminada para desarrolladores globales, tendrá una influencia estructural en la economía digital mundial.
Eso es lo que realmente inquieta a Washington respecto a la expansión de tokens china.
Cuando un desarrollador construye su repositorio, flujo de agentes y lógica de producto en torno a un API chino, el costo de migración crece exponencialmente con el tiempo. En el futuro, incluso si EE. UU. legisla para restringirlo, los desarrolladores resistirán con los pies, igual que hoy no hay programador que pueda abandonar GitHub.
La expansión actual de tokens quizás sea solo el comienzo de esta larga competencia. China no ha declarado que quiera derrocar nada; simplemente, con precios más bajos, ha llevado sus servicios a cada desarrollador con una API Key en todo el mundo.
Esta vez, quienes han tendido los cables son los ingenieros en Hangzhou, Beijing, Shanghai, y los clusters de GPU que operan día y noche en alguna provincia del sur.
No hay cuenta regresiva en esta competencia; sucede las 24 horas del día, en cada terminal de cada desarrollador, en cada token.