Como é que os modelos de IA chineses usam tokens para "exportar" energia elétrica?

Autor: Black Lobster, Deep Tide TechFlow

Título original: Token saindo para o exterior, vendendo eletricidade da China ao mundo


No verão de 1858, um cabo de cobre atravessou o fundo do Atlântico, conectando Londres e Nova York.

O significado dessa ação nunca foi a velocidade de transmissão, mas a estrutura de poder: quem instalou o cabo submarino controlava o fluxo de informações e podia extrair valor dele. O Império Britânico, com sua rede global de telégrafos, tinha em mãos informações coloniais, preços de algodão, notícias de guerra.

A força do império não vinha apenas de sua frota, mas também daquele cabo.

Mais de 160 anos depois, essa lógica está sendo reproduzida de uma forma inesperada.

Em 2026, os grandes modelos chineses estão silenciosamente dominando o mercado global de desenvolvedores. Dados do OpenRouter mostram que, entre os dez principais modelos, 61% do consumo de tokens vem da China, com os três primeiros totalmente chineses. Desenvolvedores de San Francisco, Berlim, Cingapura enviam requisições API através de cabos submarinos do Pacífico, chegando aos centros de dados na China, onde o poder de processamento é consumido, a eletricidade circula, e os resultados retornam.

A eletricidade nunca saiu da rede elétrica chinesa, mas seu valor é entregue através de tokens, cruzando fronteiras.

Grande migração de modelos de IA

Em 24 de fevereiro de 2026, o OpenRouter divulgou dados semanais: o consumo total de tokens dos dez principais modelos foi de aproximadamente 8,7 trilhões, com os modelos chineses dominando com 5,3 trilhões, 61%. MiniMax M2.5 liderou com 2,45 trilhões de tokens, seguido por Kimi K2.5 e GLM-5 da Zhìpǔ, todos chineses.

Dados de 26 de fevereiro

Não foi por acaso: uma faísca acendeu tudo.

No início deste ano, surgiu o OpenClaw, uma ferramenta open source que permite que a IA realmente “faça o trabalho”, controlando computadores, executando comandos e realizando fluxos de trabalho complexos em paralelo. Em poucas semanas, tinha mais de 210 mil estrelas no GitHub.

John, um profissional financeiro, instalou o OpenClaw imediatamente, conectou à API da Anthropic, e começou a monitorar automaticamente o bolsa de valores, enviando sinais de negociação. Algumas horas depois, olhou para o saldo da conta e ficou alguns segundos em choque: dezenas de dólares, sumiram.

Essa é a nova realidade trazida pelo OpenClaw. Antes, conversar com IA custava poucos tokens por diálogo. Agora, com o OpenClaw, a IA roda várias tarefas simultaneamente, chamando contextos repetidamente, e o consumo de tokens cresce exponencialmente. As contas aceleram como um carro com o capô aberto, o combustível se esgota rapidamente, e não há como parar.

Na comunidade de desenvolvedores, circula uma “dica”: usar tokens OAuth para conectar contas de assinatura da Anthropic ou Google ao OpenClaw, transformando o limite mensal de “ilimitado” em combustível gratuito para o agente de IA — uma estratégia comum entre os desenvolvedores.

A resposta oficial veio logo depois.

Em 19 de fevereiro, a Anthropic atualizou seus termos, proibindo o uso de credenciais de assinatura do Claude em ferramentas de terceiros como o OpenClaw, exigindo o uso de API paga. A Google também bloqueou amplamente contas de assinatura conectadas ao OpenClaw para Antigravity e Gemini AI Ultra.

“Há muito tempo sofríamos com isso”, disse John, e então ele passou a usar modelos chineses.

Na OpenRouter, o modelo chinês MiniMax M2.5 obteve uma pontuação de 80,2% em tarefas de engenharia de software, enquanto o Claude Opus alcançou 80,8%. A diferença é mínima. Mas o preço é totalmente diferente: o input de um milhão de tokens custa US$0,3 no chinês, enquanto o Claude custa US$5, uma diferença de cerca de 17 vezes.

John migrou, o fluxo de trabalho continuou, e a conta diminuiu em uma ordem de magnitude. Essa migração está acontecendo globalmente.

Chris Clark, COO do OpenRouter, explica que a grande fatia de mercado dos modelos open source chineses se deve ao fato de eles serem amplamente utilizados por desenvolvedores nos EUA.

Eletrificação global

Para entender a essência do Token saindo para o exterior, é preciso compreender a estrutura de custos de um token.

Parece leve: um token equivale a cerca de 0,75 palavras em inglês. Uma conversa comum com IA consome alguns milhares de tokens. Mas, quando esses tokens se acumulam na casa de trilhões, a realidade física se torna pesada.

Os custos de um token se resumem a duas coisas: poder de processamento e eletricidade.

O poder de processamento é a depreciação das GPUs. Comprar uma Nvidia H100, que custa cerca de US$30.000, e dividir esse custo pelo número de inferências que ela realiza ao longo de sua vida útil. A eletricidade é o combustível que mantém o data center funcionando: cada GPU, sob carga máxima, consome cerca de 700 watts, além do custo de resfriamento. Um grande data center de IA pode gastar centenas de milhões de dólares por ano em energia.

Agora, imagine esse processo mapeado no mapa.

Um desenvolvedor nos EUA envia uma requisição API de São Francisco. Os dados viajam pelo cabo submarino do Pacífico até um data center na China. Os GPUs começam a trabalhar, a eletricidade flui da rede chinesa para as chips, a inferência é concluída, e o resultado volta. Todo esse processo dura talvez um ou dois segundos.

A eletricidade nunca saiu da rede chinesa, mas seu valor é entregue através de tokens, cruzando fronteiras.

Há uma magia que o comércio comum não consegue alcançar: tokens não têm forma física, não passam por alfândega, não pagam tarifas, e nem entram nas estatísticas comerciais tradicionais. A China exporta uma grande quantidade de serviços de computação e energia, mas, nos dados oficiais de comércio, quase não aparece.

Tokens tornaram-se derivados de eletricidade; a essência do Token saindo para o exterior é a eletricidade saindo.

Graças ao baixo custo de energia na China — cerca de 40% mais barato que nos EUA — essa é uma vantagem física que os concorrentes podem copiar facilmente.

Além disso, os grandes modelos chineses têm vantagens em algoritmos e na competição interna.

DeepSeek V3, com arquitetura MoE, ativa apenas parte dos parâmetros durante a inferência. Testes independentes mostram que seu custo de inferência é cerca de 36 vezes menor que o do GPT-4o. MiniMax M2.5, com 229 bilhões de parâmetros, ativa apenas 10 bilhões.

No topo da cadeia, há uma competição interna feroz: Alibaba, ByteDance, Baidu, Tencent, MingYue AnMian, Zhìpǔ, MiniMax… dezenas de empresas competindo na mesma pista, com preços já abaixo do limite de lucro razoável. Perder dinheiro virou rotina.

Essa estratégia, de usar a cadeia de suprimentos e a competição interna para reduzir preços, é semelhante à estratégia de exportação da manufatura chinesa.

De Bitcoin a tokens

Antes do Token, houve uma fase de exportação de eletricidade.

Por volta de 2015, gerentes de usinas de Sichuan, Yunnan e Xinjiang começaram a receber visitantes estranhos.

Essas pessoas alugavam fábricas abandonadas, enchiam-nas de máquinas, e operavam 24 horas por dia. Essas máquinas não produziam nada, apenas resolviam um problema matemático infinito, e, de vez em quando, mineravam um Bitcoin.

Era a primeira forma de eletricidade saindo para o exterior: usando energia hidrelétrica e eólica barata, através de mineradoras, convertendo-se em ativos digitais globais, que eram vendidos em exchanges por dólares.

A eletricidade não atravessava fronteiras, mas seu valor, via Bitcoin, circulava pelo mercado global.

Naquele período, a China respondia por mais de 70% da mineração mundial de Bitcoin. Sua energia hidrelétrica e carvão participavam de uma redistribuição global de capital de forma indireta.

Em 2021, tudo acabou abruptamente. Regulamentações severas dispersaram os mineradores, e a capacidade de mineração migrou para Cazaquistão, Texas e Canadá.

Mas a lógica permaneceu: a eletricidade, por sua vez, foi substituída por uma nova forma de exportação — o Bitcoin, e agora, os tokens.

A mineração de Bitcoin é uma operação matemática pura, cujo valor vem da escassez e do consenso de mercado. Não tem relação com o que se “calcula”. Sua produção não é produtiva, é uma consequência de um mecanismo de confiança.

Já os grandes modelos de IA são diferentes. Usam GPUs que consomem energia para fornecer serviços cognitivos reais: códigos, análises, traduções, criatividade. O valor do token vem diretamente da utilidade que oferece ao usuário. Essa é uma integração mais profunda: uma vez que um fluxo de trabalho depende de um modelo, trocar de modelo se torna cada vez mais caro com o tempo.

E há uma diferença fundamental: a mineração de Bitcoin foi expulsamente banida na China, enquanto o Token saindo para o exterior é uma escolha voluntária dos desenvolvedores globais.

A guerra dos tokens

Aquela cabos submarino de 1858 simbolizava a soberania do Império Britânico sobre a autoestrada da informação: quem controla a infraestrutura, define as regras do jogo.

O Token saindo para o exterior é uma guerra silenciosa, com resistência forte.

A soberania de dados é a primeira barreira: uma requisição API de um desenvolvedor nos EUA, processada por um data center na China, significa que os dados fisicamente passam pela China. Para desenvolvedores individuais e pequenas aplicações, isso não é um problema. Mas, em cenários envolvendo dados sensíveis de empresas, informações financeiras ou conformidade governamental, é uma questão grave. Por isso, a penetração de modelos chineses é maior em ferramentas de desenvolvimento e aplicações pessoais, enquanto sua presença em sistemas corporativos é quase inexistente.

A proibição de chips é a segunda barreira: a China enfrenta restrições à exportação de GPUs de alta performance da Nvidia. As arquiteturas MoE e as otimizações de algoritmos podem mitigar parcialmente essa desvantagem, mas o limite máximo ainda existe.

Porém, esses obstáculos são apenas o começo. Um campo de batalha maior está se formando.

Tokens e modelos de IA tornaram-se uma nova dimensão na disputa estratégica entre China e EUA, equiparando-se às guerras por semicondutores e internet do século XX, ou até mesmo a uma metáfora mais antiga: a corrida pelo espaço.

Em 1957, a União Soviética lançou o Sputnik, assustando os EUA, que responderam com o programa Apollo, investindo bilhões de hoje para vencer a corrida espacial.

A lógica da disputa de IA é surpreendentemente semelhante, mas a intensidade será muito maior. O espaço é físico, invisível ao público. A IA penetra as veias da economia: cada linha de código, cada contrato, cada sistema de decisão governamental pode estar rodando um grande modelo de um país. Quem tiver seu modelo como infraestrutura padrão para desenvolvedores globais, terá uma influência estrutural na economia digital mundial.

É exatamente isso que faz a saída de tokens da China preocupar Washington.

Quando o código, os fluxos de trabalho e a lógica de produtos de um desenvolvedor se basearem em um modelo chinês, o custo de migração aumenta exponencialmente com o tempo. Mesmo que os EUA limitem por lei, os desenvolvedores resistirão, como hoje não há programador que abandone o GitHub.

A saída de tokens hoje pode ser apenas o começo dessa longa disputa. Os grandes modelos chineses não pretendem derrubar nada, apenas oferecem serviços a preços mais baixos para qualquer desenvolvedor com uma API Key ao redor do mundo.

Desta vez, quem instalou os cabos foram os engenheiros de Hangzhou, Pequim, Xangai, e os clusters de GPUs que operam dia e noite em alguma província do sul.

Essa batalha não tem contagem regressiva. Ela acontece 24 horas por dia, em tokens, em cada terminal de desenvolvedor.

BTC-1,34%
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
0/400
Nenhum comentário
  • Fixar

Negocie cripto em qualquer lugar e a qualquer hora
qrCode
Digitalizar para transferir a aplicação Gate
Novidades
Português (Portugal)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский язык
  • Français
  • Deutsch
  • Português (Portugal)
  • ภาษาไทย
  • Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)