Token para o exterior, vendendo eletricidade chinesa para o mundo inteiro

Autor: Dragão Preto, Deep Tide TechFlow

No verão de 1858, um cabo de cobre atravessou o fundo do Atlântico, ligando Londres a Nova Iorque.

O significado desta ação nunca foi a velocidade de transmissão, mas sim a estrutura de poder: quem instalou o cabo submarino controlava o fluxo de informação. O Império Britânico, com sua rede global de telégrafos, tinha nas mãos informações coloniais, preços de algodão, notícias de guerra.

A força do império não vinha apenas de sua marinha, mas também daquele cabo.

Mais de cento e sessenta anos depois, essa lógica está a se repetir de uma forma inesperada.

Em 2026, os grandes modelos chineses estão silenciosamente a dominar o mercado global de desenvolvedores. Dados do OpenRouter mostram que, entre os dez principais modelos, 61% do consumo de tokens é de modelos chineses, com os três primeiros todos de origem chinesa. Desenvolvedores de São Francisco, Berlim, Singapura enviam pedidos API através do cabo submarino do Pacífico, chegando aos centros de dados na China, onde o poder computacional e a eletricidade fluem, e os resultados retornam.

A eletricidade nunca saiu da rede elétrica chinesa, mas seu valor é entregue através de tokens transfronteiriços.

Migração em massa de modelos de IA

Em 24 de fevereiro de 2026, o OpenRouter divulgou dados semanais: os dez principais modelos consumiram cerca de 8,7 trilhões de tokens, dos quais 5,3 trilhões eram de modelos chineses, representando 61%. O MiniMax M2.5 liderou com 2,45 trilhões de tokens, seguido pelo Kimi K2.5 e pelo GLM-5 da Zhìpǔ, todos de origem chinesa.

Dados de 26 de fevereiro

Não foi por acaso: um gatilho deu início a tudo.

No início do ano, surgiu o OpenClaw, uma ferramenta open source que permite controlar diretamente o computador, executar comandos e realizar fluxos de trabalho complexos em paralelo, com mais de 210 mil estrelas no GitHub em poucas semanas.

Profissionais de finanças, como John, instalaram o OpenClaw imediatamente, conectaram-no à API da Anthropic e começaram a monitorar automaticamente o bolsa de valores, recebendo sinais de negociação. Horas depois, olhou para o saldo da conta e ficou alguns segundos em choque: dezenas de dólares, sumiram.

Esta é a nova realidade trazida pelo OpenClaw. Antes, conversar com IA custava poucos tokens por diálogo. Com o OpenClaw, a IA executa várias tarefas simultaneamente, chamando contextos repetidamente, com consumo de tokens que cresce exponencialmente. As contas aceleram como um carro com o capô aberto, o combustível desaparecendo rapidamente, sem parar.

Na comunidade de desenvolvedores, circula uma dica: usar tokens OAuth para conectar contas de assinatura da Anthropic ou Google ao OpenClaw, transformando limites mensais de assinatura em combustível gratuito para os agentes de IA — uma estratégia comum entre os desenvolvedores.

A resposta oficial veio rapidamente.

Em 19 de fevereiro, a Anthropic atualizou seus termos, proibindo o uso de credenciais de assinatura do Claude em ferramentas de terceiros como o OpenClaw, exigindo o uso de API com cobrança. A Google também bloqueou amplamente contas de assinatura conectadas ao OpenClaw para Antigravity e Gemini AI Ultra.

“Há muito tempo o mundo sofre com Qin”, disse John, que passou a usar modelos chineses.

Na plataforma OpenRouter, o modelo chinês MiniMax M2.5 obteve uma pontuação de 80,2% em tarefas de engenharia de software, enquanto o Claude Opus atingiu 80,8%. A diferença é mínima, mas o preço é totalmente diferente: o input de um milhão de tokens custa US$0,30 no chinês, enquanto o do Claude US$5, uma diferença de cerca de 17 vezes.

John migrou, o fluxo de trabalho continuou, e a conta reduziu seu custo por um fator de 10. Essa migração ocorre globalmente.

Chris Clark, COO do OpenRouter, afirma que a razão do sucesso dos modelos open source chineses é sua alta participação nos fluxos de trabalho de desenvolvedores nos EUA.

Ele explica que para entender a saída de tokens, é preciso compreender sua estrutura de custos.

Um token parece leve: equivale a cerca de 0,75 palavras em inglês. Uma conversa comum consome alguns milhares de tokens. Mas, quando esses tokens atingem trilhões, a realidade física se torna pesada.

Os custos principais são dois: computação e eletricidade.

A computação é a depreciação das GPUs. Uma Nvidia H100, que custa cerca de US$30.000, tem uma vida útil que, dividida pelo número de inferências, resulta no custo de depreciação por uso. A eletricidade é o combustível que mantém o data center funcionando: uma GPU sob carga consome cerca de 700W, mais o custo de resfriamento. Um grande centro de IA pode gastar centenas de milhões de dólares por ano em eletricidade.

Vamos mapear esse processo.

Um desenvolvedor nos EUA faz uma requisição API de São Francisco. Os dados viajam pelo cabo submarino do Pacífico até um centro de dados na China. As GPUs processam, a eletricidade flui da rede chinesa, a inferência é concluída, e o resultado volta. Tudo isso em um ou dois segundos.

A eletricidade nunca saiu da rede chinesa, mas seu valor é entregue através de tokens, cruzando fronteiras.

Há uma peculiaridade: tokens não têm forma física, não passam por alfândega, não pagam tarifas, e nem entram nas estatísticas comerciais tradicionais. A China exporta muita capacidade de computação e serviços de eletricidade, mas na balança comercial oficial, quase que invisível.

Tokens tornaram-se derivados de eletricidade; sua saída é, na essência, uma exportação de energia.

Graças às tarifas de eletricidade relativamente baixas na China, cerca de 40% inferiores às dos EUA, esse é um custo físico facilmente replicável por concorrentes.

Além disso, os grandes modelos chineses têm vantagens em algoritmos e na “competição interna”.

DeepSeek V3, com arquitetura MoE, ativa apenas parte dos parâmetros durante a inferência. Testes independentes mostram que seu custo é cerca de 36 vezes menor que o do GPT-4o. O MiniMax M2.5, com 229 bilhões de parâmetros, ativa apenas 10 bilhões.

No topo, há a competição interna: Alibaba, ByteDance, Baidu, Tencent, Shadow of the Moon, Zhìpǔ, MiniMax… dezenas de empresas na mesma corrida, com preços já abaixo do limite de lucro, operando muitas vezes no prejuízo — uma prática comum na indústria.

Analisando, é semelhante à estratégia de exportar manufatura na China: usar a cadeia de suprimentos e a competição interna para reduzir drasticamente os preços do token.

De Bitcoin a tokens

Antes dos tokens, houve uma fase de exportação de eletricidade.

Por volta de 2015, gerentes de usinas em Sichuan, Yunnan e Xinjiang começaram a receber visitantes estranhos.

Esses visitantes alugavam fábricas abandonadas, enchiam-nas de máquinas, e operavam 24 horas por dia. Essas máquinas não produziam nada, apenas resolviam um problema matemático infinito, e, de vez em quando, mineravam um Bitcoin.

Era a primeira forma de exportação de eletricidade: usar energia hidrelétrica e eólica barata, através de mineradoras, para criar ativos digitais globais, que eram vendidos em exchanges por dólares.

A eletricidade não atravessava fronteiras, mas seu valor, via Bitcoin, circulava globalmente.

Naqueles anos, a China respondia por mais de 70% da mineração mundial de Bitcoin. Sua energia hidrelétrica e carvão participava dessa redistribuição global de capital de forma indireta.

Em 2021, tudo mudou. Regulamentações severas dispersaram os mineradores, e a capacidade de mineração migrou para Cazaquistão, Texas e Canadá.

Mas a lógica não desapareceu: ela apenas aguardava uma nova forma. Quando o ChatGPT surgiu, os grandes modelos começaram a competir, e antigas fazendas de mineração se transformaram em centros de IA, com GPUs substituindo mineradoras, e Bitcoin se tornando tokens. A eletricidade, porém, permaneceu a mesma.

Bitcoin e tokens têm uma lógica semelhante: mineração é cálculo matemático puro, e o Bitcoin é um ativo financeiro, cujo valor vem da escassez e do consenso de mercado, sem relação com “o que foi calculado”. Sua produção não é criativa, é uma consequência de confiança.

Já os grandes modelos de IA produzem serviços cognitivos reais: código, análises, traduções, criatividade. O valor do token vem da utilidade para o usuário. Essa é uma integração mais profunda: uma vez que o fluxo de trabalho de um desenvolvedor dependa de um modelo, trocar de modelo se torna cada vez mais caro com o tempo.

Outro ponto importante: a mineração de Bitcoin foi expulsa da China, enquanto a saída de tokens é uma escolha voluntária dos desenvolvedores globais.

Guerra de tokens

Aquela cablagem submarina de 1858 simbolizava a soberania do Império Britânico sobre a autoestrada da informação: quem controla a infraestrutura, define as regras do jogo.

A saída de tokens também é uma guerra silenciosa, com obstáculos.

A primeira barreira é a soberania de dados: uma requisição API de um desenvolvedor americano, processada por um data center na China, atravessa fisicamente a fronteira. Para desenvolvedores individuais e pequenas aplicações, isso não é um problema. Mas, em cenários envolvendo dados sensíveis, financeiros ou governamentais, é uma questão grave. É por isso que a penetração de modelos chineses é maior em ferramentas de desenvolvimento e aplicações pessoais, enquanto sua presença em sistemas corporativos é quase inexistente.

A segunda barreira são as restrições a chips: a China enfrenta controles de exportação de GPUs de alta performance, como as Nvidia. Arquiteturas MoE e otimizações de algoritmos podem mitigar parcialmente essa desvantagem, mas o limite ainda existe.

Porém, esses obstáculos são apenas o começo. Um campo de batalha maior está se formando.

Tokens e modelos de IA tornaram-se uma nova dimensão de disputa estratégica entre China e EUA, equiparando-se às guerras por semicondutores e internet no século XX, ou até mais: uma espécie de corrida espacial moderna.

Em 1957, a União Soviética lançou o Sputnik, assustando os EUA, que responderam com o programa Apollo, investindo bilhões de dólares para não ficarem para trás na corrida espacial.

A lógica da disputa por IA é surpreendentemente semelhante, mas a intensidade será muito maior. O espaço é físico, invisível ao público. A IA penetra as veias da economia: cada linha de código, contrato ou sistema governamental pode estar rodando um grande modelo de um país. Quem tiver seu modelo como padrão para desenvolvedores globais, terá uma influência estrutural na economia digital mundial.

É exatamente isso que faz a saída de tokens da China preocupar Washington.

Quando o código, os fluxos de trabalho e a lógica de produtos de um desenvolvedor se basearem em um modelo chinês, o custo de migração aumenta exponencialmente com o tempo. Mesmo que os EUA limitem por lei, os desenvolvedores resistirão, como hoje não há programador que abandone o GitHub.

A saída de tokens, portanto, pode ser apenas o começo dessa longa disputa. Os grandes modelos chineses não pretendem derrubar nada, apenas oferecem serviços a preços mais baixos, entregando-os a todos os desenvolvedores com API Key ao redor do mundo.

Desta vez, quem instalou a infraestrutura foram engenheiros em Hangzhou, Pequim, Xangai, e clusters de GPUs operando dia e noite em alguma província do sul.

Essa batalha não tem contagem regressiva: ela acontece 24 horas por dia, com tokens como unidades de combate, e cada terminal de desenvolvedor como palco de guerra.

BTC-2,43%
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
0/400
Sem comentários
  • Marcar

Negocie criptomoedas a qualquer hora e em qualquer lugar
qrCode
Escaneie o código para baixar o app da Gate
Comunidade
Português (Brasil)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский язык
  • Français
  • Deutsch
  • Português (Portugal)
  • ภาษาไทย
  • Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)