Pagar com

USD

Visa, Mastercard, SEPA e mais

Negociação flexível e sem taxas

Cartão da Gate

Pague com criptomoedas no mundo todo

Básico

Negocie criptomoedas livremente

Amplie seu lucro com alavancagem

Convert & Auto-Invest

Trade any size with no fees and no slippage

Exposição para posições alavancadas de forma simples

Negociação pré-mercado

Negocie novos tokens pré-listagem

Avançado

Negocie on-chain com a Gate Wallet

Acesso inteligente a novos tokens on-chain

Estratégias smart e negociação automática

Siga estratégias de especialistas

Negociação CrossEx

Um único saldo de margem, compartilhado entre as plataformas

Acesse centenas de contratos perpétuos

Plataforma única para ativos tradicionais globais

Negocie opções vanilla no estilo europeu

Conta unificada

Maximize sua eficiência de capital

Negociação demo

Introdução à negociação de futuros

Prepare-se para sua negociação de futuros

Eventos de futuros

Participe de eventos e ganhe recompensas

Negociação demo

Use fundos virtuais para experimentar negociações sem riscos

Lançamento

Colete candies para ganhar airdrops

Staking rápido, ganhe novos tokens em potencial

Possua GT em hold e ganhe airdrops massivos de graça

Desbloqueie o acesso completo a IPO de ações globais

Negocie on-chain e receba airdrops

Pontos de futuros

Ganhe pontos de futuros e colete recompensas em airdrop

Investimento

Ganhe juros com tokens ociosos

Autoinvestimento

Invista automaticamente regularmente

Investimento duplo

Lucre com a volatilidade do mercado

Ganhe recompensas com stakings flexíveis

Empréstimo de criptomoedas

Penhore uma criptomoeda para pegar outra emprestado

Centro de empréstimos

Centro de empréstimos integrado

Centro de riqueza VIP

Planos premium de crescimento de patrimônio

Gestão privada de patrimônio

Alocação premium de ativos

Fundo Quantitativo

Estratégias quant de alto nível

Faça staking de criptomoedas para ganhar em produtos PoS

Alavancagem Inteligente

Alavancagem sem liquidação

Cunhagem de GUSD

Cunhe GUSD para retornos em RWA

Descubra o valor em criptografia

Análise de mercado de criptomoedas ao vivo

Converse com os traders de criptomoedas

Novidades sobre criptomoedas

Mais

Promoções

Centro de atividade

Participe de atividades e ganhe recompensas

Convide amigos para recompensas de ind.

Programa de afiliados

Ganhe recomp. de comissão exclusivas

Aumente a influência e ganhe airdrops

Atualizações na plataforma em tempo real

Artigos do setor de criptomoedas

Grandes Descontos nas Taxas

Gerenciamento de ativos

Solução completa de gerenciamento de ativos

Soluções de ativos digitais para empresas

Transferência Bancária OTC

Deposite e retire moedas fiat

Programa de corretoras

Mecanismos de grandes descontos via API

AI

Seu parceiro de IA conversacional para todas as horas

Use o Gate AI diretamente no seu aplicativo social

Gate Blue Lobster, pronto para usar

Gate for AI Agent

Infraestrutura de IA, Gate MCP, Skills e CLI

Gate Skills Hub

10K+ habilidades

Do escritório à negociação: um hub completo de habilidades para turbinar o uso da IA

Escolha inteligentemente entre mais de 30 modelos de IA, com 0% de taxas extras

Outros

Central de Ajuda

Encontre perguntas frequentes e guias de ajuda

Saiba mais sobre o investimento em criptomoedas

Cresça com os campeões

Comprovante de Reservas

Gate promete 100% de comprovação de reservas

Mantenha seus ativos seguros

2026-04-22 23:05:45

Acabei de ver que a Intel disponibilizou no Hugging Face as versões quantizadas em INT4 dos modelos de vídeo Wan 2.2 da Alibaba. Isso é bastante interessante do ponto de vista de otimização de modelos.

Basicamente, a Intel conseguiu reduzir o tamanho dos pesos de cada modelo de forma significativa. Cada peso que ocupava 2 bytes em BF16 agora ocupa apenas 0,5 bytes depois da quantização INT4. Isso significa que o tamanho total cai para aproximadamente um quarto do original. A ferramenta usada foi a AutoRound.

Os três modelos liberados são o T2V-A14B (texto para vídeo), I2V-A14B (imagem para vídeo) e TI2V-5B (entrada híbrida de texto e imagem). Os modelos A14B originais rodam em arquitetura MoE com 27 bilhões de parâmetros totais, sendo 14 bilhões ativados por etapa. Sem a quantização INT4, exigem pelo menos 80GB de VRAM por GPU só para trabalhar com resolução 720p.

O mais prático é o TI2V-5B, um modelo denso que consegue rodar 720p a 24fps em uma GPU 4090 mesmo na forma original. Imagina com a otimização INT4 aplicada.

O detalhe importante é que a Intel ainda não divulgou benchmarks completos sobre consumo de VRAM ou qualidade visual após a quantização INT4. Vai depender de verificação por terceiros mesmo. Pra quem quiser testar, a Intel aponta o branch vllm-omni como a opção de implantação, já que esses modelos não rodam no pipeline principal do vLLM.

É o tipo de otimização que torna esses modelos de vídeo muito mais acessíveis pra quem não tem hardware de ponta.

Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.

Recompensa
curtir
Comentário
Repostar
Compartilhar

Comentário

Adicionar um comentário

Adicionar um comentário

Sem comentários

Tendências
Ver projetos
#
WCTCTradingChallengeShare8MUSDT
834.22K Popularidade
#
CryptoMarketSeesVolatility
202.11K Popularidade
#
IsraelStrikesIranBTCPlunges
30.82K Popularidade
#
rsETHAttackUpdate
78.36K Popularidade
#
US-IranTalksStall
3.12K Popularidade

Marcar