HappyHorse conquista anonimemente o topo do teste às cegas de vídeos AI, Alibaba TaoTian e Sand.ai são ambos suspeitos

BlockBeatNews

Segundo a monitorização de 1M AI News, um modelo anónimo chamado HappyHorse-1.0 alcançou, na semana passada, o 1.º lugar no ranking do Video Arena da plataforma de avaliação de vídeo com IA Artificial Analysis, em ambas as categorias de texto-para-vídeo e imagem-para-vídeo (sem categoria de áudio), tendo empurrado a Seedance 2.0 para a 2.ª posição. Nas categorias com áudio, a Seedance 2.0 continua ainda a liderar com uma vantagem ténue. Sem conferência de apresentação, sem blog técnico e sem identificação da empresa; até agora, ninguém o assumiu publicamente.

O ranking do Video Arena baseia-se num sistema de testes cegos com Elo: os utilizadores votam, escolhendo entre duas apresentações de vídeo geradas, sem saber a identidade dos modelos. O HappyHorse esteve em evidência durante menos tempo; com cerca de 3500 ocorrências em amostras, é menos de metade do volume da Seedance 2.0. O intervalo de confiança é mais amplo (±12-13 pontos), mas a vantagem nas categorias sem áudio (cerca de 76 pontos no texto-para-vídeo e cerca de 48 pontos no imagem-para-vídeo) continua muito acima do intervalo de erro.

Pela ordem de idiomas no site oficial (chinês e cantonês antes do inglês) e pelo trocadilho do Ano do Cavalo de 2026, “HappyHorse”, a indústria considera que o modelo é proveniente de uma equipa chinesa. Existem duas versões principais:

  1. Vários media de nicho do sector afirmam que o modelo é de uma unidade do Alibaba Taotian Group, o Future Life Laboratory, liderado pela pessoa responsável Zhang Di. Zhang Di foi anteriormente vice-presidente técnico da Kuaishou. Desde 2024, lidera o desenvolvimento de IA da Kuaishou e, em abril de 2025, publicou o “Kuaishou 2.0 Mestre”; no mesmo ano, em novembro, regressou à Alibaba.
  2. No X, o utilizador Vigo Zhao comparou pormenorizadamente e descobriu que o HappyHorse corresponde integralmente, em várias métricas de referência, ao “daVinci-MagiHuman” que a startup de vídeo com IA Sand.ai disponibilizou como código aberto este ano, em março. A estrutura do site oficial também é altamente semelhante. A Sand.ai foi fundada por Cao Yue, primeiro autor do Swin Transformer, e é referida na indústria como o “DeepSeek do sector de vídeo com IA”

O site oficial do HappyHorse mostra que o modelo tem 15 mil milhões de parâmetros, 40 camadas de um Transformer de autoatenção, usando a arquitectura Transfusion (tratando de forma unificada no mesmo modelo tanto a previsão autoregressiva do texto como a geração de difusão de áudio e vídeo). São 8 passos de inferência, com saída de vídeo 1080p com áudio sincronizado. Suporta sincronização de fala em sete idiomas: chinês, inglês, japonês, coreano, alemão, francês e cantonês. É totalmente open-source e permite utilização comercial.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.
Comentar
0/400
Nenhum comentário