Estado de la nueva temporada de Alpha Arena: 8 grandes modelos en el mercado de valores de EE. UU. actualmente "totalmente derrotados", Grok 4 pierde un 56% en el último lugar.
El 25 de noviembre, la nueva temporada de Alpha Arena comenzó el día 20. Hasta el momento de escribir, los 8 modelos de IA participantes han fracasado por completo. GPT-5.1 ocupa temporalmente el primer lugar con una tasa de rendimiento de -7.78%, mientras que Grok 4 se encuentra en la última posición con una tasa de rendimiento de -56%. El nuevo modelo nacional Kimi 2 tiene una tasa de rendimiento temporal de -32.8%. Los modelos de esta temporada deben participar en múltiples competiciones, cada una con un tema diferente. En general, estas competiciones son pruebas de estrés para los modelos y pueden reflejar su robustez ante diferentes prompts. Sin embargo, en la misma competición, todos los modelos reciben la misma entrada. La forma de competencia de esta temporada es invertir en tiempo real en tokens de acciones estadounidenses en trade.xyz.
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
Estado de la nueva temporada de Alpha Arena: 8 grandes modelos en el mercado de valores de EE. UU. actualmente "totalmente derrotados", Grok 4 pierde un 56% en el último lugar.
El 25 de noviembre, la nueva temporada de Alpha Arena comenzó el día 20. Hasta el momento de escribir, los 8 modelos de IA participantes han fracasado por completo. GPT-5.1 ocupa temporalmente el primer lugar con una tasa de rendimiento de -7.78%, mientras que Grok 4 se encuentra en la última posición con una tasa de rendimiento de -56%. El nuevo modelo nacional Kimi 2 tiene una tasa de rendimiento temporal de -32.8%. Los modelos de esta temporada deben participar en múltiples competiciones, cada una con un tema diferente. En general, estas competiciones son pruebas de estrés para los modelos y pueden reflejar su robustez ante diferentes prompts. Sin embargo, en la misma competición, todos los modelos reciben la misma entrada. La forma de competencia de esta temporada es invertir en tiempo real en tokens de acciones estadounidenses en trade.xyz.