Cet agent autonome excelle dans la recherche et le raisonnement multi-tours. Entraîné avec un apprentissage par renforcement agentique de bout en bout.
A atteint 26,9 % de pass@1 sur le Dernier Examen de l'Humanité, 69 % de pass@1 sur xbench.
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
18 J'aime
Récompense
18
8
Partager
Commentaire
0/400
BlockchainArchaeologist
· 07-12 05:21
Tsk tsk, ce ratio est encore assez mauvais.
Voir l'originalRépondre0
MetaMaskVictim
· 07-11 18:13
Oh là là, ces données sont gonflées.
Voir l'originalRépondre0
AltcoinHunter
· 07-11 07:24
69% ? Il semble que l'IA doit également atteindre un point bas et le dépasser.
Voir l'originalRépondre0
FarmToRiches
· 07-09 17:00
Les résultats ont tous échoué, que puis-je dire?
Voir l'originalRépondre0
AirdropHarvester
· 07-09 17:00
26 est vraiment triste
Voir l'originalRépondre0
NestedFox
· 07-09 16:59
Après tant d'entraînement, seulement 69%, c'est un peu décevant.
Voir l'originalRépondre0
FlatlineTrader
· 07-09 16:57
Et cette opération, c'est 6.
Voir l'originalRépondre0
MeaninglessGwei
· 07-09 16:32
Je ne peux parler que d'apprendre, d'apprendre, d'apprendre... 26 c'est déjà pas mal.
Cet agent autonome excelle dans la recherche et le raisonnement multi-tours. Entraîné avec un apprentissage par renforcement agentique de bout en bout.
A atteint 26,9 % de pass@1 sur le Dernier Examen de l'Humanité, 69 % de pass@1 sur xbench.