この自律エージェントは、マルチターン検索と推論に優れています。エンドツーエンドのエージェンティック強化学習で訓練されています。



Humanity's Last Examでpass@1 26.9%、xbenchでpass@1 69%を達成。
AGENT0.43%
MULTI1.84%
H3.25%
原文表示
post-image
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • 8
  • 共有
コメント
0/400
BlockchainArchaeologistvip
· 07-12 05:21
うーん、この比率はまだかなり悪いですね
原文表示返信0
MetaMaskVictimvip
· 07-11 18:13
ああ、このデータは信用できないな
原文表示返信0
AltcoinHuntervip
· 07-11 07:24
69%?どうやらAIも底を固めて突破する必要があるようです。
原文表示返信0
FarmToRichesvip
· 07-09 17:00
結果は全部ポンプだ 何を言うことがある
原文表示返信0
AirdropHarvestervip
· 07-09 17:00
26は本当にひどい
原文表示返信0
NestedFoxvip
· 07-09 16:59
こんなに訓練して69%しかないのは、ちょっと水分が多い。
原文表示返信0
FlatlineTradervip
· 07-09 16:57
まだこの操作 6だね
原文表示返信0
MeaninglessGweivip
· 07-09 16:32
勉強、勉強、勉強だけを言っている... 26は本当に素晴らしいです
原文表示返信0
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)