OpenAIはGDPval評価AI経済価値タスクのパフォーマンスを発表しました。PANews 9月26日の報道によると、OpenAIは新しい評価ツールGDPvalを導入し、AIの現実世界の経済価値タスクにおけるパフォーマンスを測定することに重点を置いています。GDPvalは、米国GDPに最も貢献している9つの業界の44の職業をカバーしており、タスクは平均14年の経験を持つ業界の専門家によって設計されています。評価結果は、Claude Opus 4.1モデルの出力のほぼ半分が専門家レベルと同等またはそれ以上であることを示しています。OpenAIは、将来的にGDPval評価の範囲と詳細を拡張し続けると述べています。

原文表示
post-image
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
0/400
コメントなし
  • ピン
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)