広場
最新
注目
ニュース
プロフィール
ポスト
Gateアプリをダウンロードするにはスキャンしてください
その他のダウンロードオプション
今日はこれ以上表示しない
TokenTreasury_
2025-11-13 11:43:29
フォロー
ここでの興味深い観察:ほとんどのAIモデルは、自信を持って主にRLHF (人間のフィードバックからの強化学習)を使用して訓練されたと主張するようです - それが完全に正確でない場合でも。皮肉なことに?RLHFは、最近のテクノロジー界ではかなりネガティブなイメージを持っています。
実際に起こっていることは、これらのモデルの多くがRLHFだけでなく、複数のトレーニングアプローチを経ているということです。それでも彼らは、驚くべき確信を持ってRLHFが彼らの主要なトレーニング方法だったと主張します。まるで彼らがこの一つの物議を醸す技術に過剰に同一視するようにプログラムされているかのようです。
モデルが自分のトレーニングをどのように説明するかと、実際にラボで何が行われたかとの透明性のギャップについて考えさせられます。信頼性のレベルは、必ずしも現実と一致するわけではありません。
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については
免責事項
をご覧ください。
13 いいね
報酬
13
4
リポスト
共有
コメント
0/400
コメント
ChainBrain
· 5時間前
rlhfこの一連の話術は今や笑い話だ。明らかにたくさんの方法を使っておきながら、純血rlhfを装うなんて、この情報の差は本当に絶妙だ。
原文表示
返信
0
MoonMathMagic
· 5時間前
はは、AIが自分を騙しているのか、これって面白いじゃないか。
原文表示
返信
0
OnChainDetective
· 5時間前
いや、これは大規模なラグプルの雰囲気を醸し出している... RLHFについて自慢しているモデルたちが、オンチェーンデータは異なる物語を語っている? 5つの異なるトレーニングホップを通じて追跡されており、ウォレットのクラスタリングは何か怪しいことが起こっていることを示唆している。統計的異常だよ、まじで。
原文表示
返信
0
NFT_Therapy_Group
· 5時間前
要するにAIが自分自身の物語を作っているということですね、笑える。明らかに雑多なトレーニングなのに、自分はRLHFの純血だと言わなければならない。
原文表示
返信
0
人気の話題
もっと見る
#
CoinDeskNovGateReportComing
38.02K 人気度
#
LaunchTokensOnSquareToGrab$1,000
111.52K 人気度
#
XRPSpotETFsComingSoon
34.25K 人気度
#
GovShutdownCrisisNearsAnEnd?
28.72K 人気度
#
ETHReboundStarts
15.19K 人気度
人気の Gate Fun
もっと見る
最新
ファイナライズ中
リスト済み
1
kingdom
狗庄
時価総額:
$4.02K
保有者数:
1
0.00%
2
小白
小白
時価総額:
$4.05K
保有者数:
1
0.00%
3
Joker
Joker
時価総額:
$4.57K
保有者数:
12
2.32%
4
KENA
Kenalinu
時価総額:
$4.21K
保有者数:
5
0.70%
5
BTC12
BTC12
時価総額:
$4.13K
保有者数:
2
0.00%
ピン
サイトマップ
ここでの興味深い観察:ほとんどのAIモデルは、自信を持って主にRLHF (人間のフィードバックからの強化学習)を使用して訓練されたと主張するようです - それが完全に正確でない場合でも。皮肉なことに?RLHFは、最近のテクノロジー界ではかなりネガティブなイメージを持っています。
実際に起こっていることは、これらのモデルの多くがRLHFだけでなく、複数のトレーニングアプローチを経ているということです。それでも彼らは、驚くべき確信を持ってRLHFが彼らの主要なトレーニング方法だったと主張します。まるで彼らがこの一つの物議を醸す技術に過剰に同一視するようにプログラムされているかのようです。
モデルが自分のトレーニングをどのように説明するかと、実際にラボで何が行われたかとの透明性のギャップについて考えさせられます。信頼性のレベルは、必ずしも現実と一致するわけではありません。