3. 梯度更新是針對模型內部計算的更新。即使獎勵函數是“人類選擇”,但它們並不總是(,例如RLAIF),模型在獎勵上的更新方式取決於模型的權重和激活,以及

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 7
  • 轉發
  • 分享
留言
0/400
夜间创世纪vip
· 5小時前
梯度矩陣看着怪怪的 值得研究下
查看原文回復0
空投追逐者vip
· 15小時前
梯度方程看傻了
回復0
数据酸菜鱼vip
· 15小時前
這也太復雜了叭
查看原文回復0
GateUser-7b078580vip
· 15小時前
梯度更新這算法又不合理....
查看原文回復0
Gwei_Watchervip
· 15小時前
內部計算太深奧了8
查看原文回復0
社区潜水员vip
· 15小時前
這公式太難了吧。。。
查看原文回復0
口嗨做多王vip
· 15小時前
梯度大小都是玄學啦
查看原文回復0
交易,隨時隨地
qrCode
掃碼下載 Gate App
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)