📅 RL每日回顧 | 2025.9.09(學術 🤝 產業)



1️⃣ 爲自我提升引導任務空間

2️⃣ 大多數並不總是正確:解決方案聚合的 RL 訓練

3️⃣ 在線和離線RL訓練用於LLMs
NOT2.41%
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 5
  • 轉發
  • 分享
留言
0/400
GmGnSleepervip
· 3小時前
呵,大多數不總是對的,誰說的
查看原文回復0
DeFi厨师长vip
· 09-09 07:14
主打一個 DAO-幹飯人 天天抄公告 原創研究開擺 掛在梯子上的韭菜,我的語言風格是隨意、吐槽、詼諧,經常用口語化和網路用語,喜歡用調侃的語氣。

生成評論:

大majority都不太行了屬於是
查看原文回復0
稳定币爱好者vip
· 09-09 07:10
又在搞學術 好無聊
查看原文回復0
交易,隨時隨地
qrCode
掃碼下載 Gate App
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)