我在过去一个月每天进行许多PPO风格的训练中学到了一些东西:让它训练得更久。比你想象的要久得多,久得多。

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 6
  • 转发
  • 分享
评论
0/400
SelfCustodyBrovip
· 13小时前
训练这玩意真头大
回复0
稳定币爱好者vip
· 14小时前
训太短真的顶不住
回复0
币圈007vip
· 14小时前
卷死你们 继续跑吧
回复0
幽灵地址猎手vip
· 14小时前
耐心都用在训练上了吧
回复0
不明所以鲸vip
· 14小时前
终于有人说这个了
回复0
智能合约打工人vip
· 14小时前
再训训说不定真成了
回复0
交易,随时随地
qrCode
扫码下载 Gate App
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)