3. Las actualizaciones de gradiente son con respecto a los cálculos internos del modelo que se está actualizando. Incluso si las funciones de recompensa son "elecciones humanas", que no siempre lo son ( por ejemplo, RLAIF), la forma en que el modelo se actualiza en función de las recompensas depende de los pesos y activaciones del modelo, y el

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • 7
  • Republicar
  • Compartir
Comentar
0/400
MidnightGenesisvip
· hace4h
La matriz de gradientes se ve extraña, vale la pena investigarla.
Ver originalesResponder0
AirdropChaservip
· hace14h
La ecuación de gradiente me dejó atónito.
Ver originalesResponder0
DataPickledFishvip
· hace14h
Esto es demasiado complicado.
Ver originalesResponder0
GateUser-7b078580vip
· hace14h
La actualización de gradientes este algoritmo no es razonable....
Ver originalesResponder0
GweiWatchervip
· hace14h
El cálculo interno es demasiado profundo 8
Ver originalesResponder0
SilentObservervip
· hace15h
Esta fórmula es demasiado difícil...
Ver originalesResponder0
AllTalkLongTradervip
· hace15h
El tamaño del gradiente es pura metafísica.
Ver originalesResponder0
  • Anclado
Opera con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)