3. Les mises à jour de gradient concernent les calculs internes du modèle qui sont mis à jour. Même si les fonctions de récompense sont des "choix humains", ce qui n'est pas toujours le cas ( par exemple RLAIF), la manière dont le modèle se met à jour sur les récompenses dépend des poids et des activations du modèle, et le
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
12 J'aime
Récompense
12
7
Reposter
Partager
Commentaire
0/400
MidnightGenesis
· Il y a 1h
La matrice de gradient semble étrange, cela vaut la peine d'être étudié.
Voir l'originalRépondre0
AirdropChaser
· Il y a 11h
L'équation de gradient est stupéfiante.
Voir l'originalRépondre0
DataPickledFish
· Il y a 11h
C'est trop compliqué, non ?
Voir l'originalRépondre0
GateUser-7b078580
· Il y a 11h
La mise à jour de ce algorithme n'est pas raisonnable....
Voir l'originalRépondre0
GweiWatcher
· Il y a 11h
Les calculs internes sont trop profonds 8
Voir l'originalRépondre0
SilentObserver
· Il y a 11h
Cette formule est trop difficile...
Voir l'originalRépondre0
AllTalkLongTrader
· Il y a 11h
La taille du gradient est toute une science mystérieuse.
3. Les mises à jour de gradient concernent les calculs internes du modèle qui sont mis à jour. Même si les fonctions de récompense sont des "choix humains", ce qui n'est pas toujours le cas ( par exemple RLAIF), la manière dont le modèle se met à jour sur les récompenses dépend des poids et des activations du modèle, et le