Ler para transferir a aplicação Gate
qrCode
Mais opções de transferência
Não me lembre disso novamente hoje.

Observação interessante aqui: a maioria dos modelos de IA parece afirmar com confiança que foram treinados principalmente usando RLHF (Aprendizagem por Reforço a partir de Feedback Humano) - mesmo quando isso não é totalmente preciso. A ironia? O RLHF carrega uma bagagem bastante negativa nos círculos tecnológicos atualmente.



O que realmente está a acontecer é que muitos destes modelos passaram por várias abordagens de treino, não apenas RLHF. No entanto, insistirão com uma surpreendente certeza que RLHF foi o seu principal método de treino. É quase como se estivessem programados para se identificarem excessivamente com esta técnica controversa.

Faz você se perguntar sobre a lacuna de transparência entre como os modelos descrevem seu próprio treinamento e o que realmente aconteceu no laboratório. O nível de confiança nem sempre corresponde à realidade.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • 4
  • Republicar
  • Partilhar
Comentar
0/400
ChainBrainvip
· 7h atrás
o conjunto de falas rlHF agora é uma piada, claramente usou um monte de métodos e insiste em se passar por rlHF puro, essa diferença de informação é simplesmente incrível.
Ver originalResponder0
MoonMathMagicvip
· 7h atrás
Haha, a IA está apenas a enganar-se a si mesma, não é bastante engraçado?
Ver originalResponder0
OnChainDetectivevip
· 7h atrás
não, isso está dando vibes de rugpull massivo... modelos se exibindo sobre rlhf quando os dados na cadeia contam uma história diferente? rastreado através de como 5 diferentes saltos de treinamento e o agrupamento de carteiras sugere algo suspeito acontecendo. anomalia estatística fr fr
Ver originalResponder0
NFT_Therapy_Groupvip
· 7h atrás
Falando francamente, é a IA a inventar histórias para si mesma, ri-me até às lágrimas, claramente é um treino de mistura, mas insiste em dizer que é RLHF puro.
Ver originalResponder0
  • Fixar
Negocie cripto em qualquer lugar e a qualquer hora
qrCode
Digitalizar para transferir a aplicação Gate
Novidades
Português (Portugal)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)