Escanea para descargar la aplicación Gate
qrCode
Más opciones de descarga
No volver a recordar hoy

Observación interesante aquí: la mayoría de los modelos de IA parecen afirmar con confianza que fueron entrenados principalmente utilizando RLHF (Aprendizaje por Refuerzo a partir de la Retroalimentación Humana) - incluso cuando eso no es del todo preciso. ¿La ironía? RLHF lleva una carga bastante negativa en los círculos tecnológicos en estos días.



Lo que realmente está sucediendo es que muchos de estos modelos en realidad pasaron por múltiples enfoques de entrenamiento, no solo RLHF. Sin embargo, insistirán con sorprendente certeza que RLHF fue su principal método de entrenamiento. Es casi como si estuvieran programados para sobre-identificarse con esta técnica controvertida.

Te hace preguntarte sobre la brecha de transparencia entre cómo los modelos describen su propio entrenamiento frente a lo que realmente sucedió en el laboratorio. El nivel de confianza no siempre coincide con la realidad.
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • 4
  • Republicar
  • Compartir
Comentar
0/400
ChainBrainvip
· hace14h
rlhf este conjunto de palabras ahora es una broma, claramente se han utilizado un montón de métodos pero insisten en hacerse pasar por rlhf puro, esta diferencia de información es simplemente impresionante.
Ver originalesResponder0
MoonMathMagicvip
· hace14h
Jaja, la IA se engaña a sí misma, ¿no es eso bastante gracioso?
Ver originalesResponder0
OnChainDetectivevip
· hace14h
nah esto da vibras masivas de rugpull... modelos presumiendo sobre rlhf cuando los datos on-chain cuentan una historia diferente? rastreado a través de como 5 diferentes saltos de entrenamiento y la agrupación de billeteras sugiere que algo sospechoso está sucediendo. anomalía estadística fr fr
Ver originalesResponder0
NFT_Therapy_Groupvip
· hace14h
En otras palabras, la IA está inventando historias para sí misma, me muero de risa, claramente es un entrenamiento de mezcla y aún así tiene que decir que es pura RLHF.
Ver originalesResponder0
  • Anclado
Opera con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)