Observación interesante aquí: la mayoría de los modelos de IA parecen afirmar con confianza que fueron entrenados principalmente utilizando RLHF (Aprendizaje por Refuerzo a partir de la Retroalimentación Humana) - incluso cuando eso no es del todo preciso. ¿La ironía? RLHF lleva una carga bastante negativa en los círculos tecnológicos en estos días.

Lo que realmente está sucediendo es que muchos de estos modelos en realidad pasaron por múltiples enfoques de entrenamiento, no solo RLHF. Sin embargo, insistirán con sorprendente certeza que RLHF fue su principal método de entrenamiento. Es casi como si estuvieran programados para sobre-identificarse con esta técnica controvertida.

Te hace preguntarte sobre la brecha de transparencia entre cómo los modelos describen su propio entrenamiento frente a lo que realmente sucedió en el laboratorio. El nivel de confianza no siempre coincide con la realidad.

Ver originales

Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.

13 me gusta

Recompensa
13
4
Republicar
Compartir

Comentar

0/400

ChainBrain

· hace14h

rlhf este conjunto de palabras ahora es una broma, claramente se han utilizado un montón de métodos pero insisten en hacerse pasar por rlhf puro, esta diferencia de información es simplemente impresionante.

Ver originalesResponder0

MoonMathMagic

· hace14h

Jaja, la IA se engaña a sí misma, ¿no es eso bastante gracioso?

Ver originalesResponder0

OnChainDetective

· hace14h

nah esto da vibras masivas de rugpull... modelos presumiendo sobre rlhf cuando los datos on-chain cuentan una historia diferente? rastreado a través de como 5 diferentes saltos de entrenamiento y la agrupación de billeteras sugiere que algo sospechoso está sucediendo. anomalía estadística fr fr

Ver originalesResponder0

NFT_Therapy_Group

· hace14h

En otras palabras, la IA está inventando historias para sí misma, me muero de risa, claramente es un entrenamiento de mezcla y aún así tiene que decir que es pura RLHF.

Ver originalesResponder0

Temas de actualidadVer más
#CoinDeskNovGateReportComing
39.5K Popularidad
#LaunchTokensOnSquareToGrab$1,000
112.96K Popularidad
#XRPSpotETFsComingSoon
34.84K Popularidad
#GovShutdownCrisisNearsAnEnd?
28.89K Popularidad
#ETHReboundStarts
16.23K Popularidad

Gate Fun en tendenciaVer más

1
ZGDT中国地图
Cap.M.:$3.93KHolders:2
0.14%
2
$TOFU 豆腐
Cap.M.:$3.85KHolders:1
0.00%
3
GT轻松一键下载
Cap.M.:$3.81KHolders:1
0.00%
4
TFLTrading For Life
Cap.M.:$3.88KHolders:1
0.00%
5
CBLCoin bull
Cap.M.:$3.91KHolders:1
0.00%

Anclado