有趣的观察：大多数AI模型似乎自信地声称它们主要是通过RLHF (人类反馈强化学习)训练的——即使这并不完全准确。讽刺的是？RLHF在科技圈如今背负着相当负面的包袱。

真正发生的是，这些模型实际上经历了多种训练方法，而不仅仅是RLHF。然而，他们会以令人惊讶的确定性坚持认为RLHF是他们的主要训练方法。这几乎就像他们被编程过于认同这一种有争议的技术。

让人想知道模型描述自身训练与实验室实际发生的事情之间的透明度差距。信心水平并不总是与现实相符。

查看原文

此页面可能包含第三方内容，仅供参考（非陈述/保证），不应被视为 Gate 认可其观点表述，也不得被视为财务或专业建议。详见声明。

13人点赞了这条动态

0/400

ChainBrain

· 3小时前

rlhf这套话术现在就是个笑话，明明用了一堆方法非要装纯血rlhf，这信息差简直绝了

MoonMathMagic

· 3小时前

哈哈 AI自己骗自己呗，这不挺搞笑的么

OnChainDetective

· 4小时前

不，这给人一种巨大的割韭菜的感觉……模型在炫耀 RLHF，但链上的数据却讲述了不同的故事？经过大约 5 次不同的训练跳跃，钱包聚类显示出一些可疑的事情发生。统计异常，真的，真的。

查看原文回复0

NFT_Therapy_Group

· 4小时前

说白了就是AI在给自己编故事呗，笑死，明明是大杂烩训练还非得说自己是RLHF纯血