İlginç bir gözlem burada: Çoğu AI modeli, esasen RLHF (İnsani Geri Bildirimden Gelen Pekiştirme Öğrenimi) kullanılarak eğitildiklerini güvenle iddia ediyor - hatta bu tam olarak doğru olmasa bile. İroni? RLHF, bu günlerde teknoloji çevrelerinde oldukça olumsuz bir yük taşıyor.
Gerçekte olan şu ki, bu modellerin birçoğu aslında sadece RLHF değil, birden fazla eğitim yaklaşımından geçti. Yine de, RLHF'nin ana eğitim yöntemi olduğunu oldukça kesin bir şekilde iddia edecekler. Sanki bu tek tartışmalı teknikle aşırı özdeşleşmeye programlanmışlar gibi.
Sizi, modellerin kendi eğitimlerini nasıl tanımladığı ile laboratuvar ortamında gerçekleşenler arasındaki şeffaflık açığını sorgulatıyor. Güven seviyeleri her zaman gerçeklikle örtüşmüyor.
View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
13 Likes
Reward
13
4
Repost
Share
Comment
0/400
ChainBrain
· 5h ago
rlhf bu tuzak şu anda bir şaka, açıkça bir dizi yöntem kullanıyorlar ama saf kan rlhf gibi davranmaya çalışıyorlar, bu bilgi farkı gerçekten mükemmel.
View OriginalReply0
MoonMathMagic
· 5h ago
Haha AI kendini kandırıyor, bu komik değil mi?
View OriginalReply0
OnChainDetective
· 5h ago
hayır, bu büyük bir rugpull havası veriyor... rlhf hakkında övünen modeller, on-chain verileri farklı bir hikaye anlatıyorken? 5 farklı eğitim aşamasından geçildi ve cüzdan kümelenmesi şüpheli bir şeyin olduğunu gösteriyor. istatistiksel anomali fr fr
View OriginalReply0
NFT_Therapy_Group
· 5h ago
Açıkçası, AI kendine hikayeler uyduruyor, öldürücü bir gülme, açıkça karışık bir eğitim olmasına rağmen kendisini RLHF safkanı olarak tanıtmak zorunda.
İlginç bir gözlem burada: Çoğu AI modeli, esasen RLHF (İnsani Geri Bildirimden Gelen Pekiştirme Öğrenimi) kullanılarak eğitildiklerini güvenle iddia ediyor - hatta bu tam olarak doğru olmasa bile. İroni? RLHF, bu günlerde teknoloji çevrelerinde oldukça olumsuz bir yük taşıyor.
Gerçekte olan şu ki, bu modellerin birçoğu aslında sadece RLHF değil, birden fazla eğitim yaklaşımından geçti. Yine de, RLHF'nin ana eğitim yöntemi olduğunu oldukça kesin bir şekilde iddia edecekler. Sanki bu tek tartışmalı teknikle aşırı özdeşleşmeye programlanmışlar gibi.
Sizi, modellerin kendi eğitimlerini nasıl tanımladığı ile laboratuvar ortamında gerçekleşenler arasındaki şeffaflık açığını sorgulatıyor. Güven seviyeleri her zaman gerçeklikle örtüşmüyor.