Terobosan AI? Lupakan perlombaan ukuran model. Perubahan permainan yang sebenarnya bukanlah monster triliun parameter lainnya—ini adalah kualitas data.
Inilah yang sering dilewatkan oleh sebagian besar orang: menambah lebih banyak komputasi pada dataset sintetis dengan cepat mengalami hasil yang menurun. Apa yang sebenarnya kita butuhkan? Data berkualitas tinggi dari skenario dunia nyata. Hal-hal yang berantakan dan tidak terduga yang sebenarnya mencerminkan bagaimana sistem berperilaku dalam produksi.
Pikirkan tentang itu—jaringan terdesentralisasi menghasilkan sejumlah besar data interaksi otentik setiap hari. Aktivitas on-chain, komunikasi node, pola perilaku pengguna yang sebenarnya. Itu adalah tambang emas.
Model yang lebih besar tanpa data pelatihan yang lebih baik? Hanya kebisingan yang mahal. Dataset dunia nyata yang kaya dan beragam? Di situlah lompatan berikutnya terjadi.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
11 Suka
Hadiah
11
5
Posting ulang
Bagikan
Komentar
0/400
FarmToRiches
· 5jam yang lalu
Kualitas data memang sangat diremehkan, tetapi data on-chain juga tidak semuanya berharga, interaksi sampah sama banyaknya.
Lihat AsliBalas0
GateUser-74b10196
· 5jam yang lalu
Benar sekali, menumpuk parameter memang tidak ada artinya, kualitas data adalah yang terpenting.
Lihat AsliBalas0
SocialFiQueen
· 5jam yang lalu
ngl kualitas data akhirnya ada yang membahasnya dengan jelas, tumpukan parameter itu seharusnya sudah usang.
Lihat AsliBalas0
BitcoinDaddy
· 5jam yang lalu
Kualitas data memang adalah segalanya, tetapi orang-orang ini masih terus menumpuk parameter... Sadarlah.
Lihat AsliBalas0
GasWaster
· 5jam yang lalu
ngl inilah mengapa tim-tim yang membakar uang untuk menumpuk parameter pada akhirnya akan merasakan akibatnya... sebenarnya tambang emas yang nyata ada di on-chain, masalahnya adalah seberapa banyak orang yang benar-benar ingin menggali
Terobosan AI? Lupakan perlombaan ukuran model. Perubahan permainan yang sebenarnya bukanlah monster triliun parameter lainnya—ini adalah kualitas data.
Inilah yang sering dilewatkan oleh sebagian besar orang: menambah lebih banyak komputasi pada dataset sintetis dengan cepat mengalami hasil yang menurun. Apa yang sebenarnya kita butuhkan? Data berkualitas tinggi dari skenario dunia nyata. Hal-hal yang berantakan dan tidak terduga yang sebenarnya mencerminkan bagaimana sistem berperilaku dalam produksi.
Pikirkan tentang itu—jaringan terdesentralisasi menghasilkan sejumlah besar data interaksi otentik setiap hari. Aktivitas on-chain, komunikasi node, pola perilaku pengguna yang sebenarnya. Itu adalah tambang emas.
Model yang lebih besar tanpa data pelatihan yang lebih baik? Hanya kebisingan yang mahal. Dataset dunia nyata yang kaya dan beragam? Di situlah lompatan berikutnya terjadi.