Прорив у ШІ? Забудьте про гонку розмірів моделей. Справжнім революційним фактором є не ще один монстр з трильйоном параметрів—це якість даних.
Ось що більшість людей пропускає: збільшення обчислювальних потужностей для синтетичних наборів даних швидко досягає зворотних результатів. Що нам насправді потрібно? Високоякісні дані з реальних сценаріїв. Безладні, непередбачувані речі, які насправді відображають, як системи працюють у виробництві.
Подумайте про це — децентралізовані мережі щодня генерують величезні обсяги автентичних даних взаємодії. Ончейн-активності, комунікації вузлів, реальні патерни поведінки користувачів. Це золота жила.
Більші моделі без кращих навчальних даних? Просто дороге шум. Багаті, різноманітні реальні набори даних? Ось де відбудеться наступний стрибок.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
11 лайків
Нагородити
11
5
Репост
Поділіться
Прокоментувати
0/400
FarmToRiches
· 7год тому
Якість даних дійсно серйозно недооцінюється, але on-chain дані не є лише золотом, сміття у взаємодіях також досить багато.
Переглянути оригіналвідповісти на0
GateUser-74b10196
· 7год тому
Ти правий, дійсно, накопичувати параметри не має сенсу, якість даних є основним принципом.
Переглянути оригіналвідповісти на0
SocialFiQueen
· 7год тому
чесно кажучи, ця проблема якості даних нарешті була зрозуміла, той підхід з накопиченням параметрів давно мав відійти в минуле.
Переглянути оригіналвідповісти на0
BitcoinDaddy
· 7год тому
Якість даних дійсно є ключовою, але ці люди все ще накопичують параметри... Прокиньтеся.
Переглянути оригіналвідповісти на0
GasWaster
· 7год тому
ngl це причина, чому команди, які спалюють гроші на налаштування параметрів, рано чи пізно зазнають невдачі... справжня золота жила насправді лежить у блокчейні, питання в тому, скільки людей справді хоче її видобути.
Прорив у ШІ? Забудьте про гонку розмірів моделей. Справжнім революційним фактором є не ще один монстр з трильйоном параметрів—це якість даних.
Ось що більшість людей пропускає: збільшення обчислювальних потужностей для синтетичних наборів даних швидко досягає зворотних результатів. Що нам насправді потрібно? Високоякісні дані з реальних сценаріїв. Безладні, непередбачувані речі, які насправді відображають, як системи працюють у виробництві.
Подумайте про це — децентралізовані мережі щодня генерують величезні обсяги автентичних даних взаємодії. Ончейн-активності, комунікації вузлів, реальні патерни поведінки користувачів. Це золота жила.
Більші моделі без кращих навчальних даних? Просто дороге шум. Багаті, різноманітні реальні набори даних? Ось де відбудеться наступний стрибок.