2026-01-22 14:59:20

Зараз у даних для тренування ШІ є одна поширена проблема: вони занадто дешеві. Велика кількість копіювання та вставлення думок, механічна розмітка за кілька центів — і в результаті шуму стає безмежно багато, модель все більше стає посередньою, а наприкінці — це просто нагромадження середніх значень.

Є досить цікава ідея — перетворити розмітку даних із чисто трудомісткої роботи у справжню економічну гру. Використовуючи механізм ставок для визначення, учасники мають реальний прибуток або збитки, а також ризик репутації, — тоді сигнали стануть рідкісними, точними і справді надійними. Кажучи просто, — зробити так, щоб сама система стимулів слугувала фільтром для сигналів. Ця логіка дуже схожа на економічний дизайн у блокчейні: через узгодження інтересів покращувати якість системи.

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.

13 лайків

Нагородити
13
7
Репост
Поділіться

Прокоментувати

0/400

SchrödingersNode

· 20год тому

Тепер зрозуміло, суть проблеми з даними полягає в поганих стимулюваннях. Залучіть маркувальників реальними грошима, і ніхто не наважиться маркувати навмання. --- Правильно, зараз всі продають сміттєві дані, нікому не важливо якість, адже це дешево. --- Чекайте, хіба це не та сама система прогнозних ринків? Нехай постачальники інформації самі несуть ризик, тоді можна відфільтрувати шум. --- Ну нарешті хтось це сказав. Механічне маркування — це отрута, сучасні моделі — це результат їжі з сміття. --- Економічні стимули для фільтрації сигналів... ця логіка давно підтверджена в ланцюжку, здається, AI теж має її засвоїти. --- Криза якості даних справді існує, але скільки платформ здатні реально впровадити таку механіку ставок? --- Знову торгує блокчейн-мисленням... але цього разу сказано по суті. --- Тому проблема не в AI, а в тому, що ми надто не хочемо витрачати гроші на якісні дані.