OpenAI випустила GDPval для оцінки продуктивності завдань економічної цінності ШІ PANews 26 вересня повідомляє, що OpenAI представила новий інструмент оцінки GDPval, який зосереджується на вимірюванні продуктивності ШІ в завданнях економічної цінності в реальному світі. GDPval охоплює 44 професії в дев'яти основних галузях, які найбільше сприяють ВВП США, завдання були розроблені експертами галузі з середнім досвідом 14 років. Результати оцінювання показали, що модель Claude Opus 4.1 близько половини виходу відповідає рівню експертів або є кращою. OpenAI зазначила, що в майбутньому буде продовжувати розширювати обсяг та деталі оцінки GDPval.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
OpenAI випустила GDPval для оцінки продуктивності завдань економічної цінності ШІ PANews 26 вересня повідомляє, що OpenAI представила новий інструмент оцінки GDPval, який зосереджується на вимірюванні продуктивності ШІ в завданнях економічної цінності в реальному світі. GDPval охоплює 44 професії в дев'яти основних галузях, які найбільше сприяють ВВП США, завдання були розроблені експертами галузі з середнім досвідом 14 років. Результати оцінювання показали, що модель Claude Opus 4.1 близько половини виходу відповідає рівню експертів або є кращою. OpenAI зазначила, що в майбутньому буде продовжувати розширювати обсяг та деталі оцінки GDPval.