Після того, як компанія Anthropic перевищила показники своїй моделі штучного інтелекту Claude Opus 4.5 у порівнянні з провідними людськими кандидатами, вона перепроектувала домашній тест з програмування для кандидатів. Команда з оптимізації продуктивності AI-лабораторії під керівництвом Tristan Hume виявила, що без присутності на місці вони не можуть відрізнити найкращих кандидатів від завдань, виконаних за допомогою AI. Новий тест зосереджений на новому апаратному оптимізаційному завданні, яке має на меті зламати існуючі інструменти AI. Hume також опублікував попередню версію тесту і запрошує будь-кого, хто зможе перевершити Claude Opus 4.5, зв’язатися з компанією.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити