Після того, як компанія Anthropic перевищила показники своїй моделі штучного інтелекту Claude Opus 4.5 у порівнянні з провідними людськими кандидатами, вона перепроектувала домашній тест з програмування для кандидатів. Команда з оптимізації продуктивності AI-лабораторії під керівництвом Tristan Hume виявила, що без присутності на місці вони не можуть відрізнити найкращих кандидатів від завдань, виконаних за допомогою AI. Новий тест зосереджений на новому апаратному оптимізаційному завданні, яке має на меті зламати існуючі інструменти AI. Hume також опублікував попередню версію тесту і запрошує будь-кого, хто зможе перевершити Claude Opus 4.5, зв’язатися з компанією.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
Після того, як компанія Anthropic перевищила показники своїй моделі штучного інтелекту Claude Opus 4.5 у порівнянні з провідними людськими кандидатами, вона перепроектувала домашній тест з програмування для кандидатів. Команда з оптимізації продуктивності AI-лабораторії під керівництвом Tristan Hume виявила, що без присутності на місці вони не можуть відрізнити найкращих кандидатів від завдань, виконаних за допомогою AI. Новий тест зосереджений на новому апаратному оптимізаційному завданні, яке має на меті зламати існуючі інструменти AI. Hume також опублікував попередню версію тесту і запрошує будь-кого, хто зможе перевершити Claude Opus 4.5, зв’язатися з компанією.