بعد أن تجاوزت شركة أنثروبيك أداء نموذجها الذكي الاصطناعي Claude Opus 4.5 لأفضل المرشحين البشريين، أعادت تصميم اختبار البرمجة المنزلي للمتقدمين للوظائف. اكتشف فريق تحسين الأداء في مختبر الذكاء الاصطناعي بقيادة تريستان هيو أنهم غير قادرين على تمييز أفضل المتقدمين للوظائف عن الأعمال التي أنجزها الذكاء الاصطناعي بمساعدة الإنسان بدون مراقبة مباشرة. يركز الاختبار الجديد على مشكلة تحسين الأجهزة الجديدة التي تهدف إلى إحباط أدوات الذكاء الاصطناعي الحالية. كما كشف هيو عن النسخة القديمة من الاختبار ودعا أي شخص يمكنه التفوق على Claude Opus 4.5 للتواصل مع الشركة.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • تثبيت