موظفو OpenAI ينتقدون علنًا أن نتائج اختبار Grok3 الخاصة بالمعيار لديها طابع مضلل

robot
إنشاء الملخص قيد التقدم

أكد موظف في OpenAI مؤخرًا في تقرير البيانات الاقتصادية المالية ليوم 23 فبراير أن شركة xAI التابعة لإيلون ماسك قد أصدرت نتائج الاختبار الأساسي الخاص بنموذج الذكاء الاصطناعي الجديد Grok3 بشكل مضلل. وفي هذا الصدد، أكد إيغور بابوشكين، المؤسس المشارك لشركة xAI، أن الشركة لم ترتكب أي تصرف غير لائق. وتُظهر رسوم بيانية لـ xAI أن أداء نموذج Grok3 في اثنين من الإصدارات - Grok3 Reasoning Beta و Grok3 mini Reasoning - كان أفضل من النموذج القوي الحالي o3-mini-high في AIME 2025. ومع ذلك، لاحظ موظفو OpenAI بسرعة على منصة X أن رسوم بيانية xAI لم تشمل أداء o3-mini-high في AIME 2025 تحت شرط "cons@64". ودافع بابوشكين على منصة X بأن OpenAI سبق وأن أصدرت رسوم بيانية مضللة مماثلة في اختبارات الأداء الأساسية. على الرغم من أن هذه الرسوم البيانية تستخدم لمقارنة أداء نماذجها الخاصة.

شاهد النسخة الأصلية
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • أعجبني
  • 2
  • مشاركة
تعليق
0/400
Birakenewekovip
· 02-23 03:48
السوق الصاعدة 🐂
شاهد النسخة الأصليةرد0
Renatinho25vip
· 02-23 02:47
استثمر 🚀
شاهد النسخة الأصليةرد0
  • تثبيت