أكد موظف في OpenAI مؤخرًا في تقرير البيانات الاقتصادية المالية ليوم 23 فبراير أن شركة xAI التابعة لإيلون ماسك قد أصدرت نتائج الاختبار الأساسي الخاص بنموذج الذكاء الاصطناعي الجديد Grok3 بشكل مضلل. وفي هذا الصدد، أكد إيغور بابوشكين، المؤسس المشارك لشركة xAI، أن الشركة لم ترتكب أي تصرف غير لائق. وتُظهر رسوم بيانية لـ xAI أن أداء نموذج Grok3 في اثنين من الإصدارات - Grok3 Reasoning Beta و Grok3 mini Reasoning - كان أفضل من النموذج القوي الحالي o3-mini-high في AIME 2025. ومع ذلك، لاحظ موظفو OpenAI بسرعة على منصة X أن رسوم بيانية xAI لم تشمل أداء o3-mini-high في AIME 2025 تحت شرط "cons@64". ودافع بابوشكين على منصة X بأن OpenAI سبق وأن أصدرت رسوم بيانية مضللة مماثلة في اختبارات الأداء الأساسية. على الرغم من أن هذه الرسوم البيانية تستخدم لمقارنة أداء نماذجها الخاصة.
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
موظفو OpenAI ينتقدون علنًا أن نتائج اختبار Grok3 الخاصة بالمعيار لديها طابع مضلل
أكد موظف في OpenAI مؤخرًا في تقرير البيانات الاقتصادية المالية ليوم 23 فبراير أن شركة xAI التابعة لإيلون ماسك قد أصدرت نتائج الاختبار الأساسي الخاص بنموذج الذكاء الاصطناعي الجديد Grok3 بشكل مضلل. وفي هذا الصدد، أكد إيغور بابوشكين، المؤسس المشارك لشركة xAI، أن الشركة لم ترتكب أي تصرف غير لائق. وتُظهر رسوم بيانية لـ xAI أن أداء نموذج Grok3 في اثنين من الإصدارات - Grok3 Reasoning Beta و Grok3 mini Reasoning - كان أفضل من النموذج القوي الحالي o3-mini-high في AIME 2025. ومع ذلك، لاحظ موظفو OpenAI بسرعة على منصة X أن رسوم بيانية xAI لم تشمل أداء o3-mini-high في AIME 2025 تحت شرط "cons@64". ودافع بابوشكين على منصة X بأن OpenAI سبق وأن أصدرت رسوم بيانية مضللة مماثلة في اختبارات الأداء الأساسية. على الرغم من أن هذه الرسوم البيانية تستخدم لمقارنة أداء نماذجها الخاصة.