أحدثت CoinVoice أخبارًا أن نموذج DeepSeek-V3.2-Exp قد تم إصداره رسميًا ومفتوح المصدر اليوم. يقدم النموذج بنية انتباه متفرقة، والتي يمكن أن تقلل بشكل فعال من استهلاك موارد الحساب وتحسن كفاءة استنتاج النموذج. حاليًا، تم إدراج النموذج رسميًا على منصة خدمات النماذج الكبيرة MaaS من هواوي، وفيما يتعلق بنموذج DeepSeek-V3.2-Exp، لا تزال هواوي تستخدم خطة التوازي الكبيرة EP للتوزيع، استنادًا إلى استراتيجية التوازي السياقي المتوافقة مع تسلسل طويل التي تم تحقيقها من خلال بنية انتباه متفرقة، مع مراعاة تأخير النموذج وأداء الإخراج.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • تثبيت