امسح ضوئيًا لتحميل تطبيق Gate
qrCode
خيارات تحميل إضافية
لا تذكرني بذلك مرة أخرى اليوم

اختبارات Io.net تكشف عن نقطة التوازن المثالية بين التكلفة والأداء لمجموعات RTX 4090

تناقش ورقة علمية مُحكّمة تم قبولها في المؤتمر الدولي السادس للذكاء الاصطناعي والبلوكشين (AIBC 2025) أن وحدات معالجة الرسومات الاستهلاكية غير المستخدمة، مثل Nvidia RTX 4090، يمكن أن تساهم بشكل ملحوظ في تقليل تكلفة تشغيل استدلال نماذج اللغة الكبيرة عند استخدامها جنبًا إلى جنب مع عتاد مراكز البيانات التقليدي.

بعنوان “وحدات معالجة الرسومات الاستهلاكية غير المستخدمة كمكمل للعتاد المؤسسي في استدلال النماذج اللغوية الكبيرة”، تعد الدراسة من io.net الأولى التي تنشر معايير أداء مفتوحة لمجموعات وحدات معالجة الرسومات غير المتجانسة على السحابة اللامركزية للمشروع. تقارن التحليلات مجموعات البطاقات الاستهلاكية مقابل معجلات H100 من فئة مراكز البيانات وتستخلص وجود توازن واضح بين الأداء والتكلفة يمكن أن يعيد تشكيل كيفية تصميم المؤسسات لأساطيل الاستدلال الخاصة بها.

وفقًا للورقة، يمكن لمجموعات مبنية من وحدات RTX 4090 أن توفر ما بين 62 و78 بالمئة من إنتاجية وحدات H100 مع العمل بتكلفة تقارب النصف. بالنسبة لأحمال العمل الدفعية أو التطبيقات التي يمكنها تحمل التأخير، تنخفض تكلفة التوكنز بما يصل إلى 75 بالمئة. ويشدد الباحثون على أن هذه المدخرات تكون أكثر جاذبية عندما يكون بإمكان المطورين تحمل تأخيرات زمنية أعلى أو استخدام العتاد الاستهلاكي للمهام الزائدة أو الخلفية مثل التطوير والمعالجة الدفعية وتوليد التضمينات والتقييمات واسعة النطاق.

قالت ألين ألميدا، رئيسة الأبحاث في مؤسسة IOG والمؤلفة الرئيسية للدراسة: “توضح نتائجنا أن التوجيه الهجين عبر وحدات معالجة الرسومات المؤسسية والاستهلاكية يوفر توازنًا عمليًا بين الأداء والتكلفة والاستدامة. فبدلاً من خيار ثنائي، تتيح البنية التحتية غير المتجانسة للمؤسسات تحسين متطلبات الكمون والميزانية الخاصة بهم مع تقليل الأثر الكربوني.”

أساطيل وحدات معالجة الرسومات الهجينة

لا تتجاهل الورقة نقاط قوة وحدات H100: إذ تحافظ بطاقات مراكز بيانات Nvidia على أداء أقل من 55 مللي ثانية P99 لزمن التوكن الأول حتى تحت الحمل العالي، وهو حد يجعلها ضرورية لتطبيقات الوقت الحقيقي والحساسة للكمون مثل روبوتات المحادثة الإنتاجية والوكلاء التفاعليين. في المقابل، تناسب مجموعات وحدات معالجة الرسومات الاستهلاكية حركة المرور التي يمكنها تحمل تأخيرات ذيلية ممتدة؛ ويشير المؤلفون إلى نافذة P99 من 200–500 مللي ثانية كخيار واقعي للعديد من أعباء العمل البحثية والتطويرية/الاختبارية.

كما أن الطاقة والاستدامة جزء من المعادلة. فعلى الرغم من أن وحدات H100 لا تزال أكثر كفاءة في استهلاك الطاقة لكل توكن بحوالي 3.1 مرة، تشير الدراسة إلى أن استغلال وحدات معالجة الرسومات الاستهلاكية غير المستخدمة يمكن أن يخفض البصمة الكربونية الضمنية للحوسبة من خلال إطالة عمر العتاد والاستفادة من الشبكات الكهربائية الغنية بالطاقة المتجددة. باختصار، يمكن أن يكون الأسطول المختلط أرخص وأكثر صداقة للبيئة عندما يتم نشره بشكل استراتيجي.

قال غوراف شارما، الرئيس التنفيذي لـ io.net: “هذا التحليل المُحكّم يؤكد الفرضية الأساسية وراء io.net: أن مستقبل الحوسبة سيكون موزعًا، متنوعًا، ومتاحًا للجميع. من خلال استغلال كل من عتاد مراكز البيانات والعتاد الاستهلاكي، يمكننا ديمقراطية الوصول إلى بنية الذكاء الاصطناعي المتقدمة وجعلها أكثر استدامة.”

التوجيه العملي من الورقة موجه مباشرة لفرق عمليات تعلم الآلة ومطوري الذكاء الاصطناعي. يوصي المؤلفون باستخدام وحدات معالجة الرسومات المؤسسية للتوجيه في الوقت الفعلي وذو الكمون المنخفض، بينما يتم توجيه التطوير والتجارب وأعباء العمل الضخمة إلى المجموعات الاستهلاكية. ويشيرون إلى نقطة توازن تشغيلية حيث تحقق تكوينات RTX 4090 بأربع بطاقات أفضل تكلفة لكل مليون توكن، بين $0.111 و$0.149، مع تقديم جزء كبير من أداء H100.

بعيدًا عن المعايير، تعزز الأبحاث مهمة io.net في توسيع الحوسبة عبر تجميع وحدات معالجة الرسومات الموزعة في مجموعة قابلة للبرمجة وعند الطلب. تضع الشركة منصتها، التي تجمع بين بنية io.cloud القابلة للبرمجة مع أدوات io.intelligence للواجهات البرمجية، كحل متكامل للشركات الناشئة التي تحتاج إلى التدريب، وتنفيذ الوكلاء، والاستدلال واسع النطاق بدون الحاجة إلى استثمار رأسمالي ثقيل في عتاد مراكز البيانات فقط.

المعايير الكاملة والمنهجية متاحة في مستودع io.net على GitHub للراغبين في التعمق في الأرقام وإعادة تنفيذ التجارب. تضيف الدراسة صوتًا مهمًا يستند إلى التجربة العملية في النقاش حول كيفية توسيع عمليات نشر النماذج اللغوية الكبيرة بشكل اقتصادي ومستدام في السنوات القادمة.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • تثبيت