2026-01-14 23:22:00

هل من معنى لتخزين كل زوج KV؟ خاصة عندما يكون النموذج في الواقع سيستعلم فقط جزءًا صغيرًا منها.

فكرة KVzap مباشرة جدًا — من خلال التعلم لتحديد أي إدخالات التخزين المؤقت غير المستخدمة في الاستعلامات اللاحقة، ثم حذفها بشكل استباقي. النتيجة هي القدرة على ضغط حجم التخزين المؤقت إلى النصف أو الربع من الحجم الأصلي، مع تقليل التأثير على الأداء تقريبًا.

هذه الطريقة الذكية والاعتمادية ديناميكيًا في تقليم ذاكرة التخزين المؤقت KV لها أهمية عملية في تحسين كفاءة استنتاج النموذج وتقليل تكاليف التخزين. خاصة في سيناريوهات النشر على نطاق واسع، فإن مساحة التحسين هذه لا تزال ذات قيمة كبيرة.

شاهد النسخة الأصلية

قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.

تسجيلات الإعجاب 10