Microsoft, NVIDIA GPU'larında eğitilmiş Multimodal SLM'leri Tanıtıyor

robot
Abstract generation in progress

James Ding'in fotoğrafı.

26 Şub 2025 15:38

Microsoft, NVIDIA GPU'lar üzerinde eğitilmiş olan multimodal Phi-4 dahil olmak üzere yeni Phi SLM'lerini duyuruyor, verimli kaynak kullanımı ile AI kapasitelerini artırıyor.

Microsoft, NVIDIA GPU'ları üzerinde eğitilen Multimodal SLMs'yi Tanıtıyor

Microsoft, Phi ailesinin küçük dil modelleri (SLMs)'nın son eklemelerini duyurdu; yeni Phi-4-multimodal ve Phi-4-mini modelleri, her ikisi de NVIDIA GPU'ları kullanılarak eğitildi. Bu gelişme, NVIDIA’ya göre dil modellerinin verimlilik ve çok yönlülük odaklı evriminde önemli bir adımı temsil ediyor.

Küçük Dil Modellerinde İlerlemeler

SLM'ler, kapasitelerine rağmen önemli hesaplama kaynakları gerektiren büyük dil modelleri (LLM'ler) tarafından ortaya çıkan zorluklara pratik bir çözüm olarak ortaya çıktı. SLM'ler, sınırlı bellek ve hesaplama gücüne sahip cihazlara dağıtım için uygun olmaları amacıyla etkili bir şekilde çalışacak şekilde tasarlanmıştır.

Microsoft'ın yeni Phi-4-çoklu modal modeli özellikle metin, ses ve görüntü gibi birden fazla veri türünü işleme yeteneği nedeniyle dikkat çekicidir. Bu yetenek, otomatik konuşma tanıma, çeviri ve görsel akıl yürütme gibi uygulamalar için yeni olanaklar sunar. Modelin eğitimi, yeteneklerini elde etmek için gereken yoğun hesaplama çabalarını vurgulayan 21 gün boyunca 512 NVIDIA A100-80GB GPU'yu içeriyordu.

Phi-4-çok modlu ve Phi-4-mini

Phi-4-çoklu model, 5.6 milyar parametreye sahiptir ve otomatik konuşma tanıma alanında üstün performans sergilemiştir, Huggingface OpenASR lider tablosunda birinci sırada yer alarak %6.14 kelime hata oranı ile. Bu başarı, modelin konuşma tanıma teknolojilerini geliştirme potansiyelini vurgulamaktadır.

Phi-4-multimodal'a ek olarak, Microsoft ayrıca sohbet uygulamaları için optimize edilmiş metin tabanlı bir model olan Phi-4-mini'yi tanıttı. 3.8 milyar parametre ile Phi-4-mini, uzun biçimli içerikleri verimli bir şekilde işlemek üzere tasarlanmış olup 128K tokenlık bir bağlam penceresi sunmaktadır. Eğitimi, modelin yüksek kaliteli eğitim verileri ve kodlarına odaklanmasını yansıtan 1024 NVIDIA A100 80GB GPU üzerinde 14 gün boyunca gerçekleştirildi.

Dağıtım ve Erişilebilirlik

Her iki model de, AI uygulamaları tasarlama, özelleştirme ve yönetme platformu sunan Microsoft'un Azure AI Dökümhanesi'nde mevcuttur. Kullanıcılar ayrıca bu modelleri NVIDIA API Kataloğu aracılığıyla keşfedebilirler, bu da bu modelleri çeşitli uygulamalara test etme ve entegre etme amacıyla bir kum havuzu ortamı sunar.

NVIDIA'nın Microsoft ile işbirliği, sadece bu modellerin eğitimini yapmakla sınırlı kalmaz. Ortaklık, Phi gibi yazılımları ve modelleri optimize etmeyi içerir, bu da yapay zeka şeffaflığını teşvik etmeyi ve açık kaynaklı projeleri desteklemeyi amaçlar. Bu işbirliği, sağlık alanından yaşam bilimlerine kadar endüstrilerde yapay zeka teknolojisini ilerletmeyi amaçlamaktadır.

Daha fazla detaylı bilgi için NVIDIA blogunu ziyaret edin.

Görüntü kaynağı: Shutterstock

View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Reward
  • Comment
  • Repost
  • Share
Comment
0/400
No comments
  • Pin
Trade Crypto Anywhere Anytime
qrCode
Scan to download Gate App
Community
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)