Microsoft memperkenalkan Phi SLM baru, termasuk Phi-4 multimodal, terlatih di GPU NVIDIA, meningkatkan kemampuan AI dengan penggunaan sumber daya yang efisien.
Microsoft telah mengumumkan penambahan terbaru ke keluarga Phi nya dari model bahasa kecil (SLMs), menampilkan model Phi-4-multimodal dan Phi-4-mini baru, keduanya dilatih menggunakan GPU NVIDIA. Pengembangan ini menandai langkah signifikan dalam evolusi model bahasa, berfokus pada efisiensi dan keberagaman, menurut NVIDIA.
###Kemajuan dalam Model Bahasa Kecil
SLM telah muncul sebagai solusi praktis untuk tantangan yang ditimbulkan oleh model bahasa besar (LLMs), yang, meskipun memiliki kemampuan, memerlukan sumber daya komputasi yang substansial. SLM dirancang untuk beroperasi secara efisien dalam lingkungan terbatas, sehingga cocok untuk diimplementasikan pada perangkat dengan memori terbatas dan daya komputasi.
Model multimodal Phi-4 baru Microsoft sangat mencolok karena kemampuannya dalam memproses berbagai jenis data, termasuk teks, audio, dan gambar. Kemampuan ini membuka kemungkinan baru untuk aplikasi seperti pengenalan suara otomatis, terjemahan, dan penalaran visual. Pelatihan model melibatkan 512 GPU NVIDIA A100-80GB selama 21 hari, menekankan upaya komputasi intensif yang diperlukan untuk mencapai kemampuannya.
###Phi-4-multimodal dan Phi-4-mini
Model multimodal Phi-4 menawarkan 5,6 miliar parameter dan telah menunjukkan kinerja superior dalam pengenalan suara otomatis, peringkat pertama di papan peringkat OpenASR Huggingface dengan tingkat kesalahan kata 6,14%. Pencapaian ini menyoroti potensi model dalam meningkatkan teknologi pengenalan suara.
Selain Phi-4-multimodal, Microsoft juga memperkenalkan Phi-4-mini, sebuah model teks saja yang dioptimalkan untuk aplikasi obrolan. Dengan 3,8 miliar parameter, Phi-4-mini dirancang untuk menangani konten berbentuk panjang secara efisien, menawarkan jendela konteks 128K token. Pelatihannya melibatkan 1024 GPU NVIDIA A100 80GB selama 14 hari, mencerminkan fokus model pada data dan kode pendidikan berkualitas tinggi.
###Penempatan dan Aksesibilitas
Kedua model tersebut tersedia di Azure AI Foundry milik Microsoft, yang menyediakan platform untuk merancang, menyesuaikan, dan mengelola aplikasi kecerdasan buatan. Pengguna juga dapat menjelajahi model-model ini melalui Katalog API NVIDIA, yang menawarkan lingkungan uji coba untuk menguji dan mengintegrasikan model-model ini ke berbagai aplikasi.
Kolaborasi NVIDIA dengan Microsoft tidak hanya sebatas melatih model-model ini. Kemitraan ini mencakup mengoptimalkan perangkat lunak dan model seperti Phi untuk mempromosikan transparansi kecerdasan buatan dan mendukung proyek sumber terbuka. Kolaborasi ini bertujuan untuk memajukan teknologi kecerdasan buatan di berbagai industri, mulai dari perawatan kesehatan hingga ilmu kehidupan.
Untuk informasi lebih detail, kunjungi blog NVIDIA.
Sumber gambar: Shutterstock
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
Microsoft Memperkenalkan SLM Multimodal yang Dilatih pada GPU NVIDIA
James Ding
26 Feb 2025 15:38
Microsoft memperkenalkan Phi SLM baru, termasuk Phi-4 multimodal, terlatih di GPU NVIDIA, meningkatkan kemampuan AI dengan penggunaan sumber daya yang efisien.
Microsoft telah mengumumkan penambahan terbaru ke keluarga Phi nya dari model bahasa kecil (SLMs), menampilkan model Phi-4-multimodal dan Phi-4-mini baru, keduanya dilatih menggunakan GPU NVIDIA. Pengembangan ini menandai langkah signifikan dalam evolusi model bahasa, berfokus pada efisiensi dan keberagaman, menurut NVIDIA.
###Kemajuan dalam Model Bahasa Kecil
SLM telah muncul sebagai solusi praktis untuk tantangan yang ditimbulkan oleh model bahasa besar (LLMs), yang, meskipun memiliki kemampuan, memerlukan sumber daya komputasi yang substansial. SLM dirancang untuk beroperasi secara efisien dalam lingkungan terbatas, sehingga cocok untuk diimplementasikan pada perangkat dengan memori terbatas dan daya komputasi.
Model multimodal Phi-4 baru Microsoft sangat mencolok karena kemampuannya dalam memproses berbagai jenis data, termasuk teks, audio, dan gambar. Kemampuan ini membuka kemungkinan baru untuk aplikasi seperti pengenalan suara otomatis, terjemahan, dan penalaran visual. Pelatihan model melibatkan 512 GPU NVIDIA A100-80GB selama 21 hari, menekankan upaya komputasi intensif yang diperlukan untuk mencapai kemampuannya.
###Phi-4-multimodal dan Phi-4-mini
Model multimodal Phi-4 menawarkan 5,6 miliar parameter dan telah menunjukkan kinerja superior dalam pengenalan suara otomatis, peringkat pertama di papan peringkat OpenASR Huggingface dengan tingkat kesalahan kata 6,14%. Pencapaian ini menyoroti potensi model dalam meningkatkan teknologi pengenalan suara.
Selain Phi-4-multimodal, Microsoft juga memperkenalkan Phi-4-mini, sebuah model teks saja yang dioptimalkan untuk aplikasi obrolan. Dengan 3,8 miliar parameter, Phi-4-mini dirancang untuk menangani konten berbentuk panjang secara efisien, menawarkan jendela konteks 128K token. Pelatihannya melibatkan 1024 GPU NVIDIA A100 80GB selama 14 hari, mencerminkan fokus model pada data dan kode pendidikan berkualitas tinggi.
###Penempatan dan Aksesibilitas
Kedua model tersebut tersedia di Azure AI Foundry milik Microsoft, yang menyediakan platform untuk merancang, menyesuaikan, dan mengelola aplikasi kecerdasan buatan. Pengguna juga dapat menjelajahi model-model ini melalui Katalog API NVIDIA, yang menawarkan lingkungan uji coba untuk menguji dan mengintegrasikan model-model ini ke berbagai aplikasi.
Kolaborasi NVIDIA dengan Microsoft tidak hanya sebatas melatih model-model ini. Kemitraan ini mencakup mengoptimalkan perangkat lunak dan model seperti Phi untuk mempromosikan transparansi kecerdasan buatan dan mendukung proyek sumber terbuka. Kolaborasi ini bertujuan untuk memajukan teknologi kecerdasan buatan di berbagai industri, mulai dari perawatan kesehatan hingga ilmu kehidupan.
Untuk informasi lebih detail, kunjungi blog NVIDIA.
Sumber gambar: Shutterstock