Microsoft Rilis Phi-3 Mini, Model Bahasa AI Kecil untuk Smartphone

virprom.com – Microsoft mengumumkan model kecerdasan buatan (AI) baru bernama Phi-3 Mini pada Selasa (23 April 2024).

Phi-3 Mini adalah yang pertama dari tiga model bahasa kecil (SLM) yang akan dirilis Microsoft dalam beberapa bulan mendatang. Model bahasa kecerdasan buatan ini dirancang untuk perangkat kecil seperti ponsel pintar.

Seperti namanya, model bahasa kecil Phi-3 Mini dilatih dengan jumlah parameter yang lebih sedikit, sekitar 3,8 miliar parameter.

Sebagai perbandingan, model bahasa besar (LLM) seperti GPT-4 memerlukan sekitar 1,7 triliun parameter untuk dilatih. Parameternya sendiri adalah jumlah instruksi kompleks yang dapat dipahami oleh model AI.

Perbedaan ini masuk akal karena SLM dan LLM mempunyai tujuan yang berbeda. SLM dirancang untuk menjalankan perintah sederhana secara lokal (di perangkat) pada ponsel cerdas dan laptop, memungkinkan usaha kecil untuk menerapkan kecerdasan buatan.

LL.M., di sisi lain, dirancang untuk mensimulasikan kecerdasan manusia secara lebih luas dan oleh karena itu memerlukan lebih banyak daya komputasi. Oleh karena itu, LLM lebih mahal untuk digunakan dibandingkan SLM.

Baca juga: Alat AI baru Microsoft dapat membuat video deepfake hanya berdasarkan foto

“Phi-3 tidak hanya sedikit lebih murah, tapi juga jauh lebih murah. Itu adalah perbedaan biaya 10x dibandingkan model yang ada dengan kemampuan serupa,” kata Sebastien Bubeck, wakil presiden penelitian GenAI di Microsoft.

Menurut Microsoft, Phi-3 akan dengan mudah mengungguli Phi-2 yang akan dirilis pada Desember 2023. Phi-3 dikatakan memberikan respons serupa untuk model 10 kali lebih besar.

Eric Boyd, wakil presiden perusahaan platform Azure AI Microsoft, mengatakan Phi-3 Mini memiliki kemampuan LLM yang setara dengan GPT 3.5 tetapi dalam faktor bentuk yang lebih kecil.

Dua model SLM lain yang akan dirilis di masa depan adalah Phi-3 Small dan Phi-3 Medium. Phi-3 Small dilatih dengan 7 miliar parameter dan Phi-3 Medium dilatih dengan 14 miliar parameter. Pelatihan penggunaan buku dongeng

Boyd juga mengatakan bahwa model bahasa Phi-3 dilatih menggunakan kursus ini. Hal ini sering kali terinspirasi oleh apa yang dipelajari anak-anak dari dongeng, buku dengan kata-kata yang lebih sederhana, dan struktur kalimat yang mencakup topik yang lebih luas.

“Tidak banyak buku anak-anak di luar sana, jadi saya membuat daftar lebih dari 3.000 kata dan meminta LL.M. membuat buku anak-anak untuk mengajarkan Phi,” kata Boyd.

Dia menambahkan bahwa Phi-3 hanya mengembangkan apa yang dipelajari dari pendahulunya. Phi-1 berfokus pada coding dan Phi-2 mulai belajar penalaran. Nah, Phi-3 memiliki kemampuan pengkodean dan penalaran yang lebih baik.

Baca juga: Microsoft dan OpenAI Dikabarkan Kembangkan Stargate, Superkomputer Kecerdasan Buatan Terbesar

Phi-3 masih belum bisa mengungguli GPT-4 dan LLM. Hal ini karena LLM dilatih menggunakan seluruh Internet, sedangkan SLM lebih dibatasi.

Namun, usaha kecil lebih memilih model SLM seperti Phi-3 karena kumpulan data internal lebih kecil dan SLM cenderung lebih murah.

Phi-3 Mini tersedia gratis di platform cloud Azure, platform pemodelan pembelajaran mesin Hugging Face, dan Ollama, kerangka kerja untuk menjalankan model AI di mesin lokal Anda.

KompasTekno memberitakan, Rabu (24 April 2024), mengutip Reuters, SLM juga tersedia di perangkat lunak Nvidia Inference Microservices (NIM) dan dioptimalkan untuk unit pemrosesan grafis (GPU) Nvidia. Dengarkan berita terkini dan cerita pilihan langsung di ponsel Anda. Pilih saluran berita favorit Anda dan kunjungi saluran WhatsApp virprom.com: https://www.whatsapp.com/channel/0029VaFPbedBPzjZrk13HO3D. Pastikan Anda telah menginstal aplikasi WhatsApp.

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *

Back To Top