Facebook Rilis Llama 3.1, Model AI Gratis Sekelas GPT-4

virprom.com – Meta (perusahaan induk Facebook, Instagram, WhatsApp) meluncurkan Large Language Model (LLM) terbarunya, Llama 3.1 405B, pada Selasa (23/7/2024).

Llama 3.1 405B diklaim sebagai model bahasa besar sumber terbuka dan gratis pertama, dengan kinerja setara dengan model kecerdasan buatan (AI) kelas atas seperti GPT-4o dan GPT-4 OpenAI, Claude 3.5 Sonnet, dan Google Gemini. 1.5 Prof

Karena gratis, pengguna dapat mengunduh Llama 3.1 405B di komputernya dan kemudian menjalankannya secara gratis. Namun, tentunya pengguna membutuhkan komputer dengan fitur mumpuni.

Baca Juga: OpenAI Merilis Model AI GPT-4o Mini, Ringan, Cerdas, dan Berbiaya Rendah

Sedangkan open source artinya pengguna dapat memodifikasi atau menyempurnakan model bahasa besar, berbeda dengan model bisnis perusahaan AI lain, seperti OpenAI, yang justru memonetisasi model bahasa besar.

Kehadiran model bahasa besar Llama 3.1 405B diumumkan melalui blog resmi Meta.

“Kami secara publik merilis Meta Llama 3.1 405B, yang kami yakini merupakan model bahasa terbesar dan paling terbuka di dunia,” tulis Meta di blog resminya.

“Llama 3.1 405B adalah model (bahasa besar) pertama yang tersedia secara terbuka dan mampu bersaing dengan model AI terbaik dalam hal kemampuan tingkat lanjut seperti kesadaran umum, pengendalian, matematika, penggunaan alat, dan penerjemahan ke berbagai bahasa,” tambah Meta.

Baca Juga: Microsoft, Meta, Google dan Amazon Bersaing dalam Investasi AI pada tahun 2024

Secara detail, meta test menunjukkan bahwa Llama 3.1 405B mampu mengungguli Nemotron 4 340B Instruct, GPT-4, GPT-4o, dan Cloud 3.5 Sonnet pada pengujian IFEval, GSM8K, ARC Challenge, Nexus, dan ZeroSCROLLS/QALITY.

Hal ini dimungkinkan karena Llama 3.1 405B memiliki 405 miliar parameter dan dilatih menggunakan lebih dari 15 triliun token data dengan 16.000 unit pemrosesan grafis (GPU) Nvidia H100.

Perlu diketahui, hasil benchmark tersebut merupakan hasil evaluasi Meta. Oleh karena itu, hasil ini tidak memperhitungkan pengalaman subjektif dalam berinteraksi dengan model bahasa AI.

Yang jelas, Meta memastikan Llama 3.1 405B berguna untuk peringkasan teks panjang, agen percakapan multibahasa dan asisten pengkodean, serta untuk menghasilkan data buatan yang digunakan untuk melatih model bahasa AI di masa depan.

Pembuatan data sintetis secara resmi didukung oleh lisensi Meta Llama 3.1 untuk pertama kalinya.

Saat bekerja sama dengan Amazon, Databricks, Nvidia, IBM, dan perusahaan lain untuk meluncurkan berbagai layanan yang membantu pengembang atau perusahaan meningkatkan dan melatih model AI mereka sendiri.

Selain Llama 3.1 405B, Meta juga menjalankan upgrade ke Llama 8B dan 70B. Sekarang, keduanya memiliki dukungan multibahasa dan panjang referensi yang diperluas (kapasitas memori LLM) sebesar 128,000 token.

Model bahasa besar Llama 3.1 405B, 8B, dan 70B diunduh dari situs Meta resmi. Llama 3.1 405B juga sudah bisa diuji coba di chatbot Meta AI, namun hingga saat ini Indonesia belum mendapatkan Meta AI.

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *

Back To Top