Meta Meluncurkan Llama 4, Klaim Lebih Efisien dari DeepSeek-V3

cimporong.com , Jakarta - Chief Excecutive Officer Meta Mark Zuckerberg meluncurkan dua jenis teknologi artificial intelligence (AI) terkini dari versinya Llama 4. Varian model yang diluncurkan adalah Llama 4 Scout, serta Llama 4 Maverick yang disebut memiliki performa lebih hemat dibandingan dengan DeepSeek-V3 dari DeepSeek.

"Hari ini, kami merilis dua versi terbaru dari Llama 4 bersumber bebas. Dua lainnya juga tengah dikembangkan," ungkapanya. Mark pada postingan videonya di halaman Facebook-nya , Minggu, 6 April 2025.

Mark menyebutkan bahwa Llama 4 Scout adalah versi model berparameter aktif yang terdiri atas 17 miliar parameter serta melibatkan 16 spesialis. Kemampuan model ini mencakup pemahaman kontekstual sejauh 10 juta token, di mana setiap token merujuk pada satuan dasar dalam teks yang ditangani oleh sistem pembelajaran mesin tersebut.

Kemudian pada model Llama 4 Maverick Disebutkan bahwa performanya melebihi yang sebelumnya dengan 17 miliar parameter menurut penilaian dari 128 ahli. Mark menyatakan bahwa model ini unggul dibandingkan GPT-4O buatan OpenAI serta Gemini Flash 2 hasil produksi Google. "Model ini lebih ringkas dan hemat sumber daya ketimbang DeepSeek-V3, dikembangkan agar dapat dijalankan dalam satu host sehingga mempermudah tahap inferensi," jelasnya.

DeepSeek-V3, Llama 4 Scout, serta Llama 4 Maverick semuanya merupakan model bahasa besar (Large Language Model) berbasis kecerdasan buatan yang dirancang untuk menginterpretasikan, mengeksekusi perintah, dan memberikan respon terhadap teks.

DeepSeek-V3 diluncurkan sebelumnya pada tanggal 26 Desember 2024. Ini adalah model kecerdasan buatan yang dikembangkan oleh sebuah perusahaan dari China dan berbasis arsitektur Mixture-of-Experts (MoE). Model ini memiliki total 671 miliar parameter, dengan 37 miliar parameter aktif untuk setiap token saat melakukan inferensi. Arsitektur MoE ini serupa pula dengan yang dipakai oleh Llama 4 Maverick.

Berdasarkan analisis komparatif antara Meta, DeepSeek menunjukkan performa yang lebih baik dalam tes Live Code Benchmark dengan skor 45.8 dari total 49.2, sementara itu Llama 4 Maverick mendapatkan skor sebesar 43.4. Selain itu, DeepSeek juga mengungguli pada uji MMLU (Massive Multitask Language Understanding) Pro serta GPQA (Graduate-Level Physics Questions and Answers) Diamond.

Llama 4 Maverick menonjol dalam hal produksi per 1 juta input dan output token, serta memiliki keunggulan di bidang Massive Multi-Discipline Multi-Choice Understanding (MMMU), MathVista, ChartQA, dan DocVQA.

Mark menyebutkan bahwa dua varian berikut dari Llama 4 adalah Llama 4 Reasoning dan Llama 4 Behemoth. Dia menambahkan bahwa kedua versi tersebut diyakini akan menjadi fondasi dengan kinerja terbaik di planet ini. "Meski masih ada pekerjaan yang perlu diselesaikan, namun tujuannya telah jelas," katanya. "Kami siap untuk meluncurkan lebih banyak variasi lagi dalam waktu dekat."

Meta merilis versi awal dari model Llama tahun 2023. Kemudian, Llama berkembang menjadi Llama 2, Llama 3, dan sekarang terdapat Llama 4.

0 Komentar