Alibaba Luncurkan Qwen 3: Tantangan Baru untuk DeepSeek pada April 2025

cimporong.com, JAKARTA — Alibaba Grup perusahaan yang merupakan raksasa di bidang teknologi dan e-commerce tersebut berasal dari China ,diketahui sedang mempersiapkan rilis varian paling baru dari desainnya kecerdasan buatan (AI) andalannya yaitu Qwen 3.

Menurut laporan Reuters pada hari Kamis, tanggal 3 April 2025, seorang sumber yang paham tentang rencana itu mengatakan bahwa produk kecerdasan buatan terbaru mungkin akan dirilis di akhir bulan April tahun 2025.

Referensi itu mengatakan bahwa waktu rilis resmi mungkin masih akan diubah dari sasaran yang telah ditetapkan.

Alibaba belum memberikan tanggapan terhadap konfirmasi dari Reuters mengenai spekulasi itu saat dimintai komentar tentang rancangan peluncuran Qwen 3.

Sebagai salah satu raksasa teknologi global, Alibaba semakin gencar meluncurkan produk-produk kecerdasan buatan paling mutakhir guna menghadapi pertumbuhan kompetisi dalam bidang ini, khususnya sesudah munculnya DeepSeek.

Pada bulan Januari yang lalu, Alibaba dengan cepat menanggapi kesuksesan DeepSeek dan mengumumkan peluncuran Qwen 2.5-Max, yaitu varian paling baru dari model AI utama mereka.

Alibaba menyatakan bahwa versi baru ini melebihi kinerja DeepSeek-V3, yang sudah menerima berbagai pujian di tingkat global.

Keputusan Alibaba untuk mengenalkan Qwen 2.5-Max saat awal Tahun Baru Imlek menunjukkan sejauh mana ketatnya persaingan dalam industri AI global.

Di bulan Februari, Reuters melaporkan bahwa DeepSeek sedang menyiapkan rilis versi pengganti dari model R1, yang bersama-sama dengan V3, mendapat respon positif dari lingkungan di Silicon Valley.

DeepSeek telah diumumkan akan meluncurkan versi terbaru dari model mereka sebelum bulan Mei yang akan datang.

Menurut laporan dari Notebookcheck.net, Alibaba mengklaim bahwa Qwen 2.5 Max unggul dibandingkan dengan beberapa model AI terkemuka dari DeepSeek, OpenAI, dan juga Meta di berbagai tes performa.

Model ini dikenal unggul di beberapa aspek penilaian seperti Arena-Hard, LiveBench, LiveCodeBench, MMLU, serta GPQA-Diamond.

Arena Hard menjadi standar yang dipakai untuk mengukur serta menyandingkan tingkat efisiensi respon dari beberapa jenis model A) ketika dihadapkan pada pertanyaan atau permintaan yang diberikan oleh manusia.

Dalam hal ini, Arena Hard merupakan standar utama dalam menilai sejauh mana suatu model kecerdasan buatan mampu memahami serta merespons arahan dari manusia.

Pada saat yang sama, Live Bench terkait dengan kapabilitas dari model kecerdasan buatan (AI) dalam melaksanakan beragam pekerjaan. Dirancang guna mengukur kemampuan kognitif serta pemahaman keseluruhan model AI, Live Bench bertindak sebagai alat evaluatif.

0 Komentar