Alibaba Rilis Qwen3-Coder, Model AI untuk Coding

Perusahaan teknologi asal China, Alibaba, resmi merilis model kecerdasan buatan (AI) terbaru bernama Qwen3-Coder. Model AI ini hadir untuk membantu proses pemrograman dan diklaim sebagai alat coding AI "paling canggih" dibanding pesaingnya.
Disebut begitu karena Qwen3-Coder mampu mencatat skor paling tinggi dibanding model-model AI lain seperti GPT-4.1 buatan OpenAI dan Gemini 2.5 Pro buatan Google.
Dalam uji benchmark SWE-bench Verified, Qwen3-Coder mencetak nilai 67 persen (standar) dan 69,6 persen (versi 500-turn).
Sebagai perbandingan, GPT-4.1 hanya mampu mencapai 54,6 persen, sedangkan Gemini 2.5 Pro adalah 49 persen.
Model ini juga berhasil mendapatkan skor kompetitif di berbagai tugas seperti penggunaan peramban agen, pemrograman multibahasa, dan penggunaan alat.
Performa dan "kecanggihan" Qwen3-Coder diakui oleh salah satu peneliti model bahasa besar (Large Language Model/LLM), Sebastian Raschka. Dalam sebuah posting di akun X (dulu Twitter) pribadinya, ia menyebut ini merupakan model pengodean terbaik.
"Ini mungkin model pengodean terbaik sejauh ini. Tujuan umum memang keren, tetapi jika Anda menginginkan yang terbaik dalam pengodean, spesialisasi adalah pemenangnya," tulis Raschka.
Qwen3-Coder sendiri merupakan model AI open-source yang berfokus pada pengembangan perangkat lunak. Model ini dirancang khusus untuk menyelesaikan tugas-tugas kompleks seperti pembuatan aplikasi, hanya dalam waktu singkat.
Arsitektur dan kemampuan Qwen3-Coder
Menurut dokumentasi yang dirilis tim Qwen, Qwen3-Coder dibuat dengan arsitektur Mixture-of-Experts (MoE) dan memiliki total 480 miliar parameter dengan 35 miliar parameter aktif per kueri.
Alibaba membekali model ini dengan teknik YaRN (Yet Another Rope ExtrapolatioN). Ini merupakan sebuah teknik yang digunakan untuk memperluas panjang konteks model bahasa hingga melampaui batas pelatihan aslinya.
Lewat modifikasi rotary positional embedding (RoPE), model Qwen3-Coder mampu mendukung panjang konteks hingga 256.000 token secara native dan dapat diperluas hingga 1 juta token tambahan.
Qwen3-Coder memiliki 62 lapisan (layers) dan 96 attention head untuk query, dan delapan kepala key-value pairs. Dukungan tersebut digunakan untuk mengoptimalkan efisiensi pemrosesan token dan menjaga konteks dalam instruksi panjang.
Optimalisasi juga dilakukan dengan model yang menghilangkan dukungan untuk blok <think> secara default. Dengan begitu, output yang dihasilkan model akan lebih sederhana.
Pelatihan canggih
Dalam proses pelatihannya, Alibaba memakai 7,5 triliun token dengan proporsi 70 persen kode pemrograman. Selain itu, model Qwen3-Coder juga mendapatkan beberapa pelatihan canggih seperti teknik Code RL (Reinforcement Learning) dan long-horizon agent RL.
Core RL menekankan pada pelatihan berkualitas tinggi yang didorong oleh eksekusi pada tugas kode beragam dan dapat diverifikasi.
Sedangkan long-horizon agent RL lebih ke melatih model AI untuk merencanakan, menggunakan alat, dan beradaptasi melalui interaksi multi-turn interactions.
Untuk mendukung fase pelatihan ini, Alibaba juga membangun sistem simulasi dengan 20.000 lingkungan virtual di Alibaba Cloud. Tujuannya adalah mensimulasikan tantangan nyata dalam rekayasa perangkat lunak seperti yang diujikan dalam benchmark SWE-bench.
Tersedia gratis
Model AI Qwen3-Coder tersedia secara gratis di platform Huggung Face dan GitHub, di bawah lisensi Apache 2.0. Dengan lisensi ini, artinya pengembang dan perusahaan bisa mengunduh, memodifikasi, dan menggunakan model secara bebas, termasuk untuk kebutuhan komersial karena sifatnya yang open-source atau terbuka.
Pengembang dan perusahaan yang tertarik mengunduhnya dapat menemukan kodenya di repositori berbagi kode AI Hugging Face.
Bagi pengguna yang tidak ingin meng-host model AI Qwen3-Coder sendiri, Alibaba juga menyediakan akses melalui Qwen API di Alibaba Cloud, dengan format penggunaan berbasis token.
Biaya Qwen3-Coder
Adapun biaya penggunaan Qwen3-Coder melalui API Qwen bervariasi tergantung panjang konteks dan jumlah token.
Untuk konteks hingga 32.000 token, tarifnya adalah 1 dollar AS (sekitar Rp 16.315) per juta token input, dan, 5 dollar AS (sekitar Rp 81.575) per juta token output.
Jika menggunakan konteks yang lebih panjang, biayanya akan meningkat secara bertahap. Berikut rinciannya, sebagaimana dihimpun KompasTekno dari laman VentureBeat, Minggu (27/7/2025):
- Hingga 128.000 token: 1,8 / 9 dollar AS (sekitar Rp 29.367 / Rp 146.835)
- Hingga 256.000 token: 3 / 15 dollar AS (sekitar Rp 48.945 / Rp 244.725)
- Hingga 1 juta token: 6 / 60 dollar AS (sekitar Rp 97.890 / Rp 1 jutaan)
Model AI Qwen3-Coder juga terintegrasi dengan platform pengembang seperti:
- Kode Claude (melalui proxy DashScope atau kustomisasi router)
- Cline (sebagai backend yang kompatibel dengan OpenAI)
- Ollama, LMStudio, MLX-LM, llama.cpp dan KTransformers