Pada 29 April 2025, raksasa teknologi asal Tiongkok, Alibaba, merilis dan membuka sumber model bahasa besar (LLM) generasi barunya, Qwen3. Lalu, bagaimana performa model baru ini?
Menurut informasi publik, pendahulu dari Qwen3 — model Qwen1.5-110B — tampil sangat baik dalam berbagai pengujian benchmark dan sebanding dengan model Llama3-70B milik Meta.
Dalam pembaruan ini, Qwen3 memperkenalkan mekanisme penalaran hibrida yang menggabungkan kemampuan generatif dari model bahasa tradisional dengan kemampuan penalaran dinamis. Hal ini meningkatkan kinerja model dalam tugas-tugas kompleks, terutama yang membutuhkan penalaran logis dan deduksi bertahap. Berbagai evaluasi menunjukkan bahwa Qwen3 melampaui model-model papan atas seperti DeepSeek-R1 dan OpenAI-o1 dalam sejumlah tolok ukur, termasuk pengkodean, matematika, dan kemampuan umum — menjadikannya salah satu model bahasa besar open source terkuat saat ini.
Lalu, apa saja sorotan dari Qwen3 yang patut dinantikan?
Dukungan Multibahasa & Kompatibilitas Lintas Platform: Selain mendukung bahasa Mandarin dan Inggris, Qwen3 kini juga mendukung lebih dari 29 bahasa, termasuk Jerman, Jepang, dan Prancis. Ini menunjukkan peningkatan signifikan dalam kemampuan lintas bahasa, dan Qwen3 juga memiliki kompatibilitas lintas platform yang sangat baik, sehingga mudah untuk diterapkan di berbagai sistem operasi dan lingkungan perangkat keras.
Kemampuan Penalaran Hibrida: Qwen3 memperkenalkan “mode berpikir” dan “mode non-berpikir.” Ia menggabungkan kemampuan generatif model bahasa tradisional dengan penalaran dinamis, meningkatkan kinerja dalam skenario kompleks, terutama yang melibatkan penalaran logis dan pemecahan masalah bertahap.
Kekuatan Open Source: Alibaba telah membuka sumber seluruh seri Qwen3 (termasuk model andalan) di bawah lisensi Apache 2.0. Langkah ini sangat penting untuk mendorong penyebaran dan pengembangan teknologi AI secara luas.
Rasio Kinerja-Harga Tinggi: Qwen3 menghadirkan performa kelas atas dengan biaya penerapan yang jauh lebih rendah. Sebagai contoh, model andalan Qwen3-235B-A22B hanya membutuhkan 4 GPU H20 untuk diterapkan, sementara model dengan performa serupa seperti DeepSeek-R1 memerlukan 8 atau lebih. Selain itu, pihak komputasi Huawei menyatakan bahwa platform Ascend MindSpeed dan MindIE mereka sejak lama mendukung seri Qwen, dan kini menawarkan dukungan langsung (out-of-the-box) untuk Qwen3, mencapai kompatibilitas 0-Day saat dirilis secara open source.
Setelah Alibaba merilis Qwen3, pendiri Tesla Elon Musk segera memposting di X:
Next week, Grok 3.5 early beta release to SuperGrok subscribers only. It is the first AI that can, for example, accurately answer technical questions about rocket engines or electrochemistry.
Lalu, kejutan apa yang akan dibawa oleh Grok 3.5?
Secara kebetulan, juga hari ini, Meta mengadakan konferensi “LlamaCon” pertamanya. Ini merupakan konferensi pengembang AI pertama yang diadakan oleh Meta, dengan tujuan untuk mempromosikan model open source Llama, menarik lebih banyak pengembang ke dalam ekosistem AI open source, dan bersama-sama mendorong kemajuan teknologi AI generatif.
Masih di hari yang sama, Duolingo — yang memiliki ratusan juta pengguna pembelajar — mengumumkan bahwa mereka akan bertransformasi menjadi perusahaan “AI-first”. Perusahaan ini akan mengadopsi AI secara luas, termasuk dalam rekrutmen, evaluasi kinerja, dan perencanaan tenaga kerja, guna meningkatkan efisiensi operasional.
Kecerdasan buatan terus menunjukkan pengaruh yang semakin besar di seluruh dunia. Baik itu raksasa teknologi maupun perusahaan bintang yang sedang naik daun, tak ada yang ingin tertinggal dari gelombang ini. Jadi, siapa yang akan menjadi pemenang akhirnya?
Membuat konten ini tidak mudah — untuk artikel-artikel menarik lainnya seputar AI, silakan kunjungi: https://iaiseek.com/news