Pada Mei 2025, bidang kecerdasan buatan memasuki fase integrasi mendalam dengan tiga tren utama: model multimodal besar, kecerdasan yang terwujud (embodied intelligence), dan infrastruktur komputasi. Raksasa teknologi seperti Google, Microsoft, dan NVIDIA mengukuhkan kepemimpinan mereka melalui peluncuran model baru dan strategi ekosistem terbuka. Sementara itu, perusahaan seperti Anthropic dan Baidu membuat terobosan dalam pemrosesan tugas kompleks dan interaksi lintas modal. Tesla dan Huawei mempercepat penerapan AI di dunia fisik dan skenario manajemen tingkat perusahaan.
Pada tanggal 13 Mei, startup Jepang Sakana AI merilis model baru mereka CTM (Composable Thought Model), yang memberikan kemampuan penalaran AI yang lebih mendekati otak manusia. Model ini menggunakan mekanisme “berpikir langkah demi langkah” dan menunjukkan interpretabilitas serta pemahaman menyerupai manusia dalam menyelesaikan labirin dan tugas pengenalan gambar — menandai tonggak penting dalam penelitian kecerdasan yang terwujud.
Pada tanggal 19 Mei, Microsoft meluncurkan platform Windows AI Foundry, mewujudkan sistem pengembangan AI end-to-cloud. Platform ini mengintegrasikan lebih dari 1.900 model mainstream dan mendukung kolaborasi agen lintas perangkat. GitHub Copilot juga diupgrade menjadi “coding companion,” meningkatkan efisiensi pengembangan sekitar 40%. Berkat kolaborasi mendalam dengan NVIDIA, platform Azure Microsoft — yang kini terintegrasi dengan GPU H100 — meningkatkan kecepatan inferensi hingga 50%. Microsoft juga mengusulkan Model Context Protocol (MCP), yang terintegrasi secara native di Windows 11, meletakkan dasar bagi ekosistem agen tujuan umum di masa depan.
Pada tanggal 20 Mei, Google mengungkap model Gemini 2.5 Pro dan Gemini 2.5 Flash di konferensi I/O 2025. Gemini 2.5 Pro memimpin dalam matematika, pemrograman, dan penalaran logis, mendukung pemahaman suara dan video multibahasa, sementara Flash fokus pada efisiensi tinggi dan biaya rendah. Google juga memperkenalkan layanan langganan AI Ultra, alat pembuatan video Veo 3, alat pengeditan video Flow AI, dan model gambar Imagen 4 — secara menyeluruh merombak pencarian, Gmail, dan alat pengembangan, dengan tujuan membangun “sistem operasi” AI tertutup. Langkah ini dianggap sebagai jawaban kuat Google terhadap dominasi terbaru OpenAI.
Pada tanggal 23 Mei, Anthropic mengadakan konferensi pengembang “Code with Claude,” meluncurkan model Claude Opus 4 dan Claude Sonnet 4. Opus 4 mengkhususkan diri dalam penalaran kompleks dan tugas AI berdurasi panjang, mampu berjalan hingga 7 jam terus menerus — memecahkan batas ketahanan pemrograman AI saat ini. Sonnet 4 menyeimbangkan kinerja dan biaya. Dalam tolok ukur resmi SWE-bench Verified, keduanya meraih skor di atas 79%, melampaui GPT-4.1 dan Gemini 2.5 Pro, memperkuat kepemimpinan Claude dalam pengembangan perangkat lunak.
Tanggal 28 Mei menjadi “Super Tuesday” bagi AI.
Baidu meluncurkan model multimodal triliun parameter pertama di dunia, “Wenxin·Lingmou,” dengan kemampuan penggabungan suara, gambar, video, dan teks yang kuat. Model ini meningkatkan pemahaman dunia nyata dan menjanjikan aplikasi luas di bidang keuangan, kesehatan, transportasi, dan keamanan.
Pada hari yang sama, Gigafactory Tesla di Shanghai mulai memproduksi massal robot humanoid Optimus 2.0. Seribu unit pertama dikirim ke terminal pintar Pelabuhan Yangshan. Dilengkapi dengan chip AI D1 buatan Tesla (200 TOPS), robot ini memiliki presisi 0,1 mm, jangkauan inspeksi harian 50 km, dan tingkat deteksi kegagalan tiga kali lebih tinggi dibandingkan inspeksi manusia — menetapkan standar baru untuk robotika industri.
Juga pada 28 Mei, NVIDIA membuat gebrakan di Computex 2025 dengan meluncurkan chip pelatihan generasi berikutnya, H1000, dengan performa FP16 sebesar 5 PFLOPS dan dukungan pelatihan model triliun parameter. Waktu pelatihan GPT-5 turun dari 7 hari menjadi hanya 48 jam. Microsoft Azure dan Alibaba Cloud sudah mengimplementasikan chip ini. NVIDIA juga mengumumkan kantor baru di Shanghai untuk memperdalam kehadirannya di Cina.
Mei 2025 menjadi bulan bersejarah lainnya untuk AI. Sementara raksasa teknologi seperti Google, Microsoft, dan NVIDIA terus membentuk masa depan dengan model dan ekosistem baru, perusahaan seperti Anthropic dan Baidu mendorong batas kompleksitas tugas dan kecerdasan multimodal. Namun, mungkin berita terbesar datang dari Tesla di AS dan Huawei di Cina.
Terobosan apa yang akan dibawa Juni? Pantau terus di: https://iaiseek.com/