मई 2025: एआई दौड़ पूरी तरह से तेज हो गई, वैश्विक दिग्गजों ने "मल्टीमॉडल + साकार बुद्धिमत्ता" युद्ध शुरू किया

मई 2025 में, कृत्रिम बुद्धिमत्ता (AI) का क्षेत्र तीन प्रमुख रुझानों — मल्टीमॉडल बड़े मॉडल,具身 बुद्धिमत्ता (Embodied Intelligence), और कम्प्यूटिंग अवसंरचना — के गहन एकीकरण चरण में प्रवेश कर चुका है। Google, Microsoft और NVIDIA जैसी टेक दिग्गज नई मॉडल रिलीज़ और ओपन इकोसिस्टम रणनीतियों के ज़रिए अपनी स्थिति मज़बूत कर रही हैं। वहीं, Anthropic और Baidu जैसी कंपनियां जटिल कार्यों और मल्टीमॉडल इंटरैक्शन में लगातार सफलता हासिल कर रही हैं। Tesla और Huawei AI को भौतिक दुनिया और एंटरप्राइज़ प्रबंधन में तेज़ी से लागू कर रही हैं।

13 मई को जापानी स्टार्टअप Sakana AI ने CTM (Composable Thought Model) नामक नया मॉडल लॉन्च किया, जो AI को मानव मस्तिष्क जैसी सोचने की क्षमता देता है। इसमें "स्टेप-बाय-स्टेप थिंकिंग" प्रणाली का उपयोग किया गया है, जो भूलभुलैया हल करने और छवि पहचान कार्यों में मानव-समान समझ और व्याख्या क्षमता प्रदर्शित करता है। यह具身 बुद्धिमत्ता के क्षेत्र में एक महत्वपूर्ण मील का पत्थर माना जा रहा है।

19 मई को Microsoft ने Windows AI Foundry प्लेटफ़ॉर्म लॉन्च किया, जो एंड-टू-क्लाउड AI विकास को संभव बनाता है। इसमें 1900 से अधिक मुख्यधारा AI मॉडल एकीकृत हैं, और यह मल्टी-डिवाइस एजेंट सहयोग को सपोर्ट करता है। GitHub Copilot को “कोडिंग साथी” के रूप में अपग्रेड किया गया, जिससे डेवलपमेंट की गति 40% तक बढ़ गई। NVIDIA के साथ साझेदारी के चलते, Azure प्लेटफ़ॉर्म में H100 GPU के एकीकरण से AI इंफ्रेंस की गति 50% तक बढ़ी। Microsoft ने Model Context Protocol (MCP) भी पेश किया, जो Windows 11 में मूल रूप से एकीकृत है, जिससे भविष्य की AI एजेंट इकोसिस्टम की नींव रखी गई है।

20 मई को Google ने I/O 2025 सम्मेलन में Gemini 2.5 Pro और Gemini 2.5 Flash मल्टीमॉडल मॉडल्स लॉन्च किए। Pro मॉडल गणित, प्रोग्रामिंग और तर्क में अग्रणी है, जबकि Flash मॉडल उच्च दक्षता और कम लागत पर केंद्रित है। इसके अलावा, Google ने AI Ultra प्रीमियम सेवा, Veo 3 वीडियो जनरेशन टूल, Flow AI वीडियो एडिटर और Imagen 4 इमेज मॉडल भी लॉन्च किए—जो Search, Gmail और डेवलपर टूल्स को AI आधारित “ऑपरेटिंग सिस्टम” में बदलने की दिशा में कदम हैं। इसे OpenAI की बढ़त को टक्कर देने के रूप में देखा जा रहा है।

23 मई को Anthropic ने "Code with Claude" डेवलपर सम्मेलन में Claude Opus 4 और Claude Sonnet 4 पेश किए। Opus 4 जटिल तर्क और लंबे समय तक चलने वाले AI कार्यों के लिए डिजाइन किया गया है, और यह 7 घंटे तक लगातार काम कर सकता है। SWE-bench Verified टेस्ट में दोनों मॉडलों ने GPT-4.1 और Gemini 2.5 Pro को पछाड़ते हुए 79% से अधिक स्कोर प्राप्त किया और AI प्रोग्रामिंग में Claude को अग्रणी बना दिया।

28 मई को AI जगत का "सुपर मंगलवार" बना।

Baidu ने दुनिया का पहला ट्रिलियन-पैरामीटर मल्टीमॉडल मॉडल “Wenxin·Lingmou” लॉन्च किया, जिसमें वॉयस, इमेज, वीडियो और टेक्स्ट का उन्नत एकीकरण है, और यह वित्त, स्वास्थ्य, परिवहन और सुरक्षा जैसे क्षेत्रों में तेजी से उपयोग में आ रहा है।

उसी दिन, Tesla की शंघाई Gigafactory ने Optimus 2.0 ह्यूमनॉइड रोबोट का बड़े पैमाने पर उत्पादन शुरू किया। पहली 1000 इकाइयाँ यांगशान पोर्ट स्मार्ट टर्मिनल को भेजी गईं। D1 AI चिप (200 TOPS) से लैस इस रोबोट की पकड़ने की सटीकता 0.1mm है, और यह प्रति दिन 50 किलोमीटर तक निरीक्षण कर सकता है। इसका दोष पहचान दर मानवों से तीन गुना अधिक है—यह औद्योगिक रोबोटिक्स के लिए नया मानक तय करता है।

उसी दिन NVIDIA ने Computex 2025 में अपनी अगली पीढ़ी की ट्रेनिंग चिप H1000 लॉन्च की, जिसकी FP16 प्रदर्शन क्षमता 5 PFLOPS है और यह ट्रिलियन-पैरामीटर मॉडल को सपोर्ट करती है। GPT-5 की ट्रेनिंग समय 7 दिन से घटकर केवल 48 घंटे रह गया है। Microsoft Azure और Alibaba Cloud पहले ही इसका उपयोग शुरू कर चुके हैं। NVIDIA ने शंघाई में एक नया ऑफिस खोलने की भी घोषणा की।

मई 2025 में AI का विकास चरम पर है। जहाँ Google, Microsoft और NVIDIA जैसे दिग्गज नए मॉडल और इकोसिस्टम से बाज़ार पर पकड़ बनाए हुए हैं, वहीं Anthropic और Baidu जटिल टास्क और मल्टीमॉडल इंटेलिजेंस में नए आयाम छू रहे हैं। लेकिन सबसे ज़्यादा सुर्खियाँ इस महीने अमेरिका की Tesla और चीन की Huawei ने बटोरीं।

अगले महीने AI में क्या क्रांतिकारी बदलाव होंगे? जानने के लिए विज़िट करें: https://iaiseek.com/

लेखक: IAISEEK AI Editorial Teamनिर्माण समय: 2025-06-02 03:02:10
और पढ़ें