अलीबाबा ने Qwen3 ओपन-सोर्स कर AI जगत में मचाई हलचल, मस्क ने तुरंत Grok 3.5 किया लॉन्च, ग्लोबल AI मॉडल की जंग शुरू

29 अप्रैल 2025 को, चीन की टेक दिग्गज कंपनी अलीबाबा ने अपनी नई पीढ़ी का टोंगयी चियेनवेन (通义千问) Qwen3 बड़ा भाषा मॉडल (LLM) जारी किया और ओपन-सोर्स कर दिया। तो आखिर इस नए मॉडल का प्रदर्शन कैसा रहा?

सार्वजनिक रूप से उपलब्ध जानकारी के अनुसार, Qwen3 के पूर्ववर्ती Qwen1.5-110B मॉडल ने कई बेंचमार्क परीक्षणों में शानदार प्रदर्शन किया था और यह Meta के Llama3-70B मॉडल के बराबर था।

इस बार के अपडेट में Qwen3 में "हाइब्रिड रीजनिंग मैकेनिज्म" जोड़ा गया है, जो पारंपरिक भाषा मॉडल की जनरेटिव क्षमता और डायनामिक रीजनिंग क्षमता को मिलाकर जटिल कार्यों में बेहतर परिणाम देता है। खासकर लॉजिकल रीजनिंग और मल्टी-स्टेप डिडक्शन जैसे परिदृश्यों में इसकी प्रभावशीलता काफी बढ़ी है। कई परीक्षणों में यह पाया गया कि Qwen3 ने कोडिंग, गणित और सामान्य क्षमताओं सहित कई मानकों पर DeepSeek-R1, OpenAI-o1 जैसे टॉप मॉडलों को पीछे छोड़ दिया है — इसे वर्तमान में सबसे ताकतवर ओपन-सोर्स LLM में से एक माना जा रहा है।  

तो आइए जानते हैं Qwen3 की वो खासियतें जो इसे बेहद खास बनाती हैं:

बहुभाषी समर्थन और क्रॉस-प्लेटफ़ॉर्म संगतता: Qwen3 अब चीनी और अंग्रेजी के साथ-साथ जर्मन, जापानी, फ्रेंच सहित कुल 29 से अधिक भाषाओं का समर्थन करता है। इसका मतलब है कि इसकी बहुभाषी उपयोगिता और बढ़ी है और यह विभिन्न ऑपरेटिंग सिस्टम और हार्डवेयर प्लेटफॉर्म्स पर सहज रूप से चल सकता है।

हाइब्रिड रीजनिंग क्षमता: Qwen3 में "सोचने का मोड" और "नॉन-थिंकिंग मोड" पेश किया गया है। यह पारंपरिक भाषा मॉडल की जनरेटिव क्षमता को डायनामिक रीजनिंग के साथ जोड़ता है, जिससे यह जटिल कार्यों को अधिक प्रभावी ढंग से हल कर सकता है।

ओपन-सोर्स की ताकत: अलीबाबा ने Qwen3 की पूरी श्रृंखला (यहां तक कि फ्लैगशिप मॉडल भी) को Apache 2.0 लाइसेंस के तहत ओपन-सोर्स किया है। यह कदम AI तकनीक के लोकतांत्रिकरण और विकास को बढ़ावा देने में अहम भूमिका निभाएगा।

उच्च लागत-प्रभावशीलता: Qwen3 न सिर्फ बेहतरीन प्रदर्शन देता है बल्कि इसकी डिप्लॉयमेंट लागत भी काफी कम है। उदाहरण के लिए, फ्लैगशिप मॉडल Qwen3-235B-A22B को केवल 4 H20 GPU पर चलाया जा सकता है, जबकि समान प्रदर्शन देने वाले DeepSeek-R1 को 8 या उससे अधिक GPU की आवश्यकता होती है। Huawei का कहना है कि उनके Ascend MindSpeed और MindIE पहले से ही Qwen श्रृंखला को सपोर्ट करते रहे हैं और Qwen3 को रिलीज के साथ ही 0-Day समर्थन मिल गया है।

अलीबाबा द्वारा Qwen3 के रिलीज के तुरंत बाद, टेस्ला के संस्थापक एलन मस्क ने X प्लेटफॉर्म पर यह संदेश साझा किया:
Next week, Grok 3.5 early beta release to SuperGrok subscribers only. It is the first AI that can, for example, accurately answer technical questions about rocket engines or electrochemistry.

तो Grok 3.5 क्या नया सरप्राइज़ लेकर आएगा?

संयोग से, आज ही Meta ने अपना पहला “LlamaCon” सम्मेलन आयोजित किया — यह उनकी पहली AI डेवलपर कॉन्फ्रेंस है। इसका उद्देश्य उनके ओपन-सोर्स Llama मॉडल को बढ़ावा देना, अधिक डेवलपर्स को ओपन-सोर्स AI इकोसिस्टम में शामिल करना और जनरेटिव AI तकनीक को मिलकर आगे बढ़ाना है।

उसी दिन, भाषा सीखने वाले करोड़ों यूज़र्स की कंपनी Duolingo ने खुद को “AI-First” कंपनी में बदलने की घोषणा की। यह कंपनी अब भर्ती, परफॉर्मेंस मूल्यांकन और स्टाफिंग जैसे क्षेत्रों में व्यापक रूप से AI को अपनाने जा रही है ताकि संचालन की दक्षता को बढ़ाया जा सके।

दुनिया भर में आर्टिफिशियल इंटेलिजेंस का प्रभाव तेजी से बढ़ रहा है। चाहे टेक दिग्गज हों या नई उभरती स्टार कंपनियाँ, कोई भी इस लहर से पीछे नहीं रहना चाहता। तो, आखिर विजेता कौन बनेगा?

 

रचनात्मकता की सराहना करें — AI पर और बेहतरीन लेखों के लिए ज़रूर देखें: https://iaiseek.com/news

लेखक: IAISEEK AI Editorial Teamनिर्माण समय: 2025-04-29 16:17:10
और पढ़ें