২০২৫ সালের ২৯ এপ্রিল, চীনের প্রযুক্তি দৈত্য আলিবাবা তার নতুন প্রজন্মের টংই চিয়েনওয়েন (通义千问) Qwen3 ল্যাঙ্গুয়েজ মডেল (LLM) উন্মোচন করেছে এবং ওপেন-সোর্স করে দিয়েছে। এবার এই নতুন মডেলের পারফরম্যান্স কেমন ছিল?
পাবলিক তথ্য অনুযায়ী, Qwen3 মডেলের পূর্বসূরি Qwen1.5-110B মডেল বিভিন্ন বেন্চমার্ক পরীক্ষায় চমত্কার পারফরম্যান্স দেখিয়েছিল এবং এটি মেটার Llama3-70B মডেলের সমতুল্য ছিল।
এই আপডেটের সাথে Qwen3-এ একটি "হাইব্রিড রিজনিং মেকানিজম" যুক্ত করা হয়েছে, যা প্রথাগত ভাষার মডেলের জেনারেটিভ ক্ষমতা এবং ডায়নামিক রিজনিং ক্ষমতাকে একত্রিত করে। এটি মডেলটির কর্মক্ষমতাকে জটিল কাজগুলোতে উন্নত করেছে, বিশেষত এমন কাজগুলোতে যেখানে যৌক্তিক চিন্তা এবং বহু-ধাপ বিশ্লেষণ প্রয়োজন। বিভিন্ন মূল্যায়নে দেখা গেছে, Qwen3 কোডিং, গণিত এবং সাধারণ দক্ষতা সহ বেশ কয়েকটি বেন্চমার্ক পরীক্ষায় DeepSeek-R1, OpenAI-o1 এর মতো শীর্ষ মডেলগুলোকে পেছনে ফেলে দিয়েছে এবং বর্তমানে এটি বিশ্বের সবচেয়ে শক্তিশালী ওপেন-সোর্স ভাষার মডেলগুলোর একটি হয়ে উঠেছে।
তাহলে আলিবাবা যে Qwen3 মডেলটি প্রকাশ করেছে, তার কী কী আকর্ষণীয় বৈশিষ্ট্য রয়েছে?
বহুভাষী সমর্থন এবং ক্রস-প্ল্যাটফর্ম কমপ্যাটিবিলিটি:
Qwen3 শুধুমাত্র চীনা এবং ইংরেজির সমর্থনই প্রদান করেনি, এতে জার্মান, জাপানি, ফরাসি সহ ২৯টি ভাষার সমর্থন রয়েছে। এর মানে হল যে এটি ভাষা পারস্পরিক যোগাযোগের ক্ষেত্রে আরও শক্তিশালী হয়েছে এবং এটি বিভিন্ন অপারেটিং সিস্টেম এবং হার্ডওয়্যার প্ল্যাটফর্মে সহজেই চলতে সক্ষম।
হাইব্রিড রিজনিং ক্ষমতা:
Qwen3 “থিংকিং মোড” এবং “নন-থিংকিং মোড” যুক্ত করেছে, যা প্রথাগত ভাষার মডেলের জেনারেটিভ ক্ষমতা এবং ডায়নামিক রিজনিং ক্ষমতাকে একত্রিত করে, বিশেষ করে এমন জটিল কাজগুলিতে এটি আরও কার্যকর যেখানে যৌক্তিক চিন্তা এবং বহু-ধাপ বিশ্লেষণ প্রয়োজন।
ওপেন-সোর্সের শক্তি:
আলিবাবা তাদের Qwen3 মডেলের সম্পূর্ণ সিরিজ (ফ্ল্যাগশিপ মডেলসহ) ওপেন-সোর্স করেছে, যা Apache 2.0 লাইসেন্স অনুসরণ করে। এটি AI প্রযুক্তির জনপ্রিয়তা এবং উন্নয়নকে এগিয়ে নিয়ে যেতে বড় একটি ভূমিকা পালন করবে।
উচ্চ কস্ট-বেনিফিট:
Qwen3 উত্কৃষ্ট পারফরম্যান্স নিশ্চিত করার পাশাপাশি, স্থাপন খরচও উল্লেখযোগ্যভাবে কমিয়েছে। উদাহরণস্বরূপ, ফ্ল্যাগশিপ মডেল Qwen3-235B-A22B শুধুমাত্র ৪টি H20 GPU তে স্থাপন করা যেতে পারে, যেখানে সমান পারফরম্যান্সের জন্য DeepSeek-R1 এর প্রয়োজন ৮টি বা তারও বেশি GPU। Huawei ঘোষণা করেছে যে তাদের Ascend MindSpeed এবং MindIE প্ল্যাটফর্মগুলি পূর্বে থেকেই Qwen সিরিজ মডেলগুলিকে সমর্থন করছে এবং Qwen3 মুক্তির সঙ্গে সঙ্গেই MindSpeed এবং MindIE তে 0-Day সমর্থন উপলব্ধ।
আলিবাবা Qwen3 প্রকাশ করার পর, টেসলার প্রতিষ্ঠাতা এলন মাস্ক X প্ল্যাটফর্মে একটি বার্তা প্রকাশ করেছেন:
Next week, Grok 3.5 early beta release to SuperGrok subscribers only. It is the first AI that can, for example, accurately answer technical questions about rocket engines or electrochemistry.
তাহলে Grok 3.5 কি নতুন সাফল্য নিয়ে আসবে?
এমনকী আজ, Meta তাদের প্রথম “LlamaCon” সম্মেলন আয়োজন করেছে, যা তাদের প্রথম AI ডেভেলপার কনফারেন্স। এর উদ্দেশ্য হচ্ছে তাদের ওপেন-সোর্স Llama মডেলকে আরও প্রচার করা এবং আরও বেশি ডেভেলপারদের ওপেন-সোর্স AI ইকোসিস্টেমে যোগ দেওয়ার জন্য উৎসাহিত করা, যাতে একসাথে AI জেনারেটিভ প্রযুক্তি উন্নয়ন করতে সহায়তা করা যায়।
আজই, বিশ্বের কোটি কোটি ব্যবহারকারী সমৃদ্ধ Duolingo তাদের ব্যবসা “AI-first” কোম্পানিতে রূপান্তরিত করার ঘোষণা দিয়েছে। তারা AI প্রযুক্তি ব্যাপকভাবে গ্রহণ করবে, যেমন নিয়োগ, কর্মক্ষমতা মূল্যায়ন এবং কর্মী সংস্থান ক্ষেত্রেও এটি ব্যবহার করবে।
বিশ্বজুড়ে কৃত্রিম বুদ্ধিমত্তার প্রভাব দিন দিন বাড়ছে। বড় প্রযুক্তি কোম্পানি বা স্টার্টআপ, কেউই এই সুযোগ মিস করতে চায় না। তবে শেষ পর্যন্ত কে হবে বিজয়ী?
সৃষ্টি সম্মান করুন — AI সম্পর্কিত আরও চমৎকার লেখার জন্য, দেখুন: https://iaiseek.com/news