২০২৫ সালের মে: এআই প্রতিযোগিতা সম্পূর্ণভাবে ত্বরান্বিত, বিশ্বব্যাপী জায়ান্টরা "মাল্টিমোডাল + সাকার বুদ্ধিমত্তা" যুদ্ধ শুরু করেছে

২০২৫ সালের মে মাসে কৃত্রিম বুদ্ধিমত্তা ক্ষেত্র তিনটি প্রধান প্রবণতার মধ্যে গভীর সংহতকরণ পর্যায়ে প্রবেশ করেছে: বড় মাল্টিমোডাল মডেল, ইম্বোডিড ইন্টেলিজেন্স এবং কম্পিউটেশনাল অবকাঠামো। গুগল, মাইক্রোসফট এবং এনভিডিয়া মতো প্রযুক্তি জায়ান্টরা নতুন মডেল রিলিজ এবং ওপেন ইকোসিস্টেম কৌশলগুলোর মাধ্যমে তাদের নেতৃত্ব সুদৃঢ় করছে। অন্যদিকে, Anthropic এবং Baidu জটিল কাজ প্রক্রিয়াকরণ ও ক্রস-মোডাল ইন্টারঅ্যাকশনে নতুন অগ্রগতি করছে। Tesla এবং Huawei বাস্তব জগত ও এন্টারপ্রাইজ লেভেলের ব্যবস্থাপনা ক্ষেত্রে এআই স্থাপনায় গতি বৃদ্ধি করছে।

১৩ মে, জাপানি স্টার্টআপ Sakana AI তাদের নতুন মডেল CTM (Composable Thought Model) প্রকাশ করেছে, যা কৃত্রিম বুদ্ধিমত্তাকে মানুষের মস্তিষ্কের কাছাকাছি যুক্তি দেওয়ার ক্ষমতা প্রদান করে। এটি একটি "পর্যায়ক্রমে চিন্তা" পদ্ধতি ব্যবহার করে এবং ম্যাজ এবং ইমেজ রিকগনিশন কাজগুলোতে মানবসদৃশ ব্যাখ্যা এবং বোঝাপড়া প্রদর্শন করে — যা ইম্বোডিড ইন্টেলিজেন্স গবেষণায় একটি গুরুত্বপূর্ণ মাইলফলক।

১৯ মে, মাইক্রোসফট উইন্ডোজ AI Foundry প্ল্যাটফর্ম চালু করে, যা এন্ড-টু-ক্লাউড এআই ডেভেলপমেন্ট সিস্টেম অর্জন করেছে। এটি ১,৯০০টির বেশি প্রধান মডেল একত্রিত করে এবং ক্রস-ডিভাইস এজেন্ট সহযোগিতা সমর্থন করে। GitHub Copilot আপগ্রেড হয়ে “কোডিং কম্প্যানিয়ন” হয়েছে, যা ডেভেলপমেন্ট দক্ষতা প্রায় ৪০% বাড়িয়েছে। NVIDIA-র সাথে ঘনিষ্ঠ সহযোগিতায় মাইক্রোসফটের Azure প্ল্যাটফর্ম—এখন H100 GPU-সহ—ইনফারেন্স গতি ৫০% বৃদ্ধি পেয়েছে। মাইক্রোসফট Model Context Protocol (MCP) প্রস্তাব করেছে, যা উইন্ডোজ ১১-এ নেটিভ ইন্টিগ্রেটেড, ভবিষ্যতের সাধারণ উদ্দেশ্যের এজেন্ট ইকোসিস্টেমের জন্য ভিত্তি স্থাপন করছে।

২০ মে, গুগল তাদের I/O 2025 সম্মেলনে Gemini 2.5 Pro এবং Gemini 2.5 Flash মডেল উন্মোচন করে। Gemini 2.5 Pro গণিত, প্রোগ্রামিং এবং যৌক্তিক চিন্তায় নেতৃত্ব দেয়, বহুভাষিক কণ্ঠ ও ভিডিও বোঝাপড়া সমর্থন করে, আর Flash উচ্চ কার্যকারিতা ও কম খরচে ফোকাস করে। গুগল AI Ultra সাবস্ক্রিপশন সার্ভিস, Veo 3 ভিডিও জেনারেশন টুল, Flow AI ভিডিও এডিটিং টুল এবং Imagen 4 ইমেজ মডেলও উপস্থাপন করেছে — সার্চ, Gmail এবং ডেভেলপমেন্ট টুলগুলোর পূর্ণাঙ্গ রূপান্তর ঘটিয়ে একটি AI “অপারেটিং সিস্টেম” নির্মাণের লক্ষ্যে। এটি OpenAI-এর সাম্প্রতিক আধিপত্যের প্রতি গুগলের শক্তিশালী জবাব হিসাবে দেখা হচ্ছে।

২৩ মে, Anthropic তাদের “Code with Claude” ডেভেলপার সম্মেলন অনুষ্ঠিত করে, Claude Opus 4 এবং Claude Sonnet 4 মডেল উন্মোচন করে। Opus 4 জটিল যুক্তি এবং দীর্ঘস্থায়ী এআই কাজের জন্য বিশেষায়িত, যা ৭ ঘণ্টা পর্যন্ত অবিরত চালাতে পারে — যা এআই প্রোগ্রামিং ধৈর্যের বর্তমান সীমা ভেঙে দেয়। Sonnet 4 পারফরম্যান্স ও খরচের মধ্যে ভারসাম্য রক্ষা করে। SWE-bench Verified বেঞ্চমার্কে উভয়ই ৭৯% এর উপরে স্কোর করেছে, GPT-4.1 এবং Gemini 2.5 Pro কে ছাড়িয়ে, Claude-এর সফটওয়্যার ডেভেলপমেন্টে নেতৃত্ব নিশ্চিত করে।

২৮ মে ছিল AI এর “সুপার টিউসডে।”

Baidu বিশ্বের প্রথম ট্রিলিয়ন-প্যারামিটার মাল্টিমোডাল মডেল “Wenxin·Lingmou” প্রকাশ করেছে, যা শক্তিশালী কণ্ঠ, ছবি, ভিডিও এবং টেক্সট ফিউশন ক্ষমতা দেয়। এটি বাস্তব বিশ্ব বোঝাপড়া বাড়ায় এবং ফাইন্যান্স, স্বাস্থ্যসেবা, পরিবহন এবং নিরাপত্তায় ব্যাপক প্রয়োগের প্রতিশ্রুতি দেয়।

একই দিনে, Tesla-র শাংহাই গিগাফ্যাক্টরি তাদের হিউম্যানয়েড রোবট Optimus 2.0 এর ব্যপক উৎপাদন শুরু করে। প্রথম ১,০০০ ইউনিট Yangshan পোর্ট স্মার্ট টার্মিনালে সরবরাহ করা হয়েছে। Tesla-র নিজস্ব D1 AI চিপ (২০০ TOPS) দ্বারা সজ্জিত এই রোবটের সঠিকতা ০.১ মিমি, দৈনিক ৫০ কিলোমিটার পরিদর্শন রেঞ্জ এবং মানব পরিদর্শকের তুলনায় ত্রুটি সনাক্তকরণ হার তিন গুণ বেশি — যা শিল্প রোবোটিক্সের নতুন মান নির্ধারণ করেছে।

২৮ মে NVIDIA Computex 2025-এ তাদের পরবর্তী প্রজন্মের ট্রেনিং চিপ H1000 প্রকাশ করে, যা ৫ PFLOPS FP16 পারফরম্যান্স এবং ট্রিলিয়ন-প্যারামিটার মডেল ট্রেনিং সমর্থন করে। GPT-5 এর ট্রেনিং সময় ৭ দিন থেকে মাত্র ৪৮ ঘণ্টায় নেমে এসেছে। Microsoft Azure এবং Alibaba Cloud ইতোমধ্যে এই চিপ ডিপ্লয় করেছে। NVIDIA শাংহাই-তে একটি নতুন অফিসও ঘোষণা করেছে, যা চীনে তাদের উপস্থিতি শক্তিশালী করবে।

২০২৫ সালের মে মাস AI এর জন্য আরও একটি ঐতিহাসিক মাস হয়েছে। গুগল, মাইক্রোসফট এবং NVIDIA এর মতো প্রযুক্তি জায়ান্টরা নতুন মডেল ও ইকোসিস্টেম দিয়ে ভবিষ্যত গড়তে থাকলেও, Anthropic এবং Baidu জটিলতা ও মাল্টিমোডাল বুদ্ধিমত্তার সীমানা ছাড়িয়ে যাচ্ছে। কিন্তু সবচেয়ে বড় শিরোনাম এসেছে Tesla (যুক্তরাষ্ট্র) ও Huawei (চীন) থেকে।

জুন মাস কি নতুন অগ্রগতি নিয়ে আসবে? অনুসরণ করুন: https://iaiseek.com/

লেখক: IAISEEK AI Editorial Teamসৃষ্টি সময়: 2025-06-02 03:02:10
আরও পড়ুন