Qwen3, আলিবাবা কর্তৃক চালু করা একটি নতুন প্রযুক্তি। ছবি: SCMP । |
AI জগতের সর্বশেষ বেঞ্চমার্ক পরীক্ষা অনুসারে, আলিবাবার সদ্য প্রকাশিত কৃত্রিম বুদ্ধিমত্তা মডেল Qwen3 DeepSeek-এর R1 কে ছাড়িয়ে বিশ্বের সর্বোচ্চ র্যাঙ্কযুক্ত ওপেন-সোর্স মডেলে পরিণত হয়েছে।
বিশেষ করে, LiveBench, একটি স্বাধীন প্ল্যাটফর্ম যা বৃহৎ ভাষার মডেল (LLM) কে বেঞ্চমার্ক করে, যা ChatGPT-এর মতো জেনারেটিভ AI পরিষেবাগুলিকে ভিত্তি করে এমন প্রযুক্তি, থেকে প্রাপ্ত তথ্য দেখায় যে Qwen3 পরীক্ষায় R1 কে ছাড়িয়ে গেছে।
ওপেন সোর্স এআই মডেলের ক্ষমতা পর্যালোচনার মধ্যে রয়েছে প্রোগ্রামিং, গণিত, ডেটা বিশ্লেষণ এবং ভাষা নির্দেশনা।
Qwen3 নামক AI মডেল সিরিজটি আলিবাবা ২৮শে এপ্রিল প্রকাশ করেছে। কোম্পানির দাবি, এই চ্যাটবটটি কিছু ক্ষেত্রে OpenAI বা Google থেকে বর্তমানে পাওয়া সেরা মডেলগুলির সাথে তুলনীয় হতে পারে, এমনকি ছাড়িয়েও যেতে পারে।
২৩৫ বিলিয়ন প্যারামিটার পর্যন্ত আকারের সাথে, Qwen3 DeepSeek-V2 এবং OpenAI GPT-4 এর সমতুল্য, যার যথাক্রমে প্রায় ২৩৬ বিলিয়ন এবং ১৭৫ বিলিয়ন প্যারামিটার রয়েছে। মডেলগুলির সিরিজ প্রকাশিত হওয়ার পরে ব্যবহারকারীরা শীঘ্রই AI ডেভেলপমেন্ট প্ল্যাটফর্ম Hugging Face এবং Github-এ একটি ওপেন লাইসেন্সের অধীনে এটি ডাউনলোড করতে সক্ষম হবেন।
কোম্পানিটি বলছে যে Qwen3 সংগ্রহে হাইব্রিড মডেল রয়েছে, যার অর্থ তারা জটিল সমস্যা সমাধানের জন্য বা সহজ অনুরোধের দ্রুত প্রতিক্রিয়া জানাতে তাদের সময়কে নমনীয় করতে পারে। এই ক্ষেত্রে, অনুমান মডেলটিকে তথ্যের নির্ভুলতা স্ব-পরীক্ষা করার অনুমতি দেয়, তবে উচ্চ বিলম্বের সম্মুখীন হয়।
এই নকশা ব্যবহারকারীদের জন্য প্রতিটি নির্দিষ্ট কাজের জন্য উপযুক্ত বাজেট বরাদ্দ করা সহজ করে তোলে। এছাড়াও, এই মডেলটি বিশ্বজুড়ে অনেক প্রতিযোগীর কাছ থেকেও শেখে।
ডিপসিকের মতো "বিশেষজ্ঞদের মিশ্রণ" (MoE) আর্কিটেকচার ব্যবহার করে, Qwen3 প্রশিক্ষণ খরচের একটি ভগ্নাংশে গণনার দক্ষতা সর্বাধিক করতে পারে। এটি এমন একটি পদ্ধতি যা একটি কাজকে পৃথক অংশে বিভক্ত করে এবং সম্পাদনের জন্য পর্যাপ্ত গভীর তথ্য সুপারিশ করে।
ডেভেলপমেন্ট টিমের মতে, Qwen3 ১১৯টি ভাষা পর্যন্ত সমর্থন করে এবং প্রায় ৩৬,০০০ বিলিয়ন টোকেনের একটি ডেটাসেটে প্রশিক্ষিত, যা ২৭,০০০ বিলিয়ন শব্দের সমতুল্য। প্রশিক্ষণের তথ্য পাঠ্যপুস্তক, প্রশ্নোত্তর সেট, প্রোগ্রামিং কোড, অথবা স্ব-উত্পাদিত AI এর মতো অনেক উৎস থেকে নেওয়া হয়,...
ওপেন-সোর্স র্যাঙ্কিংয়ের শীর্ষে থাকা সত্ত্বেও, LiveBench-এর ব্যাপক পরীক্ষায় দেখা গেছে যে Qwen3 বিশ্বের শীর্ষস্থানীয় ক্লোজড-সোর্স এআই মডেলগুলির থেকে পিছিয়ে রয়েছে, বিশেষ করে OpenAI-এর o3, Google-এর Gemini Pro 2.5 এবং Anthropic-এর Claude 3.7।
বর্তমানে, মাইক্রোসফট সমর্থিত ওপেনএআই-এর শীর্ষস্থানীয় মডেল, o3-মিনি হাই, বিশ্বের সামগ্রিক এআই মডেল র্যাঙ্কিংয়ের শীর্ষে রয়েছে।
সূত্র: https://znews.vn/deepseek-bi-soan-ngoi-post1551500.html










মন্তব্য (0)