Vietnam.vn - Nền tảng quảng bá Việt Nam

ডিপসিককে ক্ষমতাচ্যুত করা হয়েছে।

আলিবাবার এআই মডেল, Qwen3, লাইভবেঞ্চ পরীক্ষায় R1 পাস করেছে, যা প্রোগ্রামিং, গণিত এবং ডেটা বিশ্লেষণে ওপেন-সোর্স মডেলগুলির ক্ষমতা মূল্যায়ন করে।

ZNewsZNews06/05/2025

Qwen3, আলিবাবা কর্তৃক চালু করা একটি নতুন প্রযুক্তি। ছবি: SCMP

সর্বশেষ AI বেঞ্চমার্ক পরীক্ষা অনুসারে, আলিবাবার সদ্য প্রকাশিত Qwen3 কৃত্রিম বুদ্ধিমত্তা মডেলটি DeepSeek-এর R1-কে ছাড়িয়ে বিশ্বের সর্বোচ্চ-রেটেড ওপেন-সোর্স মডেল হয়ে উঠেছে।

বিশেষ করে, LiveBench, একটি স্বাধীন প্ল্যাটফর্ম যা বৃহৎ ভাষা মডেল (LLMs) স্কোর করে, যা ChatGPT-এর মতো জেনারেটিভ AI পরিষেবার জন্য ভিত্তি প্রযুক্তি, তার তথ্য দেখায় যে Qwen3 পরীক্ষায় R1 কে ছাড়িয়ে গেছে।

ওপেন-সোর্স এআই মডেলগুলির ক্ষমতার মূল্যায়নের মধ্যে রয়েছে প্রোগ্রামিং, গণিত, ডেটা বিশ্লেষণ এবং ভাষা নির্দেশনা।

আলিবাবা ২৮শে এপ্রিল তাদের Qwen3 AI মডেল সিরিজ প্রকাশ করেছে। কোম্পানির দাবি, এই চ্যাটবটটি কিছু ক্ষেত্রে OpenAI বা Google-এর সেরা বর্তমান মডেলগুলিকে প্রতিদ্বন্দ্বিতা করতে পারে, এমনকি ছাড়িয়েও যেতে পারে।

২৩৫ বিলিয়ন প্যারামিটার পর্যন্ত আকারের সাথে, Qwen3 এর পারফরম্যান্স DeepSeek-V2 এবং OpenAI GPT-4 এর সাথে তুলনীয়, যার যথাক্রমে প্রায় ২৩৬ বিলিয়ন এবং ১৭৫ বিলিয়ন প্যারামিটার রয়েছে। এই সিরিজের মডেলগুলি প্রকাশিত হওয়ার পরে ব্যবহারকারীরা শীঘ্রই AI ডেভেলপমেন্ট প্ল্যাটফর্ম Hugging Face এবং Github-এ ওপেন লাইসেন্সের অধীনে এটি ডাউনলোড করতে সক্ষম হবেন।

কোম্পানিটি জানিয়েছে যে Qwen3 সংগ্রহে হাইব্রিড মডেল রয়েছে, যার অর্থ তারা জটিল সমস্যা সমাধানের জন্য যুক্তির জন্য নমনীয়ভাবে সময় বরাদ্দ করতে পারে অথবা সহজ অনুরোধের দ্রুত প্রতিক্রিয়া জানাতে পারে। এই মডেলে, যুক্তির ক্ষমতা তথ্যের নির্ভুলতার স্ব-যাচাই করার অনুমতি দেয়, তবে এর সাথে উল্লেখযোগ্য সময় ব্যবধান আসে।

এই নকশা ব্যবহারকারীদের জন্য প্রতিটি নির্দিষ্ট কাজের জন্য যথাযথভাবে বাজেট বরাদ্দ করা সহজ করে তোলে। তদুপরি, এই মডেলটি বিশ্বজুড়ে অনেক প্রতিযোগীর কাছ থেকেও শেখে।

ডিপসিকের মতো "বিশেষজ্ঞদের মিশ্রণ" (MoE) আর্কিটেকচার ব্যবহার করে, Qwen3 প্রশিক্ষণ খরচের মাত্র একটি অংশ ব্যবহার করে গণনামূলক কর্মক্ষমতা অপ্টিমাইজ করতে পারে। এই পদ্ধতিটি কাজগুলিকে অনেকগুলি পৃথক অংশে বিভক্ত করে এবং সেগুলি সম্পাদনের জন্য পর্যাপ্ত পরিমাণে ডেটা-নিবিড় ডেটার প্রয়োজন হয়।

ডেভেলপমেন্ট টিমের মতে, Qwen3 ১১৯টি ভাষা পর্যন্ত সমর্থন করে এবং প্রায় ৩৬ ট্রিলিয়ন টোকেনের একটি ডেটাসেটে প্রশিক্ষণপ্রাপ্ত, যা ২৭ ট্রিলিয়ন শব্দের সমতুল্য। প্রশিক্ষণের তথ্য বিভিন্ন উৎস যেমন পাঠ্যপুস্তক, প্রশ্নোত্তর সেট, প্রোগ্রামিং কোড, এমনকি AI-উত্পাদিত ডেটা ইত্যাদি থেকে সংগ্রহ করা হয়।

ওপেন-সোর্স র‍্যাঙ্কিংয়ের শীর্ষে থাকা সত্ত্বেও, LiveBench-এর বর্ধিত বেঞ্চমার্ক পরীক্ষায় দেখা গেছে যে Qwen3 এখনও বিশ্বের শীর্ষস্থানীয় ক্লোজড-সোর্স এআই মডেলগুলির থেকে পিছিয়ে রয়েছে। এর মধ্যে সবচেয়ে উল্লেখযোগ্য হল OpenAI-এর o3, Google-এর Gemini Pro 2.5 এবং Anthropic-এর Claude 3.7।

বর্তমানে, মাইক্রোসফট সমর্থিত সবচেয়ে উন্নত ওপেনএআই মডেল, o3-মিনি হাই, বিশ্বব্যাপী এআই মডেলের সামগ্রিক র‍্যাঙ্কিংয়ে শীর্ষে রয়েছে।

সূত্র: https://znews.vn/deepseek-bi-soan-ngoi-post1551500.html


মন্তব্য (0)

আপনার অনুভূতি শেয়ার করতে একটি মন্তব্য করুন!

একই বিভাগে

একই লেখকের

ঐতিহ্য

চিত্র

ব্যবসা

বর্তমান ঘটনা

রাজনৈতিক ব্যবস্থা

স্থানীয়

পণ্য