২৮শে নভেম্বর, চীনা কৃত্রিম বুদ্ধিমত্তা (AI) কোম্পানি DeepSeek AI মডেল DeepSeekMath-V2 ঘোষণা করেছে, যা AI গাণিতিক যুক্তির ক্ষেত্রে একটি যুগান্তকারী পদক্ষেপ হিসেবে বিবেচিত, নতুন কর্মক্ষমতা মান নির্ধারণ করে এবং মেশিন লার্নিং ব্যবহার করে সমস্যা সমাধানের ক্ষমতার সীমা প্রসারিত করে।
DeepSeekMath-V2 এর সোর্স কোড Hugging Face এবং GitHub-এ সর্বজনীনভাবে উপলব্ধ।
এই মডেলটি একটি স্ব-যাচাই কাঠামোকে একীভূত করে যাতে যুক্তির একটি শৃঙ্খলের বৈধতা যাচাই করা যায়, সঠিক উত্তর তৈরি করার পাশাপাশি, যা অনেক বর্তমান AI মডেল এখনও মোকাবেলা করতে পারে না।
মূল্যায়নের ফলাফল দেখায় যে DeepSeekMath-V2 ২০২৫ সালের আন্তর্জাতিক গণিত অলিম্পিয়াড (IMO) এবং ২০২৪ সালের চীনা গণিত অলিম্পিয়াড (CMO) তে স্বর্ণপদকের জন্য যোগ্যতা অর্জন করেছে।
উল্লেখযোগ্যভাবে, মডেলটি ২০২৪ সালের পুটনাম পরীক্ষায় ১১৮/১২০ পয়েন্ট পেয়েছে, যা ৯০-পয়েন্টের স্কোরকে ছাড়িয়ে গেছে, যা মানুষের দ্বারা অর্জিত সর্বোচ্চ রেকর্ড।
মডেলটির যৌক্তিক যুক্তির ক্ষমতা IMO-ProofBench সিস্টেম ব্যবহার করে পরীক্ষা করা হয়, যা AI মডেলগুলির যুক্তির নির্ভুলতা যাচাই করার জন্য ব্যবহৃত একটি নিবেদিতপ্রাণ মানদণ্ড।
ডিপসিকম্যাথ-ভি২ ডিপমাইন্ডের ডিপথিঙ্ক সহ অন্যান্য অনেক অত্যাধুনিক মডেলের তুলনায় উচ্চতর কর্মক্ষমতা প্রদর্শন করে।
IMO-ProofBench একটি ক্রস-চেকিং পদ্ধতির উপর কাজ করে: একটি মডেল "প্রমাণ" করার ভূমিকা পালন করে, গাণিতিক যুক্তির একটি শৃঙ্খল তৈরি করে, যখন অন্য মডেলটি "যাচাইকরণ" করার ভূমিকা পালন করে, যুক্তির শক্তি মূল্যায়ন করে।
এই প্রক্রিয়াটি মডেলের চিন্তাভাবনায় ত্রুটি সনাক্তকরণের সুযোগ করে দেয়, যা সমসাময়িক এআই সিস্টেমের একটি সহজাত দুর্বলতা।
ডেভেলপমেন্ট টিমের মতে, DeepSeekMath-V2 এর স্ব-যাচাই পদ্ধতি বর্তমান AI মডেলগুলির সবচেয়ে বড় সীমাবদ্ধতা সমাধান করতে সাহায্য করে: ভুল বা অসঙ্গত যুক্তির উপর ভিত্তি করে সঠিক উত্তর তৈরি করার ক্ষমতা।
ডিপসিক বিশ্বাস করে যে এই অগ্রগতিগুলি দেখায় যে "স্ব-যাচাইকারী গাণিতিক যুক্তি" পদ্ধতির ভবিষ্যতে আরও শক্তিশালী, নির্ভরযোগ্য এবং স্বচ্ছ গাণিতিক কৃত্রিম বুদ্ধিমত্তার মূল ভিত্তি হয়ে ওঠার সম্ভাবনা রয়েছে।/।
সূত্র: https://www.vietnamplus.vn/deepseek-phat-trien-mo-hinh-ai-lap-luan-toan-hoc-co-kha-nang-tu-kiem-chung-post1079916.vnp






মন্তব্য (0)