গণমাধ্যমে ঘন ঘন উপস্থিত হওয়ার পরিবর্তে ডিপসিক নতুন মডেলের গবেষণা ও উন্নয়নে মনোনিবেশ করছে। ছবি: এসসিএমপি । |
সিংহুয়া বিশ্ববিদ্যালয়ের গবেষকদের সহযোগিতায়, ডিপসিক বৃহৎ ভাষা মডেল (এলএলএম)-এর অনুমান ক্ষমতা উন্নত করার জন্য একটি নতুন পদ্ধতি চালু করেছে। ৪ঠা এপ্রিল সন্ধ্যায় একটি গবেষণা পত্রে প্রকাশিত এই পদ্ধতিটি এলএলএম-কে সাধারণ কোয়েরিগুলোর জন্য আরও ভালো এবং দ্রুত ফলাফল তৈরি করতে সাহায্য করে।
এই কৌশলটি DeepSeek-এর পূর্বে সফল দুটি পদ্ধতির সমন্বয় করে। একটি হলো জেনারেটিভ রিওয়ার্ড মডেলিং (GRM), যা এআই মডেলকে পূর্ববর্তী ফলাফলের উপর ভিত্তি করে তার প্রতিক্রিয়াগুলোকে স্ব-মূল্যায়ন ও পরিমার্জন করতে সাহায্য করে, এবং অন্যটি হলো সেলফ-প্রিন্সিপালড ক্রিটিক টিউনিং।
উভয় পদ্ধতিই কৃত্রিম বুদ্ধিমত্তার 'স্ব-শিক্ষণ' বৈশিষ্ট্যের উপর নির্ভর করে, যা সরাসরি মানবিক প্রতিক্রিয়া বা নির্দেশনার উপর নির্ভরতা কমায়, কিন্তু এর লক্ষ্য হলো মানুষের প্রত্যাশার কাছাকাছি ফলাফল প্রদান করা।
গবেষকদের মতে, একটি নতুন পদ্ধতি হওয়া সত্ত্বেও, DeepSeek-GRM অসাধারণ ফলাফল অর্জন করে এবং বর্তমানে উপলব্ধ সবচেয়ে সুপরিচিত ও কার্যকর এআই মডেলগুলোর সাথে প্রতিযোগিতা করে। DeepSeek জিআরএম মডেলগুলোকে ওপেন-সোর্স করার পরিকল্পনা করছে, কিন্তু কোনো নির্দিষ্ট সময়সীমা জানানো হয়নি।
তাদের V3 প্ল্যাটফর্ম মডেল এবং R1 ইনফারেন্স মডেলের মাধ্যমে বিশ্বব্যাপী প্রভাব ফেলার পর, ডিপসিক অনলাইন বৈজ্ঞানিক আর্কাইভ arXiv-এ এই গবেষণাপত্রটি প্রকাশ করেছে, যা কোম্পানিটির পরবর্তী পদক্ষেপ সম্পর্কে কৌতূহল জাগিয়ে তুলেছে।
রয়টার্স পূর্বাভাস দিয়েছে যে, এর পূর্বসূরীর অব্যাহত জনপ্রিয়তার কারণে R1-এর উত্তরসূরি DeepSeek-R2 এপ্রিল মাসে বাজারে আসতে পারে। DeepSeek-R1 পূর্বে তার খরচের তুলনায় উন্নত পারফরম্যান্সের জন্য প্রযুক্তি জগতে বিশ্বব্যাপী আলোড়ন সৃষ্টি করেছিল, যা এটিকে বর্তমান শীর্ষস্থানীয় মডেলগুলোর সাথে প্রতিযোগিতামূলক করে তুলেছিল।
এই গুজবগুলো নিয়ে ডিপসিক নীরব রয়েছে। তবে, স্থানীয় সূত্র অনুযায়ী, ডিপসিকের একটি কাস্টমার সার্ভিস অ্যাকাউন্ট প্রাতিষ্ঠানিক গ্রাহকদের সঙ্গে একটি গ্রুপ চ্যাটে এই তথ্যটি অস্বীকার করেছে।
২০২৩ সালে উদ্যোক্তা লিয়াং ওয়েনফেং কর্তৃক হাংঝৌতে প্রতিষ্ঠিত ডিপসিক গত কয়েক মাসে দ্রুত বিশ্বব্যাপী মনোযোগ আকর্ষণ করেছে। কিন্তু এই জনখ্যাতিকে কাজে লাগানোর পরিবর্তে, কোম্পানিটি তার সম্পদ গবেষণা ও উন্নয়নে নিবদ্ধ করছে।
এর আগে, DeepSeek তাদের V3 মডেলকে আপগ্রেড করে DeepSeek-V3-0324 সংস্করণটি প্রকাশ করেছে। ঘোষণা অনুযায়ী, এই আপডেটে উন্নত রিজনিং ক্ষমতা, ফ্রন্ট-এন্ড ওয়েব ইউজার ইন্টারফেস ডেভেলপমেন্টের জন্য অপটিমাইজেশন এবং উন্নত চীনা লেখার দক্ষতা রয়েছে।
ফেব্রুয়ারিতে, স্টার্টআপটি পাঁচটি কোড রিপোজিটরিও ওপেন-সোর্স করে, যার মাধ্যমে তারা "সম্পূর্ণ স্বচ্ছতার সাথে অগ্রগতি" করার প্রতি তাদের অঙ্গীকার পুনর্ব্যক্ত করে। সেই মাসেই, কোম্পানিটি "নেটিভ স্পার্স অ্যাটেনশন"-এর উপর একটি প্রযুক্তিগত গবেষণার ঘোষণা দেয়, যা বিপুল পরিমাণ ডেটা পরিচালনায় এলএলএম-এর কর্মক্ষমতা উন্নত করতে সাহায্য করে।
এমন এক সময়ে যখন মার্কিন যুক্তরাষ্ট্র চীনের প্রযুক্তিগত উন্নয়নকে দমন করার চেষ্টা করছে, তখন ডিপসিককে দেশটির এআই শিল্পের গতিশীলতার প্রতীক হিসেবে দেখা হচ্ছে।
উৎস: https://znews.vn/deepseek-gay-to-mo-post1543900.html







মন্তব্য (0)