ডিপসিক মিডিয়াতে ঘন ঘন উপস্থিত হওয়ার পরিবর্তে নতুন মডেলের গবেষণা এবং উন্নয়নের উপর মনোযোগ দিচ্ছে। ছবি: এসসিএমপি । |
সিংহুয়া বিশ্ববিদ্যালয়ের গবেষকদের সহযোগিতায়, ডিপসিক বৃহৎ ভাষা মডেল (এলএলএম) এর অনুমান ক্ষমতা উন্নত করার জন্য একটি নতুন পদ্ধতি চালু করেছে। ৪ঠা এপ্রিল সন্ধ্যায় একটি গবেষণাপত্রে প্রকাশিত এই পদ্ধতিটি এলএলএম-দের সাধারণ প্রশ্নের জন্য আরও ভাল এবং দ্রুত ফলাফল তৈরি করতে সহায়তা করে।
এই কৌশলটি ডিপসিকের দুটি পূর্বে সফল পদ্ধতিকে একত্রিত করে। একটি হল জেনারেটিভ রিওয়ার্ড মডেলিং (GRM), যা AI মডেলকে পূর্ববর্তী ফলাফলের উপর ভিত্তি করে তার প্রতিক্রিয়াগুলি স্ব-মূল্যায়ন এবং পরিমার্জন করতে দেয় এবং অন্যটি হল স্ব-নীতিগত সমালোচনা টিউনিং।
উভয় পদ্ধতিই AI-এর "স্ব-শিক্ষা" দিকের উপর নির্ভর করে, সরাসরি মানুষের প্রতিক্রিয়া বা নির্দেশনার উপর নির্ভরতা হ্রাস করে, তবে মানুষের প্রত্যাশার কাছাকাছি ফলাফল প্রদানের লক্ষ্যে।
গবেষকদের মতে, একটি নতুন পদ্ধতি হওয়া সত্ত্বেও, ডিপসিক-জিআরএম অসাধারণ ফলাফল অর্জন করে এবং বর্তমানে উপলব্ধ সবচেয়ে সুপরিচিত এবং কার্যকর এআই মডেলগুলির সাথে প্রতিযোগিতা করে। ডিপসিক জিআরএম মডেলগুলি ওপেন-সোর্স করার পরিকল্পনা করেছে, তবে কোনও নির্দিষ্ট সময়সীমা দেওয়া হয়নি।
V3 প্ল্যাটফর্ম মডেল এবং R1 ইনফারেন্স মডেলের মাধ্যমে বিশ্বব্যাপী প্রভাব ফেলার পর, DeepSeek অনলাইন বৈজ্ঞানিক সংরক্ষণাগার arXiv-এ এই একাডেমিক গবেষণাপত্রটি প্রকাশ করেছে, যা কোম্পানির পরবর্তী পদক্ষেপ সম্পর্কে কৌতূহল জাগিয়ে তুলেছে।
রয়টার্স ভবিষ্যদ্বাণী করেছে যে R1 এর উত্তরসূরী DeepSeek-R2, এপ্রিল মাসে বাজারে আসতে পারে, কারণ এর পূর্বসূরীটির জনপ্রিয়তা অব্যাহত রয়েছে। DeepSeek-R1 পূর্বে প্রযুক্তি জগতে বিশ্বব্যাপী আলোড়ন সৃষ্টি করেছিল খরচের তুলনায় এর উচ্চতর পারফরম্যান্সের কারণে, এটি বর্তমান শীর্ষস্থানীয় মডেলগুলির সাথে প্রতিযোগিতামূলক করে তুলেছিল।
ডিপসিক গুজব সম্পর্কে নীরব রয়েছে। তবে স্থানীয় সূত্র অনুসারে, ডিপসিকের একটি গ্রাহক পরিষেবা অ্যাকাউন্ট এন্টারপ্রাইজ ক্লায়েন্টদের সাথে একটি গ্রুপ চ্যাটে তথ্য অস্বীকার করেছে।
২০২৩ সালে হ্যাংজুতে উদ্যোক্তা লিয়াং ওয়েনফেং কর্তৃক প্রতিষ্ঠিত ডিপসিক গত কয়েক মাসে দ্রুত বিশ্বব্যাপী মনোযোগ আকর্ষণ করেছে। কিন্তু জনসাধারণের খ্যাতি কাজে লাগানোর পরিবর্তে, কোম্পানিটি গবেষণা ও উন্নয়নের উপর তার সম্পদের উপর জোর দিচ্ছে।
পূর্বে, ডিপসিক তার V3 মডেলটি আপগ্রেড করেছে, সংস্করণ ডিপসিক-ভি3-0324 প্রকাশ করেছে। ঘোষণা অনুসারে, এই আপডেটে উন্নত যুক্তি ক্ষমতা, ফ্রন্ট-এন্ড ওয়েব ইউজার ইন্টারফেস ডেভেলপমেন্টের জন্য অপ্টিমাইজেশন এবং উন্নত চীনা লেখার দক্ষতা রয়েছে।
ফেব্রুয়ারিতে, স্টার্টআপটি পাঁচটি কোড রিপোজিটরিও ওপেন-সোর্স করেছে, "পূর্ণ স্বচ্ছতার সাথে অগ্রগতির" প্রতিশ্রুতি নিশ্চিত করেছে। এছাড়াও, সেই মাসে, কোম্পানি "নেটিভ স্পার্স অ্যাটেনশন" এর উপর একটি প্রযুক্তিগত গবেষণা ঘোষণা করেছে, যা বিপুল পরিমাণে ডেটা পরিচালনায় LLM-এর কর্মক্ষমতা উন্নত করতে সহায়তা করে।
ডিপসিককে চীনের এআই শিল্পের গতিশীলতার প্রতীক হিসেবে দেখা হয়, এমন এক সময়ে যখন মার্কিন যুক্তরাষ্ট্র দেশটির প্রযুক্তিগত উন্নয়নকে বাধাগ্রস্ত করার চেষ্টা করছে।
সূত্র: https://znews.vn/deepseek-gay-to-mo-post1543900.html






মন্তব্য (0)