চীনা স্টার্টআপ ডিপসিকের R1 কৃত্রিম বুদ্ধিমত্তা মডেল - যা জানুয়ারিতে চালু হওয়ার সময় মার্কিন শেয়ার বাজারকে হতবাক করেছিল - প্রথম পিয়ার-রিভিউ করা গবেষণায় প্রকাশিত হয়েছে, যেখানে দেখানো হয়েছে যে কীভাবে এটি মাত্র $300,000 এর বিনিময়ে একটি শক্তিশালী LLM তৈরি করেছে।
R1 গণিত এবং প্রোগ্রামিংয়ের মতো যুক্তির কাজে দক্ষতা অর্জনের জন্য ডিজাইন করা হয়েছে, যা এটিকে মার্কিন প্রযুক্তি জায়ান্টদের দ্বারা তৈরি সরঞ্জামগুলির সাথে একটি কম খরচের প্রতিদ্বন্দ্বী করে তোলে।
এটি একটি "ওপেন ওয়েট" মডেল, যা বিনামূল্যে ডাউনলোড করা যায় এবং বর্তমানে হাগিং ফেস প্ল্যাটফর্মের সবচেয়ে জনপ্রিয় মডেল, যার ডাউনলোড সংখ্যা ১০.৯ মিলিয়নেরও বেশি।
জানুয়ারী মাসের পাণ্ডুলিপির একটি আপডেট, দ্য নেচার স্টাডি, প্রথমে প্রকাশ করে যে প্রশিক্ষণ R1-এর খরচ মাত্র $294,000, বেস মডেল তৈরিতে ব্যয় করা প্রায় $6 মিলিয়ন ছাড়াও।
এই সংখ্যাটি প্রতিযোগীরা যে লক্ষ লক্ষ ডলার ব্যয় করেছে বলে জানা গেছে তার চেয়ে অনেক কম।
ডিপসিক জানিয়েছে যে R1 মূলত Nvidia H800 চিপ ব্যবহার করে প্রশিক্ষিত ছিল, যা ২০২৩ সাল থেকে চীনে রপ্তানি নিষিদ্ধ করেছে মার্কিন যুক্তরাষ্ট্র।
R1 এর সাফল্য ছিল "বিশুদ্ধ শক্তিবৃদ্ধি শিক্ষা" ব্যবহার, যেখানে মডেলটিকে মানুষের দ্বারা নির্বাচিত উদাহরণ থেকে শেখার পরিবর্তে ট্রায়াল এবং ত্রুটির উপর প্রশিক্ষণ দেওয়া হয় এবং সঠিক উত্তরের জন্য পুরস্কৃত করা হয়। এটি অভ্যন্তরীণ অনুমান ব্যবহার করে নিজস্ব প্রচেষ্টাও স্কোর করে, "আপেক্ষিক গোষ্ঠী নীতি অপ্টিমাইজেশন" নামে একটি কৌশল, যা কর্মক্ষমতা বৃদ্ধিতে সহায়তা করে।
"কঠোর পিয়ার রিভিউ প্রক্রিয়া মডেলের মূল্য এবং নির্ভরযোগ্যতা যাচাই করতে সাহায্য করে," গবেষক হুয়ান সান (ওহিও স্টেট ইউনিভার্সিটি) বলেন। "অন্যান্য সংস্থাগুলিরও একই কাজ করা উচিত।"
হাগিং ফেসের মেশিন লার্নিং ইঞ্জিনিয়ার লুইস টানস্টল বলেন, এটি একটি গুরুত্বপূর্ণ নজির কারণ এআই উন্নয়নে স্বচ্ছতা ঝুঁকি আরও সঠিকভাবে মূল্যায়ন করতে সাহায্য করে।
ডিপসিক দাবি করেছে যে R1 কে OpenAI এর মডেল থেকে ডেটা ব্যবহার করে প্রশিক্ষণ দেওয়া হয়নি, যদিও তারা স্বীকার করে যে অন্তর্নিহিত মডেলটি ওয়েব ডেটার উপর প্রশিক্ষণ দেওয়া হয়েছিল — যার মধ্যে AI-উত্পাদিত সামগ্রী অন্তর্ভুক্ত থাকতে পারে।
বিশেষজ্ঞরা বলছেন যে যদিও এটি পুরোপুরি যাচাই করা কঠিন, বর্তমান প্রমাণগুলি পরামর্শ দেয় যে উচ্চ কর্মক্ষমতা অর্জনের জন্য বিশুদ্ধ বর্ধন যথেষ্ট।
ScienceAgentBench পরীক্ষায়, R1 নির্ভুলতার তালিকায় শীর্ষে ছিল না, তবে এটি দক্ষতা এবং খরচের মধ্যে একটি ভালো ভারসাম্য বজায় রেখেছে। গবেষকরা এখন বিদ্যমান LLM-দের যুক্তি ক্ষমতা বৃদ্ধির জন্য DeepSeek-এর পদ্ধতি প্রয়োগ করার চেষ্টা করছেন, পাশাপাশি গণিত এবং প্রোগ্রামিংয়ের বাইরেও এটি প্রসারিত করার চেষ্টা করছেন।
মিঃ টানস্টলের মতে, R1 কৃত্রিম বুদ্ধিমত্তা উন্নয়নে "একটি বিপ্লব শুরু করেছে"।/।
সূত্র: https://www.vietnamplus.vn/nghien-cuu-moi-tiet-lo-bi-quyet-thanh-cong-cua-deepseek-post1062474.vnp






মন্তব্য (0)