ডিপসিক প্রকাশ করেছে কিভাবে তারা কম খরচের এআই মডেল তৈরি করে। ছবি: ব্লুমবার্গ । |
১৫ মে প্রকাশিত একটি গবেষণা প্রতিবেদনে, ডিপসিক প্রথমবারের মতো বিশ্বের সবচেয়ে শক্তিশালী ওপেন-সোর্স এআই সিস্টেমগুলির মধ্যে একটি কীভাবে তার প্রতিযোগীদের খরচের একটি ভগ্নাংশে তৈরি করেছে তার বিশদ বিবরণ ভাগ করে নিয়েছে।
"ইনসাইটস ইনটু ডিপসিক-ভি৩: স্কেলিং চ্যালেঞ্জেস অ্যান্ড রিফ্লেকশনস অন হার্ডওয়্যার ফর এআই আর্কিটেকচারস" শীর্ষক এই গবেষণাটি প্রতিষ্ঠাতা লিয়াং ওয়েনফেং-এর সাথে যৌথভাবে লেখা। ডিপসিক তার সাফল্যের জন্য হার্ডওয়্যার এবং সফ্টওয়্যারের সমান্তরাল নকশাকে দায়ী করে, যা অনেক কোম্পানির তুলনায় একটি ভিন্ন পদ্ধতি যা এখনও স্বাধীনভাবে সফ্টওয়্যার অপ্টিমাইজ করার উপর মনোযোগ দেয়।
"ডিপসিক-ভি৩, ২০৪৮টি এনভিডিয়া এইচ৮০০ জিপিইউতে প্রশিক্ষিত, এটি দেখিয়েছে যে সমান্তরাল নকশা কীভাবে দক্ষতার সাথে চ্যালেঞ্জগুলি সমাধান করতে পারে, দক্ষ প্রশিক্ষণ এবং স্কেলে অনুমান সক্ষম করে," গবেষণা দলটি প্রতিবেদনে লিখেছে। ডিপসিক এবং হেজ ফান্ড হাই-ফ্লায়ার ২০২৩ সালে মার্কিন যুক্তরাষ্ট্র কর্তৃক চীনে রপ্তানি নিষিদ্ধ করার আগে এইচ৮০০ চিপ মজুদ করেছিল।
প্রবন্ধ অনুসারে, ডিপসিক গবেষণা দল হার্ডওয়্যার সীমাবদ্ধতা এবং বৃহৎ ভাষা মডেল (এলএলএম) প্রশিক্ষণের অত্যধিক খরচ, ওপেনএআই-এর চ্যাটজিপিটির মতো চ্যাটবটের পিছনে অন্তর্নিহিত প্রযুক্তি সম্পর্কে ভালভাবে অবগত ছিল। অতএব, তারা মেমরির কর্মক্ষমতা বৃদ্ধি, চিপগুলির মধ্যে যোগাযোগ উন্নত করতে এবং এআই অবকাঠামোর সামগ্রিক দক্ষতা বৃদ্ধির জন্য একাধিক প্রযুক্তিগত অপ্টিমাইজেশন বাস্তবায়ন করেছে।
তদুপরি, ডিপসিক মিশ্র বিশেষজ্ঞ মডেল (MoE) আর্কিটেকচারের ভূমিকার উপর জোর দেয়। এটি একটি মেশিন লার্নিং পদ্ধতি যা AI মডেলকে সাবনেটওয়ার্কে বিভক্ত করে, প্রতিটি ইনপুট ডেটার একটি পৃথক অংশ প্রক্রিয়াকরণ করে এবং ফলাফলগুলি অপ্টিমাইজ করার জন্য সহযোগিতামূলকভাবে কাজ করে।
MoE প্রশিক্ষণের খরচ কমাতে এবং যুক্তির গতি ত্বরান্বিত করতে সাহায্য করে। এই পদ্ধতিটি এখন চীনা প্রযুক্তি শিল্পে ব্যাপকভাবে গৃহীত হয়, যার মধ্যে আলিবাবার সর্বশেষ Qwen3 মডেলও রয়েছে।
ডিপসিক প্রথম নজর কেড়েছিল যখন তারা ২০২৪ সালের ডিসেম্বরে তাদের বেসিক ভি৩ মডেল এবং জানুয়ারিতে তাদের আর১ রিজনিং মডেল প্রকাশ করে। এই পণ্যগুলি বিশ্ব বাজারে আলোড়ন সৃষ্টি করে, যার ফলে এআই-সম্পর্কিত প্রযুক্তির স্টক ব্যাপকভাবে হ্রাস পায়।
যদিও ডিপসিক সম্প্রতি আর কোনও পরিকল্পনা প্রকাশ করেনি, তবুও নিয়মিত প্রতিবেদনের মাধ্যমে এটি সম্প্রদায়ের আগ্রহ বজায় রেখেছে। মার্চের শেষের দিকে, কোম্পানিটি ডিপসিক-ভি৩-এর একটি ছোটখাটো আপডেট প্রকাশ করে এবং এপ্রিলের শেষের দিকে, তারা গাণিতিক প্রমাণ প্রক্রিয়াকরণের জন্য নীরবে প্রোভার-ভি২ সিস্টেম চালু করে।
সূত্র: https://znews.vn/deepseek-tiet-lo-bi-mat-post1554222.html






মন্তব্য (0)