সাপের বছরের শুরুতে ডিপসিক ব্যাপক মিডিয়া কভারেজ এবং সোশ্যাল মিডিয়া কভারেজ করেছিল, যার ফলে বিশ্বব্যাপী শেয়ার বাজারে উল্লেখযোগ্য কম্পন দেখা গিয়েছিল।

তবে, আর্থিক পরামর্শদাতা সংস্থা বার্নস্টেইনের সাম্প্রতিক এক প্রতিবেদনে সতর্ক করা হয়েছে যে, চিত্তাকর্ষক সাফল্য সত্ত্বেও, মাত্র ৫ মিলিয়ন ডলারে ওপেনএআই-এর মতো একটি এআই সিস্টেম তৈরির দাবিটি ভুল।

বার্নস্টাইনের মতে, ডিপসিকের বক্তব্য বিভ্রান্তিকর এবং বৃহত্তর চিত্র প্রতিফলিত করে না।

"আমরা বিশ্বাস করি ডিপসিক '৫ মিলিয়ন ডলার দিয়ে ওপেনএআই তৈরি করেনি'; মডেলগুলি দুর্দান্ত কিন্তু আমরা মনে করি না যে সেগুলি অলৌকিক; এবং সপ্তাহান্তে আতঙ্ক অতিরঞ্জিত বলে মনে হচ্ছে," প্রতিবেদনে বলা হয়েছে।

ডিপসিক ব্লুমবার্গ
মাত্র ৫ মিলিয়ন ডলার দিয়ে এআই সিস্টেম তৈরির ডিপসিকের দাবি নিয়ে বার্নস্টাইন বিশ্লেষকরা সন্দিহান। (ছবি: ব্লুমবার্গ)

ডিপসিক দুটি প্রধান এআই মডেল তৈরি করে: ডিপসিক-ভি৩ এবং ডিপসিক আর১। বৃহৎ আকারের ভি৩ ল্যাঙ্গুয়েজ মডেলটি এমওই আর্কিটেকচারকে কাজে লাগিয়ে ছোট মডেলগুলিকে একত্রিত করে উচ্চ কর্মক্ষমতা অর্জন করে এবং ঐতিহ্যবাহী মডেলের তুলনায় কম কম্পিউটিং রিসোর্স ব্যবহার করে।

অন্যদিকে, V3 মডেলটিতে 671 বিলিয়ন প্যারামিটার রয়েছে, যার মধ্যে 37 বিলিয়ন প্যারামিটার যেকোনো সময়ে সক্রিয় থাকে, মেমোরির ব্যবহার কমাতে MHLA এর মতো উদ্ভাবন এবং অধিক দক্ষতার জন্য FP8 ব্যবহার অন্তর্ভুক্ত করে।

V3 মডেলের প্রশিক্ষণের জন্য দুই মাস ধরে 2,048টি Nvidia H800 GPU-এর একটি ক্লাস্টার প্রয়োজন, যা 5.5 মিলিয়ন GPU ঘন্টার সমতুল্য। কিছু অনুমান অনুসারে প্রশিক্ষণের খরচ প্রায় $5 মিলিয়ন বলে মনে করা হলেও, বার্নস্টাইনের প্রতিবেদনে জোর দেওয়া হয়েছে যে এই পরিসংখ্যানটি কেবল কম্পিউটিং সংস্থানগুলিকেই অন্তর্ভুক্ত করে এবং গবেষণা, পরীক্ষা এবং অন্যান্য উন্নয়ন ব্যয়ের সাথে সম্পর্কিত উল্লেখযোগ্য খরচের হিসাব করে না।

ডিপসিক R1 মডেলটি V3 এর ভিত্তির উপর ভিত্তি করে তৈরি করে, যা রিইনফোর্সমেন্ট লার্নিং (RL) এবং অন্যান্য কৌশল ব্যবহার করে অনুমান ক্ষমতা নিশ্চিত করে।

যুক্তির কাজে R1 মডেলটি OpenAI মডেলের সাথে প্রতিযোগিতা করতে পারে। তবে, বার্নস্টাইন উল্লেখ করেছেন যে R1 তৈরির জন্য উল্লেখযোগ্য সম্পদের প্রয়োজন, যদিও ডিপসিক রিপোর্টে এই বিষয়ে বিস্তারিত কিছু বলা হয়নি।

ডিপসিক সম্পর্কে মন্তব্য করতে গিয়ে, বার্নস্টাইন মডেলগুলিকে চিত্তাকর্ষক বলে প্রশংসা করেছেন। উদাহরণস্বরূপ, V3 মডেলটি ভাষাবিজ্ঞান, প্রোগ্রামিং এবং গণিতে অন্যান্য প্রধান ভাষা মডেলের মতোই বা তার চেয়ে ভালো পারফর্ম করে, যদিও কম সম্পদের প্রয়োজন হয়।

V3 প্রাক-প্রশিক্ষণ প্রক্রিয়ার জন্য মাত্র ২.৭ মিলিয়ন GPU ঘন্টা কাজের প্রয়োজন হয়েছিল, যা অন্যান্য কিছু শীর্ষ-স্তরের মডেলের কম্পিউটিং সম্পদের ৯%।

বার্নস্টাইন উপসংহারে পৌঁছেছেন যে, ডিপসিকের অগ্রগতি উল্লেখযোগ্য হলেও, অতিরঞ্জিত দাবি থেকে সতর্ক থাকা উচিত। মাত্র ৫ মিলিয়ন ডলার দিয়ে ওপেনএআই-এর প্রতিযোগী তৈরির ধারণাটি ভুল বলে মনে হচ্ছে।

(টাইমস অফ ইন্ডিয়ার মতে)