![]() |
ডিপসিক নতুন এআই মডেল প্রকাশ করেছে যা ঐতিহ্যবাহী পদ্ধতির তুলনায় ৭-২০ গুণ কম টোকেন দিয়ে নথি প্রক্রিয়া করতে পারে। ছবি: দ্য ভার্জ । |
SCMP-এর মতে, DeepSeek একটি নতুন মাল্টি-মডাল কৃত্রিম বুদ্ধিমত্তা (AI) মডেল প্রকাশ করেছে যা উল্লেখযোগ্যভাবে কম সংখ্যক টোকেন ব্যবহার করে বৃহৎ এবং জটিল নথি প্রক্রিয়াকরণ করতে সক্ষম, যা ঐতিহ্যবাহী টেক্সট প্রক্রিয়াকরণ পদ্ধতির তুলনায় ৭-২০ গুণ কম।
টোকেন হলো টেক্সটের ক্ষুদ্রতম একক যা এআই প্রক্রিয়া করে। টোকেনের সংখ্যা কমানোর অর্থ হল গণনার খরচ সাশ্রয় করা এবং একটি এআই মডেলের দক্ষতা বৃদ্ধি করা।
এটি অর্জনের জন্য, ডিপসিক-ওসিআর (অপটিক্যাল ক্যারেক্টার রিকগনিশন) মডেলটি তথ্য সংকোচনের মাধ্যম হিসেবে ভিজ্যুয়াল পারসেপশন ব্যবহার করেছে। এই পদ্ধতির মাধ্যমে বৃহৎ ভাষা মডেলগুলিকে আনুপাতিকভাবে বর্ধিত গণনামূলক খরচ ছাড়াই বিশাল পরিমাণে পাঠ্য প্রক্রিয়াকরণ করতে সাহায্য করে।
"ডিপসিক-ওসিআর-এর মাধ্যমে, আমরা প্রমাণ করেছি যে তথ্য সংকুচিত করার জন্য ভিজ্যুয়াল পারসেপশন ব্যবহার করে উল্লেখযোগ্য টোকেন হ্রাস অর্জন করা যেতে পারে - বিভিন্ন ঐতিহাসিক প্রেক্ষাপটের সময়কালের জন্য 7-20 গুণ, যা একটি আশাব্যঞ্জক দিকনির্দেশনা প্রদান করে," ডিপসিক বলেন।
কোম্পানির ব্লগ পোস্ট অনুসারে, ডিপসিক-ওসিআর দুটি প্রধান উপাদান নিয়ে গঠিত, ডিপএনকোডার এবং ডিপসিক৩বি-এমওই-এ৫৭০এম, যা ডিকোডার হিসেবে কাজ করে।
এর মধ্যে, ডিপএনকোডার মডেলের মূল ইঞ্জিন হিসেবে কাজ করে, উচ্চ-রেজোলিউশন ইনপুটের অধীনে কম অ্যাক্টিভেশন স্তর বজায় রাখতে সাহায্য করে, একই সাথে টোকেনের সংখ্যা কমাতে শক্তিশালী কম্প্রেশন অনুপাত অর্জন করে।
ডিকোডারটি তখন একটি ৫৭০ মিলিয়ন-প্যারামিটার মিক্সচার-অফ-এক্সপার্টস (MoE) মডেল যা মূল টেক্সট পুনরুৎপাদন করার দায়িত্বপ্রাপ্ত। MoE আর্কিটেকচার মডেলটিকে সাবনেটওয়ার্কে বিভক্ত করে যা ইনপুট ডেটার একটি উপসেট প্রক্রিয়াকরণে বিশেষজ্ঞ, সম্পূর্ণ মডেলটি সক্রিয় না করেই কর্মক্ষমতা অপ্টিমাইজ করে।
ডকুমেন্ট রিডেবিলিটি বেঞ্চমার্ক, OmniDocBench-এ, DeepSeek-OCR GOT-OCR 2.0 এবং MinerU 2.0-এর মতো প্রধান OCR মডেলগুলিকে ছাড়িয়ে যায়, যদিও অনেক কম টোকেন ব্যবহার করে।
সূত্র: https://znews.vn/deepseek-lai-co-dot-pha-post1595902.html
মন্তব্য (0)