01.ai-এর প্রতিষ্ঠাতা এবং গুগল চায়নার প্রাক্তন প্রধান লি কাই-ফু বলেন, মূল ভূখণ্ডের কোম্পানিগুলি কম পরিমাণে ডেটার উপর প্রশিক্ষিত মডেল তৈরি করে খরচ কমায়, যার জন্য কম কম্পিউটিং শক্তি প্রয়োজন কিন্তু অপ্টিমাইজড হার্ডওয়্যার প্রয়োজন।

সম্প্রতি UC Berkeley SkyLab এবং LMSYS দ্বারা ঘোষিত র‍্যাঙ্কিং অনুসারে, স্টার্টআপ 01.ai-এর Yi-Lingtning মডেলটি তৃতীয় স্থানে রয়েছে, x.AI-এর Grok-2-এর সাথে যৌথভাবে, OpenAI এবং Google-এর পরে। এই র‍্যাঙ্কিংটি ব্যবহারকারীদের প্রশ্নের উত্তরের স্কোরের উপর ভিত্তি করে।

2d82e5b153faa85bf01e3f82affa4e298ec4f24e.avif.jpg
এআই অপারেশনের খরচ কমানো চীনের জন্য যুক্তরাষ্ট্রের সাথে প্রতিযোগিতা করার একটি উপায়। ছবি: এফটি

01.ai এবং DeepSeek হল মূল ভূখণ্ডের AI কোম্পানি যারা মডেলদের প্রশিক্ষণের জন্য ছোট ডেটাসেটের উপর মনোযোগ দেওয়ার কৌশল গ্রহণ করছে, একই সাথে সস্তা, অত্যন্ত দক্ষ জনবল নিয়োগ করছে।

FT জানিয়েছে যে Yi-Lightning-এর অনুমান খরচ প্রতি মিলিয়ন টোকেনের জন্য ১৪ সেন্ট, যেখানে OpenAI-এর GPT o1-mini-এর জন্য ২৬ সেন্ট। এদিকে, GPT 4o-এর দাম প্রতি মিলিয়ন টোকেনের জন্য ৪.৪০ ডলার পর্যন্ত। প্রতিক্রিয়া তৈরি করতে ব্যবহৃত টোকেনের সংখ্যা প্রতিটি প্রশ্নের জটিলতার উপর নির্ভর করে।

ই-লাইটনিং-এর প্রতিষ্ঠাতারা প্রকাশ করেছেন যে কোম্পানিটি বিভিন্ন ব্যবহারের ক্ষেত্রে সূক্ষ্ম-টিউনিংয়ের আগে "প্রাথমিক প্রশিক্ষণ"-এ ৩ মিলিয়ন ডলার ব্যয় করেছে। লি বলেন যে তাদের লক্ষ্য "সেরা মডেল তৈরি করা নয়", বরং "৫-১০ গুণ সস্তা" এমন একটি প্রতিযোগিতামূলক মডেল তৈরি করা।

01.ai, DeepSeek, MiniMax, এবং Stepfun যে পদ্ধতিটি প্রয়োগ করেছে তাকে বলা হয় "বিশেষজ্ঞ মডেলিং" - যার সহজ অর্থ হল ডোমেন-নির্দিষ্ট ডেটাসেটে প্রশিক্ষিত একাধিক নিউরাল নেটওয়ার্ককে একত্রিত করা।

গবেষকরা এই পদ্ধতিটিকে বিগ ডেটা মডেলের মতো একই স্তরের বুদ্ধিমত্তা অর্জনের একটি মূল উপায় হিসেবে দেখছেন কিন্তু কম কম্পিউটিং শক্তি ব্যবহার করে। তবে, এই পদ্ধতির অসুবিধা হল যে ইঞ্জিনিয়ারদের শুধুমাত্র একটি সাধারণ মডেলের পরিবর্তে "একাধিক বিশেষজ্ঞ" দিয়ে প্রশিক্ষণ প্রক্রিয়া পরিচালনা করতে হবে।

উচ্চমানের এআই চিপ অ্যাক্সেস করতে অসুবিধার কারণে, চীনা কোম্পানিগুলি উচ্চমানের ডেটা সেট তৈরির দিকে ঝুঁকছে, যা বিশেষজ্ঞ মডেলদের প্রশিক্ষণের জন্য ব্যবহার করা যেতে পারে, যার ফলে পশ্চিমা প্রতিদ্বন্দ্বীদের সাথে প্রতিযোগিতা করা যেতে পারে।

লি বলেন, 01.ai-এর তথ্য সংগ্রহের অপ্রচলিত উপায় রয়েছে, যেমন বই স্ক্যান করা বা WeChat মেসেজিং অ্যাপে নিবন্ধ সংগ্রহ করা যা খোলা ওয়েবসাইটে অ্যাক্সেসযোগ্য নয়।

প্রতিষ্ঠাতা বিশ্বাস করেন যে চীনের অবস্থান আমেরিকার চেয়ে ভালো, কারণ তাদের কাছে বিপুল সংখ্যক সস্তা কারিগরি প্রতিভা রয়েছে।

(এফটি, ব্লুমবার্গের মতে)

মেটা 'স্ব-শিক্ষা' AI মডেল চালু করেছে । সোশ্যাল মিডিয়া জায়ান্ট মেটা সবেমাত্র স্ব-শিক্ষা মূল্যায়ন (STE) বৈশিষ্ট্য সহ একটি নতুন AI মডেল ঘোষণা করেছে, যা AI উন্নয়ন প্রক্রিয়ায় মানুষের হস্তক্ষেপকে সংকুচিত করতে পারে।