![]() |
Baidu বলছে তাদের AI ChatGPT, Gemini এর চেয়ে ভালো। ছবি: Baidu । |
Baidu World 2025 ইভেন্টে, চীনা জায়ান্ট Baidu তার পরবর্তী প্রজন্মের প্ল্যাটফর্ম মডেল, AI পণ্য আপগ্রেডের একটি সিরিজ এবং আন্তর্জাতিক সম্প্রসারণ পরিকল্পনা ঘোষণা করেছে। সেই অনুযায়ী, ERNIE 5.0 একটি মালিকানাধীন মডেল, যা টেক্সট, ছবি, অডিও এবং ভিডিওর মতো একাধিক ফর্ম্যাটে কন্টেন্ট প্রক্রিয়াকরণ এবং তৈরি করতে সক্ষম।
এই গ্রুপটি ক্রমবর্ধমান প্রতিযোগিতামূলক AI বাজারে একটি বিশ্বব্যাপী খেলোয়াড় হয়ে ওঠার লক্ষ্যে কাজ করছে। ERNIE 5.0 আসে OpenAI তার ফ্ল্যাগশিপ প্ল্যাটফর্ম মডেল GPT-5 থেকে GPT-5.1 তে আপগ্রেড করার মাত্র কয়েক ঘন্টা পরে, যা টোকেন খরচ কমানোর এবং আরও মানব বিকল্পের সাথে মিথস্ক্রিয়া অভিজ্ঞতা উন্নত করার প্রতিশ্রুতি দেয়।
এন্টারপ্রাইজ-বান্ধব অ্যাপাচি ২.০ লাইসেন্সের অধীনে সম্প্রতি প্রকাশিত ওপেন সোর্স মডেল ERNIE-4.5-VL-28B-A3B-Thinking, ব্যবহারকারীরা শুধুমাত্র Baidu-এর ERNIE Bot ওয়েবসাইট এবং প্রাতিষ্ঠানিক গ্রাহকদের জন্য Qianfan Cloud Platform API-এর মাধ্যমে নতুন চ্যাটবটটি অ্যাক্সেস করতে পারবেন।
মডেল ভেরিয়েন্টটি হল ERNIE 5.0 প্রিভিউ 1022, যা টেক্সট-ভারী কাজের জন্য অপ্টিমাইজ করা হয়েছে, সাধারণ প্রিভিউ সংস্করণ ছাড়াও যা একাধিক ডেটা টাইপের ভারসাম্য বজায় রাখতে সক্ষম। এছাড়াও, Baidu "ডিজিটাল হিউম্যান" প্ল্যাটফর্ম, নো-কোড টুল এবং সাধারণ-উদ্দেশ্য AI এজেন্টগুলিতে গুরুত্বপূর্ণ আপগ্রেডের একটি সিরিজও চালু করেছে।
ERNIE 5.0 AI কীভাবে স্কেলে ব্যবহার করা হয় তার একটি পরিবর্তন চিহ্নিত করে, যার লক্ষ্য চীনা বাজারের বাইরেও এর AI পদচিহ্ন প্রসারিত করা। "AI-এর অভ্যন্তরীণকরণ একটি সহজাত ক্ষমতায় পরিণত হবে এবং AI-কে খরচ থেকে উৎপাদনশীলতার উৎসে রূপান্তরিত করবে," বলেছেন সিইও রবিন লি।
ERNIE 5.0 গ্রাফ এবং ডকুমেন্ট বোঝার ক্ষেত্রে শ্রেষ্ঠত্ব দেখায়। ছবি: Baidu। |
পরীক্ষার ফলাফল দেখায় যে ERNIE 5.0 বিভিন্ন ধরণের কাজে নেতৃস্থানীয় পশ্চিমা প্ল্যাটফর্ম মডেলগুলির কাছাকাছি বা সমতুল্য কাজ করে। মাল্টিমোডাল যুক্তি, ডকুমেন্ট বোঝাপড়া এবং চিত্র-ভিত্তিক প্রশ্নের উত্তর দেওয়ার পরীক্ষায় ERNIE 5.0 প্রিভিউ OpenAI-এর GPT-5-High এবং Google-এর Gemini 2.5 Pro-এর চেয়ে ভালো কাজ করে অথবা তাদের সাথে সমান।
একই সাথে, মডেলটি শক্তিশালী ভাষা এবং কোড কার্যকর করার ক্ষমতা প্রদর্শন করে। কোম্পানিটি পোস্ট-প্রসেসিং ডেটা মোডগুলিকে একত্রিত করার পরিবর্তে একই মডেলের মধ্যে মাল্টিমোডাল ইনপুট-আউটপুট সমন্বয় পরিচালনা করার ক্ষমতার উপর জোর দেয়, যা দলটি একটি প্রযুক্তিগত পার্থক্যকারী হিসাবে দেখে।
ছবির কাজের ক্ষেত্রে, ERNIE 5.0 OCRBench, DocVQA এবং ChartQA-তে শীর্ষস্থান অর্জন করেছে, এই তিনটি মানদণ্ডই নথি স্বীকৃতি, বিষয়বস্তু বোঝাপড়া এবং কাঠামোগত ডেটার সাথে যুক্তি পরিমাপ করে। Baidu জানিয়েছে যে মডেলটি নথি এবং চার্ট সম্পর্কিত পরীক্ষায় GPT-5-High এবং Gemini 2.5 Pro উভয়কেই ছাড়িয়ে গেছে।
Baidu-এর অভ্যন্তরীণ মূল্যায়ন অনুসারে, ইমেজিং ডোমেইনে, ERNIE 5.0 শব্দার্থিক মিল এবং ছবির মানের মতো বিভাগে Google Veo3-এর সমান বা তার চেয়েও বেশি ফলাফল অর্জন করেছে। মডেলটির মাল্টিমোডাল ইন্টিগ্রেশন উচ্চ স্তরের প্রাসঙ্গিক বোধগম্যতার সাথে ভিজ্যুয়াল কন্টেন্ট তৈরি এবং ব্যাখ্যা করতে সক্ষম করে।
ERNIE 5.0 এর দাম এবং সেগমেন্ট আলিবাবার মতো চীনা প্রতিযোগীদের অন্যান্য উচ্চমানের মডেলের সমতুল্য। এটি পূর্ববর্তী পণ্য যেমন ERNIE 4.5 Turbo এর চেয়ে বেশি। তবে, মার্কিন যুক্তরাষ্ট্রের মডেলের তুলনায়, চ্যাটবটের দাম এখনও মধ্য-পরিসরের গ্রুপে রয়েছে।
ভেঞ্চারবিটের মতে, এটি Baidu-এর কৌশলকে স্পষ্টভাবে দেখায় যে তারা উচ্চ ট্র্যাফিক পরিবেশনকারী কম খরচের মডেল এবং জটিল কাজের জন্য উচ্চ-কার্যক্ষমতাসম্পন্ন মডেল এবং বহু-মডেল যুক্তির জন্য উচ্চ-কার্যক্ষমতাসম্পন্ন মডেলের মধ্যে পার্থক্য করতে চায়।
সূত্র: https://znews.vn/ai-trung-quoc-danh-bai-gpt-5-post1602692.html







মন্তব্য (0)