
গুগল সবেমাত্র জেমিনি ৩ চালু করেছে, একটি মডেল যা কোডিং, ইমেল প্রক্রিয়াকরণ এবং নথি বিশ্লেষণ উন্নত করার উপর দৃষ্টি নিবদ্ধ করে। এই মডেলটির যুক্তি করার ক্ষমতাও উন্নত, প্রসঙ্গ বোঝে এবং কিছু প্রশ্নের উত্তর দেওয়ার সময় গ্রাফিক্স (ডায়াগ্রাম, চিত্র...) অন্তর্ভুক্ত করে।
গুগলের ঘোষণায় জোর দেওয়া হয়েছে যে জেমিনি ৩ জেমিনি অ্যাপে, গুগল সার্চে এআই মোডে এবং গুগল অ্যান্টিগ্র্যাভিটি নামে একটি নতুন প্রোগ্রামিং প্ল্যাটফর্মে উপস্থিত হবে।
"গুগলের সবচেয়ে বুদ্ধিমান"
প্রায় দুই বছর আগে চালু হওয়ার পর থেকে, গুগল জেমিনিকে আরও বিস্তৃত দর্শকদের কাছে সম্প্রসারিত করে চলেছে। কোম্পানিটি উল্লেখ করেছে যে এআই ওভারভিউ বৈশিষ্ট্যটির এখন ২ বিলিয়ন মাসিক ব্যবহারকারী রয়েছে, জেমিনি অ্যাপের ৬৫০ মিলিয়ন মাসিক ব্যবহারকারী রয়েছে, ৭০% এরও বেশি ক্লাউড গ্রাহক এআই ব্যবহার করেন এবং ১ কোটি ৩০ লক্ষ ডেভেলপার গুগলের জেনারেটিভ এআই মডেল থেকে পণ্য তৈরি করছেন।
গুগল প্রথম দিন থেকেই জেমিনি অ্যাপে প্রথমবারের মতো জেমিনি ৩ প্রো অ্যাক্সেসযোগ্য করে তুলছে, দাবি করছে যে এটি কোম্পানির "এখনও পর্যন্ত সবচেয়ে স্মার্ট মডেল"। এটি পেইড ব্যবহারকারীদের জন্য এআই মোডের মাধ্যমে জেমিনি ৩ প্রোও চালু করছে।
গুগল ডিপমাইন্ডের সিনিয়র ডিরেক্টর এবং হেড অফ প্রোডাক্ট তুলসী দোশি বলেন, জেমিনি ৩ কোম্পানিকে তথ্যকে "ব্যাপকভাবে অ্যাক্সেসযোগ্য এবং কার্যকর" করার লক্ষ্যে নিয়ে যাবে, গুগলের সার্চ ইঞ্জিন আপগ্রেড করার কাজ অব্যাহত রাখবে।
গুগল জেমিনি ৩ প্রো-এর মাল্টিমোডাল প্রসেসিং ক্ষমতা তুলে ধরছে, যা একই সাথে টেক্সট, ছবি এবং অডিও প্রক্রিয়াকরণের উপর নির্ভর করে। উদাহরণস্বরূপ, মডেলটি রেসিপির ছবি পড়তে পারে এবং সেগুলিকে বইতে রূপান্তর করতে পারে, অথবা ভিডিও লেকচারের উপর ভিত্তি করে ইন্টারেক্টিভ ফ্ল্যাশকার্ড তৈরি করতে পারে।
![]() |
LMArena-তে Gemini 3 Pro-এর জন্য Google দ্বারা তৈরি বেঞ্চমার্ক। ছবি: Google । |
গুগলের ঘোষণায় বেঞ্চমার্কে জেমিনি ৩ প্রো-এর পারফরম্যান্সও তুলে ধরা হয়েছে। উদাহরণস্বরূপ, মডেলটি ১,৫০১ পয়েন্ট স্কোর করেছে, যা LMArena র্যাঙ্কিংয়ের শীর্ষে রয়েছে। জেমিনি ৩ প্রো-এর যুক্তি করার ক্ষমতা ডক্টরেট স্তরে পৌঁছেছে, হিউম্যানিটি'স লাস্ট পরীক্ষায় ৩৭.৫% এবং GPQA ডায়মন্ডে ৯১.৯% স্কোর করেছে।
সমস্যা-ভিত্তিক স্কেলে (MathArena Apex), Gemini 3 Pro 23.4% স্কোর করেছে, যা বর্তমানে বৃহৎ ভাষা মডেলগুলির (LLM) মধ্যে সর্বোচ্চ।
মাল্টিমোডাল যুক্তির ক্ষেত্রে, গুগল বলেছে যে জেমিনি 3 প্রো MMMU-Pro স্কেলে 81% এবং ভিডিও-MMMU স্কেলে 87.6% স্কোর করেছে। SimpleQA Verified নির্ভুলতা পরীক্ষার প্ল্যাটফর্মেও মডেলটি 72.1% স্কোর করেছে।
"এটি দেখায় যে জেমিনি 3 প্রো বিজ্ঞান থেকে গণিত পর্যন্ত বিস্তৃত ক্ষেত্রে জটিল সমস্যাগুলি উচ্চ নির্ভরযোগ্যতার সাথে সমাধান করতে সক্ষম," গুগল জোর দিয়ে বলেছে।
জেমিনি ৩ ডিপ থিঙ্ক ডিপ রিজনিং ভার্সনের মাধ্যমে, হিউম্যানিটি'স লাস্ট এক্সাম এবং জিপিকিউএ ডায়মন্ডে স্কোর যথাক্রমে ৪১% এবং ৯৩.৮%, জেমিনি ৩ প্রো-এর চেয়েও বেশি ছিল। মডেলটি সাধারণ এআই-এর পরিমাপক, ARC-AGI-তেও ৪৫.১% স্কোর করেছে।
মিথুন ৩ কী করতে পারে?
জেমিনি ৩-এর উন্নতিগুলি অনেক গুগল পণ্যেই দেখা যাবে। জেমিনি-তে পরীক্ষামূলক ডায়নামিক ভিউ বৈশিষ্ট্যটি কিছু প্রশ্নের জন্য ইন্টারেক্টিভ অভিজ্ঞতা তৈরি করে, যেমন চিত্র সহ ম্যাগাজিন, সংক্ষিপ্ত তথ্য, অথবা চাহিদা অনুসারে কাস্টমাইজড ইন্টারফেস।
"জেমিনি ৩ আপনার পিকলবল খেলার ভিডিও বিশ্লেষণ করতে পারে, উন্নতির ক্ষেত্রগুলি চিহ্নিত করতে পারে এবং আপনার সামগ্রিক কৌশল উন্নত করার জন্য অনুশীলন সেশনের পরিকল্পনা করতে পারে," গুগল নোট করে।
![]() |
জেমিনি ৩ প্রো-এর উন্নত এনকোডিং ক্ষমতা আরও ভালো ছবি তৈরিতে সাহায্য করে। ছবি: গুগল । |
গুগল সার্চে এআই মোড জেনারেটিভ ইউআই মোডের মাধ্যমে প্রশ্নের উপর ভিত্তি করে ছবি, টেবিল এবং সিমুলেটেড ভিডিওর মতো ভিজ্যুয়াল উপাদানও তৈরি করতে পারে। ব্যবহারকারীরা ডেটা সম্পর্কে ইন্টারঅ্যাক্ট করতে বা আরও প্রশ্ন জিজ্ঞাসা করতে পারেন।
গুগলের মতে, "ক্যোয়ারী ফ্যান-আউট"-এ আপগ্রেডের মাধ্যমে এআই মোড আরও বেশি অনুসন্ধান করতে পারে, যা প্রশ্নের উদ্দেশ্য আরও ভালভাবে বুঝতে এবং "আগে মিস করা হতে পারে এমন নতুন সামগ্রী খুঁজে পেতে" প্রশ্নগুলিকে ছোট ছোট অংশে বিভক্ত করে।
গুগল যখন জেমিনি ৩ প্রোকে "মূল্যবান এবং খাঁটি দৃষ্টিভঙ্গি দিয়ে খালি তোষামোদের প্রতিস্থাপন" হিসেবে বর্ণনা করে, তখন তাদের প্রতিযোগীদের উল্লেখ করতে দ্বিধা করে না।
"এটি কেবল আপনি যা শুনতে চান তা উত্তর দেয় না, এটি আপনাকে যা শুনতে সত্যিই প্রয়োজন তাও দেয়," গুগলের একজন প্রতিনিধি যোগ করেছেন।
![]() |
জেমিনি-তে ডায়নামিক ভিউ বৈশিষ্ট্যটি কিছু প্রশ্নের জন্য একটি ভিজ্যুয়াল ইন্টারেক্টিভ অভিজ্ঞতা তৈরি করে। ছবি: গুগল । |
জেমিনি ৩ প্রো ডেভেলপারদের এজেন্ট কোডিং এবং "ভাইব কোডিং" কাজে আরও ভালো সহায়তা প্রদান করে। জেমিনি ৩-তে গুগল এআই স্টুডিও, ভার্টেক্স এআই এবং জেমিনি সিএলআই-এর মতো টুল পাওয়া যাচ্ছে, সাথে রয়েছে সম্পূর্ণ নতুন অ্যান্টিগ্রাভিটি প্ল্যাটফর্ম, যা এজেন্টিক কোডিং এবং অটোমেশনের উপর দৃষ্টি নিবদ্ধ করে।
এজেন্টদের কথা বলতে গেলে, গুগল বলেছে যে জেমিনি ৩ আরও ভালোভাবে সাহায্য করতে পারে। মডেলটি ব্যবহারকারীদের পক্ষে ইমেল বাছাই এবং সংগঠিত করা, তথ্য অনুসন্ধান করা এবং ভ্রমণ টিকিট বুক করার মতো জটিল প্রক্রিয়াগুলি সম্পাদন করতে পারে।
গুগল এআই আল্ট্রা ব্যবহারকারীরা এখন জেমিনি এজেন্ট মোডের মাধ্যমে জেমিনি অ্যাপে এজেন্ট বৈশিষ্ট্যগুলি উপভোগ করতে পারবেন।
তোমার প্রতিপক্ষের গায়ে গরম বাতাস শ্বাস নাও।
গুগলের নতুন মডেলটিকে তার প্রতিযোগীদের জন্য একটি কঠিন সমস্যা হিসেবে দেখা হচ্ছে। নিউ ইয়র্ক টাইমসের সূত্র জোর দিয়ে বলেছে যে ওপেনএআই এবং অ্যানথ্রপিক উভয়ই অভ্যন্তরীণভাবে উদ্বিগ্ন যে যদি জেমিনি 3 কোডিং বা চিত্র তৈরির মতো কাজে দক্ষতা অর্জন করে তবে তাদের ছাড়িয়ে যাওয়া হবে।
"গুগলের আকার, স্থান এবং অনুসন্ধানে প্রথম-প্রবর্তক সুবিধার কারণে, জেমিনি বাজারের অংশীদারিত্ব দখল করতে পারে এবং ওপেনএআই এবং অন্যান্যদের পিছনে ফেলে দিতে পারে," জোন্সট্রেডিংয়ের বিশ্লেষক মাইক ও'রুর্ক বলেন।
তিনি আরও বলেন, জেমিনিতে স্থানান্তরের ফলে বাজারজুড়ে ব্যাপক পরিবর্তন আসতে পারে, যা ওরাকল এবং মাইক্রোসফটের জন্য প্রশ্ন উত্থাপন করে, যারা ক্লাউড কম্পিউটিং অবকাঠামো প্রদানের জন্য ওপেনএআই থেকে বিলিয়ন বিলিয়ন ডলার পেয়েছে।
![]() |
গুগল সার্চের এআই প্রশ্নের উপর ভিত্তি করে সিমুলেটেড ছবি তৈরি করতে পারে। ছবি: গুগল । |
এআই-এর বিস্ফোরণের ফলে প্রযুক্তি জগতে খরচ এবং ব্যবসায়িক সুযোগের ভারসাম্য বজায় রাখার প্রশ্নও দেখা দিয়েছে। আজকাল এআই সিস্টেমগুলি মূলত ইন্টারনেট অনুসন্ধান এবং প্রোগ্রামিং স্বয়ংক্রিয় করতে ব্যবহৃত হয়।
এই প্রযুক্তিটি ব্যয়বহুল সুপার কম্পিউটারে ভরা ডেটা সেন্টারগুলিতে কাজ করে, ম্যাককিনসে অ্যান্ড কোম্পানির মতে, ২০৩০ সালের মধ্যে এই সুবিধাগুলিতে শিল্পটি ৭ ট্রিলিয়ন ডলার ব্যয় করবে বলে আশা করা হচ্ছে। ওয়াল স্ট্রিটের বিনিয়োগকারীরা উদ্বিগ্ন যে অ্যানথ্রপিক, ওপেনএআই, মাইক্রোসফ্ট এবং গুগলের আয় খরচ মেটানোর জন্য যথেষ্ট হবে কিনা।
"আয় তৈরির জন্য আমাদের উচ্চমানের, সম্ভাব্য ব্যবহারের কেস প্রয়োজন। আমরা এখনও সেখানে পৌঁছাইনি," বলেছেন ক্রিয়েটিভ স্ট্র্যাটেজিজ বিশ্লেষক বেন বাজারিন।
![]() |
Google-এর WebDev Arena বেঞ্চমার্কে Gemini 3 Pro স্কোর। ছবি: গুগল । |
গুগলের এআই-এর প্রধান প্রযুক্তি কর্মকর্তা কোরে কাভুক্কুওগলু বলেন, গুগল সার্চে কোম্পানি এটি স্থাপন করলে জেমিনির নির্ভুলতা আরও উন্নত হবে। সার্চ ইঞ্জিনের সাথে মিলিত হলে, মডেলটি তাৎক্ষণিকভাবে তথ্য পুনরুদ্ধার এবং প্রমাণীকরণ করতে পারে। অবশ্যই, এটি কেবল একটি নির্দিষ্ট পরিমাণে কাজ করে।
"মানুষ যদি নীল লিঙ্কে ক্লিক করা এড়াতে গুগলে যায়, তাহলে সেটা যথেষ্ট নয়," বলেছেন ওউমির সহ-প্রতিষ্ঠাতা মানোস কৌকৌমিডিস, একটি স্টার্টআপ যা ব্যবসাগুলিকে স্বয়ংক্রিয় এবং এআই সমাধান স্থাপনে সহায়তা করে।
ব্যবহারকারী সংখ্যা বাড়ানোর জন্য, গুগল জানিয়েছে যে তারা মার্কিন যুক্তরাষ্ট্রের কলেজ ছাত্রদের জন্য এক বছরের জন্য বিনামূল্যে AI Pro অফার করবে। কোম্পানিটি ডেটা বিশ্লেষণ এবং বহুভাষিক মিটিং রেকর্ড করার জন্য জেমিনি 3 ব্যবহার করে 20 টিরও বেশি অংশীদারদের তালিকাভুক্ত করেছে।
বাজারিনের মতে, নতুন বৈশিষ্ট্যগুলি ক্লাউড কম্পিউটিং বাজারে গুগলকে মাইক্রোসফ্ট এবং অ্যামাজনের সাথে প্রতিযোগিতা করতে সাহায্য করতে পারে। অক্টোবরে, গুগল ঘোষণা করেছে যে সাম্প্রতিক প্রান্তিকে তাদের ক্লাউড আয় ১৫ বিলিয়ন মার্কিন ডলারে পৌঁছেছে, যা মূলত এআই চাহিদা থেকে এসেছে।
সূত্র: https://znews.vn/google-ra-mat-gemini-3-manh-me-hon-post1603987.html











মন্তব্য (0)