![]() |
গুগল জেমিনি লোগো। ছবি: ব্লুমবার্গ । |
নভেম্বরের শেষের দিকে গুগল জেমিনি ৩ মডেলটি চালু করে। কোম্পানিটি উন্নত কোডিং ক্ষমতা, ভিজ্যুয়াল ইমেজ তৈরি এবং ব্যবহারকারীর পক্ষে নির্দিষ্ট কাজ সম্পাদনকারী এজেন্টের মতো উল্লেখযোগ্য আপগ্রেডের একটি সিরিজ চালু করেছে।
জেমিনি ৩ চালু করার সময়, গুগল জোর দিয়ে বলেছিল যে এটি কোম্পানির "এখনও পর্যন্ত সবচেয়ে স্মার্ট মডেল"। বাস্তব অভিজ্ঞতা দেখায় যে মডেলটি দ্রুত প্রক্রিয়া করে এবং আরও ভাল যুক্তি ক্ষমতা রাখে, যদিও এখনও উন্নতির জন্য কিছু ক্ষেত্র রয়েছে।
দ্রুত ইন্টারেক্টিভ ইন্টারফেস তৈরি করুন।
জেমিনি ৩-এর অন্যতম প্রধান আপগ্রেড হল ক্যানভাস। এটি জেমিনির মধ্যে একটি ইন্টারেক্টিভ ওয়ার্কস্পেস যা আপনাকে চ্যাটবটগুলিকে কোড লিখতে, ফলাফল কল্পনা করতে এবং কন্টেন্ট সম্পাদনা করতে বলতে দেয়।
যখন জেমিনি ৩-কে একটি ফুটবল বল, পৃথিবী, সূর্য এবং মিল্কিওয়ের আকারের পার্থক্যের একটি ত্রিমাত্রিক মডেল তৈরি করতে বলা হয়, তখন টুলটি একটি কোডিং ইন্টারফেস সক্রিয় করে, প্রক্রিয়া করে এবং একটি ইন্টারেক্টিভ পরিবেশ তৈরি করে, যা ব্যবহারকারীদের বস্তুর আকার নির্বাচন এবং তুলনা করার সুযোগ দেয়।
![]() |
জেমিনি ৩-এ ক্যানভাস বৈশিষ্ট্য ব্যবহার করে ইন্টারেক্টিভ স্পেস তৈরি করার ক্ষমতা। |
গুগলের ডেমোর তুলনায়, ফলাফলের মানের দিক থেকে কিছুটা নিম্নমানের। তবে, বস্তু সম্পর্কে তথ্য স্পষ্ট এবং বোধগম্য। প্রক্রিয়াকরণের সময় প্রায় ২ মিনিট। ক্যানভাস ইন্টারফেসে, ব্যবহারকারীরা সরাসরি কোড সম্পাদনা, অনুলিপি বা সামগ্রী ভাগ করতে পারেন।
আরেকটি কমান্ডের মাধ্যমে, জেমিনি 3 কে গাছের ডালে বসে থাকা একটি ঈগলের একটি 3D কিউব-স্টাইল (ভক্সেল) মডেল তৈরি করতে বলা হয়েছিল। এই টুলটি প্রায় 45 সেকেন্ডের মধ্যে ফলাফল তৈরি করেছিল এবং ব্যবহারকারীরা মাউস ব্যবহার করে ভিউ জুম করতে এবং ঘোরাতে পারত। তবে, ছবিতে কিছু বিবরণে গ্রাফিক্যাল ত্রুটি ছিল এবং স্থিরভাবে প্রদর্শিত হয়নি।
গাছের ডালে বসে থাকা ঈগলটিও উপস্থিত ছিল, কিন্তু প্রয়োজনটি আরও কঠিন ছিল (একটি 3D মডেল)। প্রাথমিকভাবে, জেমিনি 3 দ্বারা তৈরি কোডটি ব্যর্থ হয়েছিল এবং কাজ করছিল না। পরিবর্তনের অনুরোধ করার পরে, ছবিটি উপস্থিত হয়েছিল এবং ইন্টারেক্টিভ হয়ে ওঠে।
![]() |
মিথস্ক্রিয় পরিবেশ তৈরির জন্য জেমিনি ৩ এর ক্ষমতা। |
কিছু সমস্যা থাকা সত্ত্বেও, প্রশ্নোত্তর মডেল থেকে একটি সহযোগী, সম্পাদনা পদ্ধতিতে স্থানান্তর একটি আকর্ষণীয় দিক, যা জেমিনি 3 কে জটিল, দীর্ঘমেয়াদী কাজের জন্য কার্যকর করে তোলে।
অবশ্যই, জেমিনি ৩ শুধুমাত্র গ্রাফিক্স বা ভিজ্যুয়াল মডেল তৈরির জন্য নয়। গুগল এআই প্রো ব্যবহারকারীদের জন্য একটি "জেনারেটিভ UI" বৈশিষ্ট্য পরীক্ষা করছে। নির্দিষ্ট কমান্ডের সাহায্যে, মডেলটি ইন্টারেক্টিভ ম্যাগাজিন-স্টাইল ইন্টারফেস বা ভিজ্যুয়াল ওয়েবসাইট তৈরি করতে পারে।
গুগল বলছে যে এই বৈশিষ্ট্যটি পর্যায়ক্রমে চালু করা হচ্ছে। দ্য ভার্জের অভিজ্ঞতা অনুসারে, ব্যবহারকারীদের ভিজ্যুয়াল লেআউট বৈশিষ্ট্যটি নির্বাচন করতে হবে, তারপর "রোমে আমার ৩ দিনের ভ্রমণের পরিকল্পনা করুন" এর মতো একটি কমান্ড লিখতে হবে।
প্রক্রিয়াকরণের পর, জেমিনি 3 একটি ভ্রমণ ওয়েবসাইটের মতো ফলাফল তৈরি করে, যার মধ্যে ভ্রমণপথ, বিস্তারিত ছবি এবং ভ্রমণের পছন্দ এবং খাদ্যাভ্যাস সম্পর্কে কিছু প্রশ্ন থাকে। এরপর মডেলটি সেই অনুযায়ী উত্তরগুলি সামঞ্জস্য করে। এই বৈশিষ্ট্যটি কম্পিউটার কীভাবে একত্রিত করতে হয় বা অ্যাকোয়ারিয়াম তৈরি করতে হয় তার মতো বিষয়গুলির জন্যও বেশ কার্যকর।
আরও কার্যকর যুক্তি এবং বিশ্লেষণ।
গুগলের মতে, জেমিনি ৩ এর যুক্তি ক্ষমতা তার পূর্বসূরীর তুলনায় ভালো। কোম্পানি দাবি করেছে যে জেমিনি ৩ প্রো এর যুক্তি ক্ষমতা ডক্টরেট স্তরে পৌঁছেছে, হিউম্যানিটি'স লাস্ট পরীক্ষায় ৩৭.৫% এবং জিপিকিউএ ডায়মন্ড পরীক্ষায় ৯১.৯% স্কোর করেছে।
অবশ্যই, ব্যবহারকারীরা কেবলমাত্র মডেলের সাথে সরাসরি যোগাযোগ করলেই পার্থক্যটি সত্যিকার অর্থে উপলব্ধি করতে পারবেন। GPQA ডায়মন্ড রেফারেন্স প্রশ্ন সেট (ডক্টরেট স্তরের উপর দৃষ্টি নিবদ্ধ করে) থেকে কোনও সমস্যার সমাধান করতে বলা হলে, জেমিনি 3 প্রো ধাপে ধাপে নির্দেশাবলী এবং চিত্রিত ছবি সহ একটি বিস্তারিত সমাধান প্রদান করতে প্রায় 30 সেকেন্ড সময় নিয়েছে।
![]() |
মিথুন ৩ জটিল প্রশ্নের উত্তর দিতে পারে, পিএইচডি স্তরের সমতুল্য চিন্তা করার ক্ষমতা প্রদর্শন করে। |
মূল্যায়ন অনুসারে, সমাধানটি বেশ বিস্তারিত এবং সঠিক পদ্ধতি অনুসরণ করে। তুলনা করার জন্য, GPT-5.1 সঠিক উত্তর দিতে প্রায় 30 সেকেন্ড সময় নিয়েছে, কিন্তু সমাধানটি কম বিস্তারিত ছিল। একইভাবে, Claude 4.5 Sonnet সঠিক এবং Gemini 3 এর চেয়ে দ্রুত উত্তর দিয়েছে, কিন্তু কম বিস্তারিত ছিল।
গুগল বলছে যে জেমিনি ৩ একাধিক উৎস থেকে একসাথে ডকুমেন্ট বের করতে পারে, যেমন টেক্সট, ছবি এবং ভিডিও । যেসব কাজ আগে কখনও শেখা হয়নি সেগুলোও জেমিনি ৩ তে আরও ভালোভাবে পরিচালিত হয়।
![]() |
জেমিনি ৩ এর ভিডিও বিশ্লেষণ ক্ষমতা। |
উদাহরণস্বরূপ, ৫৭ মিনিটের একটি ভিডিওর মূল বিষয় বিশ্লেষণ করতে বলা হলে, জেমিনি ৩ ভিডিওর সংশ্লিষ্ট অংশে অনুরোধকৃত যুক্তি এবং টাইমস্ট্যাম্প সহ ফলাফল প্রদান করতে মাত্র এক মিনিট সময় নেয়। একইভাবে, মডেলটি প্রতিটি ক্রীড়াবিদের ম্যাচ এবং খেলার ধরণ বিশ্লেষণ করে একটি টেনিস ভিডিও সঠিকভাবে শনাক্ত করেছে।
ব্যবহারকারীরা জেমিনি ৩-কে একই সাথে ভিডিও দেখতে এবং বহিরাগত উৎসগুলি উল্লেখ করতে বলতে পারেন, এমনকি গভীর বিশ্লেষণের জন্য প্রশ্ন জিজ্ঞাসা করতে পারেন। সামগ্রিকভাবে, জেমিনি ৩ বিশ্লেষণাত্মক এবং ডকুমেন্ট-রেফারেন্সিং কাজে বেশ প্রতিক্রিয়াশীল, আংশিকভাবে গুগল সার্চ ডাটাবেসের সাথে এর সংযোগের জন্য ধন্যবাদ।
এজেন্ট সহায়ক, কিন্তু এখনও কিছু সমস্যা আছে।
এজেন্ট বৈশিষ্ট্যটিও জেমিনি ৩-এর একটি উল্লেখযোগ্য আপগ্রেড। এআই আল্ট্রা প্ল্যানের ব্যবহারকারীদের জন্য (বর্তমানে শুধুমাত্র মার্কিন বাজারে উপলব্ধ), এই মোড ব্যবহারকারীর পক্ষে জটিল কাজ সম্পাদন করতে পারে, যেমন ইমেল শ্রেণীবদ্ধ করা এবং সংগঠিত করা, তথ্য অনুসন্ধান করা এবং ভ্রমণ টিকিট বুক করা।
জেমিনি ৩ চালু করার সময়, গুগল জিমেইলে ইনবক্স সংগঠিত করার ক্ষমতার উদাহরণ ব্যবহার করেছিল। দ্য ভার্জের অভিজ্ঞতা অনুসারে, এই বৈশিষ্ট্যটি ঠিক যেমনটি অনুরোধ করা হয়েছিল তেমনই কাজ করে: এক সপ্তাহের জন্য অপঠিত ইমেলের সম্পূর্ণ তালিকা তৈরি করা।
ক্যানভাস বৈশিষ্ট্যের মতো, ইমেল তালিকা এবং প্রস্তাবিত পদক্ষেপগুলি একটি পৃথক এলাকায় প্রদর্শিত হয়। জেমিনি গুরুত্বপূর্ণ ইমেলের জন্য অনুস্মারক সেট করা, প্রচারমূলক ইমেলগুলি সংরক্ষণাগারভুক্ত করা ইত্যাদির মতো বেশ কয়েকটি বিকল্প অফার করে।
![]() |
জেমিনি ৩ এর এজেন্ট বৈশিষ্ট্যটি জিমেইল ইনবক্স পরিচালনা করতে সাহায্য করে। ছবি: দ্য ভার্জ । |
বিল পেমেন্ট রিমাইন্ডার তৈরি করার অনুরোধ জানানো হলে, জেমিনি দ্রুত গুগল টাস্কে প্রাসঙ্গিক তথ্য ইনপুট করে। পেমেন্ট টাস্কের জন্য, এজেন্ট স্বয়ংক্রিয়ভাবে নেভিগেট করে এবং ব্যবহারকারীর পেমেন্ট তথ্য প্রবেশ করানোর প্রয়োজন হলে থামে।
সামগ্রিকভাবে, জেমিনি ৩ এর এজেন্ট ব্যবহারকারীরা যে ইমেলগুলি ভুলে যান সেগুলি সনাক্ত করতে বেশ কার্যকর। এই সরঞ্জামটি বিজ্ঞাপন ঠিকানা থেকে আসা ইমেলগুলি খুঁজে পেতে এবং আনসাবস্ক্রাইব করতে পারে, যেগুলি আর কার্যকর নয়।
আসলে, Perplexity এবং ChatGPT-এর মতো কিছু চ্যাটবটের এজেন্টরা ইতিমধ্যেই Gmail-এর সাথে ইন্টিগ্রেশন সমর্থন করে। তবে, Gemini সবচেয়ে বৈচিত্র্যপূর্ণ ইন্টিগ্রেশন ক্ষমতা প্রদান করে। উদাহরণস্বরূপ, Perplexity ব্যবহারকারীদের নির্দিষ্টভাবে সেই ইমেলগুলি প্রবেশ করতে হবে যা তারা রাখতে বা মুছে ফেলতে চান, যদিও এই ক্রিয়াগুলি Gemini-এর বোতামগুলির মাধ্যমে সম্পাদন করা যেতে পারে।
![]() |
জেমিনি ৩ এর ইন্টারেক্টিভ ইন্টারফেস তৈরির বৈশিষ্ট্য। ছবি: দ্য ভার্জ । |
ChatGPT-তে ইমেল সাজানোর বৈশিষ্ট্যটিও অস্থির। তবে, জেমিনির ইমেল পাঠানোর গতি Perplexity-এর চেয়ে ধীর। কিছু কাজ, যেমন রেস্তোরাঁ রিজার্ভেশন করা, কখনও কখনও সমস্যার সম্মুখীন হয়।
যদিও পেমেন্ট বা ইমেল পাঠানোর মতো সংবেদনশীল কাজ করার আগে সর্বদা ব্যবহারকারীর নিশ্চিতকরণের প্রয়োজন হয়, তবুও AI-এর কাছে কিছু কাজ অর্পণ করা ব্যবহারকারীদের দ্বিধাগ্রস্ত করে তোলে। জেমিনি 3-এর এজেন্ট মোডটি বেশ কার্যকর, তবে ব্যবহারকারীদের এখনও আউটপুট পর্যবেক্ষণ করতে হবে।
সূত্র: https://znews.vn/gemini-3-tot-den-dau-post1607493.html













মন্তব্য (0)