Vietnam.vn - Nền tảng quảng bá Việt Nam

ChatGPT-এর সবচেয়ে বড় প্রতিযোগী

গুগলের সর্বশেষ এআই মডেল যুক্তি, চিন্তাভাবনা এবং কোড তৈরির ক্ষমতা উন্নত করে, কিন্তু জেমিনি ৩-কে নিখুঁত চ্যাটবট হিসেবে গড়ে তোলার জন্য এটি এখনও যথেষ্ট নয়।

ZNewsZNews06/12/2025

গুগল জেমিনি লোগো। ছবি: ব্লুমবার্গ

নভেম্বরের শেষের দিকে গুগল জেমিনি ৩ মডেলটি চালু করে। কোম্পানিটি উন্নত কোডিং ক্ষমতা, ভিজ্যুয়াল ইমেজ তৈরি এবং ব্যবহারকারীর পক্ষে নির্দিষ্ট কাজ সম্পাদনকারী এজেন্টের মতো উল্লেখযোগ্য আপগ্রেডের একটি সিরিজ চালু করেছে।

জেমিনি ৩ চালু করার সময়, গুগল জোর দিয়ে বলেছিল যে এটি কোম্পানির "এখনও পর্যন্ত সবচেয়ে স্মার্ট মডেল"। বাস্তব অভিজ্ঞতা দেখায় যে মডেলটি দ্রুত প্রক্রিয়া করে এবং আরও ভাল যুক্তি ক্ষমতা রাখে, যদিও এখনও উন্নতির জন্য কিছু ক্ষেত্র রয়েছে।

দ্রুত ইন্টারেক্টিভ ইন্টারফেস তৈরি করুন।

জেমিনি ৩-এর অন্যতম প্রধান আপগ্রেড হল ক্যানভাস। এটি জেমিনির মধ্যে একটি ইন্টারেক্টিভ ওয়ার্কস্পেস যা আপনাকে চ্যাটবটগুলিকে কোড লিখতে, ফলাফল কল্পনা করতে এবং কন্টেন্ট সম্পাদনা করতে বলতে দেয়।

যখন জেমিনি ৩-কে একটি ফুটবল বল, পৃথিবী, সূর্য এবং মিল্কিওয়ের আকারের পার্থক্যের একটি ত্রিমাত্রিক মডেল তৈরি করতে বলা হয়, তখন টুলটি একটি কোডিং ইন্টারফেস সক্রিয় করে, প্রক্রিয়া করে এবং একটি ইন্টারেক্টিভ পরিবেশ তৈরি করে, যা ব্যবহারকারীদের বস্তুর আকার নির্বাচন এবং তুলনা করার সুযোগ দেয়।

Gemini 3 la gi,  danh gia Gemini 3,  mo hinh Gemini 3,  Google Gemini 3 Pro anh 1

জেমিনি ৩-এ ক্যানভাস বৈশিষ্ট্য ব্যবহার করে ইন্টারেক্টিভ স্পেস তৈরি করার ক্ষমতা।

গুগলের ডেমোর তুলনায়, ফলাফলের মানের দিক থেকে কিছুটা নিম্নমানের। তবে, বস্তু সম্পর্কে তথ্য স্পষ্ট এবং বোধগম্য। প্রক্রিয়াকরণের সময় প্রায় ২ মিনিট। ক্যানভাস ইন্টারফেসে, ব্যবহারকারীরা সরাসরি কোড সম্পাদনা, অনুলিপি বা সামগ্রী ভাগ করতে পারেন।

আরেকটি কমান্ডের মাধ্যমে, জেমিনি 3 কে গাছের ডালে বসে থাকা একটি ঈগলের একটি 3D কিউব-স্টাইল (ভক্সেল) মডেল তৈরি করতে বলা হয়েছিল। এই টুলটি প্রায় 45 সেকেন্ডের মধ্যে ফলাফল তৈরি করেছিল এবং ব্যবহারকারীরা মাউস ব্যবহার করে ভিউ জুম করতে এবং ঘোরাতে পারত। তবে, ছবিতে কিছু বিবরণে গ্রাফিক্যাল ত্রুটি ছিল এবং স্থিরভাবে প্রদর্শিত হয়নি।

গাছের ডালে বসে থাকা ঈগলটিও উপস্থিত ছিল, কিন্তু প্রয়োজনটি আরও কঠিন ছিল (একটি 3D মডেল)। প্রাথমিকভাবে, জেমিনি 3 দ্বারা তৈরি কোডটি ব্যর্থ হয়েছিল এবং কাজ করছিল না। পরিবর্তনের অনুরোধ করার পরে, ছবিটি উপস্থিত হয়েছিল এবং ইন্টারেক্টিভ হয়ে ওঠে।

Gemini 3 la gi,  danh gia Gemini 3,  mo hinh Gemini 3,  Google Gemini 3 Pro anh 2

মিথস্ক্রিয় পরিবেশ তৈরির জন্য জেমিনি ৩ এর ক্ষমতা।

কিছু সমস্যা থাকা সত্ত্বেও, প্রশ্নোত্তর মডেল থেকে একটি সহযোগী, সম্পাদনা পদ্ধতিতে স্থানান্তর একটি আকর্ষণীয় দিক, যা জেমিনি 3 কে জটিল, দীর্ঘমেয়াদী কাজের জন্য কার্যকর করে তোলে।

অবশ্যই, জেমিনি ৩ শুধুমাত্র গ্রাফিক্স বা ভিজ্যুয়াল মডেল তৈরির জন্য নয়। গুগল এআই প্রো ব্যবহারকারীদের জন্য একটি "জেনারেটিভ UI" বৈশিষ্ট্য পরীক্ষা করছে। নির্দিষ্ট কমান্ডের সাহায্যে, মডেলটি ইন্টারেক্টিভ ম্যাগাজিন-স্টাইল ইন্টারফেস বা ভিজ্যুয়াল ওয়েবসাইট তৈরি করতে পারে।

গুগল বলছে যে এই বৈশিষ্ট্যটি পর্যায়ক্রমে চালু করা হচ্ছে। দ্য ভার্জের অভিজ্ঞতা অনুসারে, ব্যবহারকারীদের ভিজ্যুয়াল লেআউট বৈশিষ্ট্যটি নির্বাচন করতে হবে, তারপর "রোমে আমার ৩ দিনের ভ্রমণের পরিকল্পনা করুন" এর মতো একটি কমান্ড লিখতে হবে।

প্রক্রিয়াকরণের পর, জেমিনি 3 একটি ভ্রমণ ওয়েবসাইটের মতো ফলাফল তৈরি করে, যার মধ্যে ভ্রমণপথ, বিস্তারিত ছবি এবং ভ্রমণের পছন্দ এবং খাদ্যাভ্যাস সম্পর্কে কিছু প্রশ্ন থাকে। এরপর মডেলটি সেই অনুযায়ী উত্তরগুলি সামঞ্জস্য করে। এই বৈশিষ্ট্যটি কম্পিউটার কীভাবে একত্রিত করতে হয় বা অ্যাকোয়ারিয়াম তৈরি করতে হয় তার মতো বিষয়গুলির জন্যও বেশ কার্যকর।

আরও কার্যকর যুক্তি এবং বিশ্লেষণ।

গুগলের মতে, জেমিনি ৩ এর যুক্তি ক্ষমতা তার পূর্বসূরীর তুলনায় ভালো। কোম্পানি দাবি করেছে যে জেমিনি ৩ প্রো এর যুক্তি ক্ষমতা ডক্টরেট স্তরে পৌঁছেছে, হিউম্যানিটি'স লাস্ট পরীক্ষায় ৩৭.৫% এবং জিপিকিউএ ডায়মন্ড পরীক্ষায় ৯১.৯% স্কোর করেছে।

অবশ্যই, ব্যবহারকারীরা কেবলমাত্র মডেলের সাথে সরাসরি যোগাযোগ করলেই পার্থক্যটি সত্যিকার অর্থে উপলব্ধি করতে পারবেন। GPQA ডায়মন্ড রেফারেন্স প্রশ্ন সেট (ডক্টরেট স্তরের উপর দৃষ্টি নিবদ্ধ করে) থেকে কোনও সমস্যার সমাধান করতে বলা হলে, জেমিনি 3 প্রো ধাপে ধাপে নির্দেশাবলী এবং চিত্রিত ছবি সহ একটি বিস্তারিত সমাধান প্রদান করতে প্রায় 30 সেকেন্ড সময় নিয়েছে।

Gemini 3 la gi,  danh gia Gemini 3,  mo hinh Gemini 3,  Google Gemini 3 Pro anh 3

মিথুন ৩ জটিল প্রশ্নের উত্তর দিতে পারে, পিএইচডি স্তরের সমতুল্য চিন্তা করার ক্ষমতা প্রদর্শন করে।

মূল্যায়ন অনুসারে, সমাধানটি বেশ বিস্তারিত এবং সঠিক পদ্ধতি অনুসরণ করে। তুলনা করার জন্য, GPT-5.1 সঠিক উত্তর দিতে প্রায় 30 সেকেন্ড সময় নিয়েছে, কিন্তু সমাধানটি কম বিস্তারিত ছিল। একইভাবে, Claude 4.5 Sonnet সঠিক এবং Gemini 3 এর চেয়ে দ্রুত উত্তর দিয়েছে, কিন্তু কম বিস্তারিত ছিল।

গুগল বলছে যে জেমিনি ৩ একাধিক উৎস থেকে একসাথে ডকুমেন্ট বের করতে পারে, যেমন টেক্সট, ছবি এবং ভিডিও । যেসব কাজ আগে কখনও শেখা হয়নি সেগুলোও জেমিনি ৩ তে আরও ভালোভাবে পরিচালিত হয়।

Gemini 3 la gi,  danh gia Gemini 3,  mo hinh Gemini 3,  Google Gemini 3 Pro anh 4

জেমিনি ৩ এর ভিডিও বিশ্লেষণ ক্ষমতা।

উদাহরণস্বরূপ, ৫৭ মিনিটের একটি ভিডিওর মূল বিষয় বিশ্লেষণ করতে বলা হলে, জেমিনি ৩ ভিডিওর সংশ্লিষ্ট অংশে অনুরোধকৃত যুক্তি এবং টাইমস্ট্যাম্প সহ ফলাফল প্রদান করতে মাত্র এক মিনিট সময় নেয়। একইভাবে, মডেলটি প্রতিটি ক্রীড়াবিদের ম্যাচ এবং খেলার ধরণ বিশ্লেষণ করে একটি টেনিস ভিডিও সঠিকভাবে শনাক্ত করেছে।

ব্যবহারকারীরা জেমিনি ৩-কে একই সাথে ভিডিও দেখতে এবং বহিরাগত উৎসগুলি উল্লেখ করতে বলতে পারেন, এমনকি গভীর বিশ্লেষণের জন্য প্রশ্ন জিজ্ঞাসা করতে পারেন। সামগ্রিকভাবে, জেমিনি ৩ বিশ্লেষণাত্মক এবং ডকুমেন্ট-রেফারেন্সিং কাজে বেশ প্রতিক্রিয়াশীল, আংশিকভাবে গুগল সার্চ ডাটাবেসের সাথে এর সংযোগের জন্য ধন্যবাদ।

এজেন্ট সহায়ক, কিন্তু এখনও কিছু সমস্যা আছে।

এজেন্ট বৈশিষ্ট্যটিও জেমিনি ৩-এর একটি উল্লেখযোগ্য আপগ্রেড। এআই আল্ট্রা প্ল্যানের ব্যবহারকারীদের জন্য (বর্তমানে শুধুমাত্র মার্কিন বাজারে উপলব্ধ), এই মোড ব্যবহারকারীর পক্ষে জটিল কাজ সম্পাদন করতে পারে, যেমন ইমেল শ্রেণীবদ্ধ করা এবং সংগঠিত করা, তথ্য অনুসন্ধান করা এবং ভ্রমণ টিকিট বুক করা।

জেমিনি ৩ চালু করার সময়, গুগল জিমেইলে ইনবক্স সংগঠিত করার ক্ষমতার উদাহরণ ব্যবহার করেছিল। দ্য ভার্জের অভিজ্ঞতা অনুসারে, এই বৈশিষ্ট্যটি ঠিক যেমনটি অনুরোধ করা হয়েছিল তেমনই কাজ করে: এক সপ্তাহের জন্য অপঠিত ইমেলের সম্পূর্ণ তালিকা তৈরি করা।

ক্যানভাস বৈশিষ্ট্যের মতো, ইমেল তালিকা এবং প্রস্তাবিত পদক্ষেপগুলি একটি পৃথক এলাকায় প্রদর্শিত হয়। জেমিনি গুরুত্বপূর্ণ ইমেলের জন্য অনুস্মারক সেট করা, প্রচারমূলক ইমেলগুলি সংরক্ষণাগারভুক্ত করা ইত্যাদির মতো বেশ কয়েকটি বিকল্প অফার করে।

Gemini 3 la gi,  danh gia Gemini 3,  mo hinh Gemini 3,  Google Gemini 3 Pro anh 5

জেমিনি ৩ এর এজেন্ট বৈশিষ্ট্যটি জিমেইল ইনবক্স পরিচালনা করতে সাহায্য করে। ছবি: দ্য ভার্জ

বিল পেমেন্ট রিমাইন্ডার তৈরি করার অনুরোধ জানানো হলে, জেমিনি দ্রুত গুগল টাস্কে প্রাসঙ্গিক তথ্য ইনপুট করে। পেমেন্ট টাস্কের জন্য, এজেন্ট স্বয়ংক্রিয়ভাবে নেভিগেট করে এবং ব্যবহারকারীর পেমেন্ট তথ্য প্রবেশ করানোর প্রয়োজন হলে থামে।

সামগ্রিকভাবে, জেমিনি ৩ এর এজেন্ট ব্যবহারকারীরা যে ইমেলগুলি ভুলে যান সেগুলি সনাক্ত করতে বেশ কার্যকর। এই সরঞ্জামটি বিজ্ঞাপন ঠিকানা থেকে আসা ইমেলগুলি খুঁজে পেতে এবং আনসাবস্ক্রাইব করতে পারে, যেগুলি আর কার্যকর নয়।

আসলে, Perplexity এবং ChatGPT-এর মতো কিছু চ্যাটবটের এজেন্টরা ইতিমধ্যেই Gmail-এর সাথে ইন্টিগ্রেশন সমর্থন করে। তবে, Gemini সবচেয়ে বৈচিত্র্যপূর্ণ ইন্টিগ্রেশন ক্ষমতা প্রদান করে। উদাহরণস্বরূপ, Perplexity ব্যবহারকারীদের নির্দিষ্টভাবে সেই ইমেলগুলি প্রবেশ করতে হবে যা তারা রাখতে বা মুছে ফেলতে চান, যদিও এই ক্রিয়াগুলি Gemini-এর বোতামগুলির মাধ্যমে সম্পাদন করা যেতে পারে।

Gemini 3 la gi,  danh gia Gemini 3,  mo hinh Gemini 3,  Google Gemini 3 Pro anh 6

জেমিনি ৩ এর ইন্টারেক্টিভ ইন্টারফেস তৈরির বৈশিষ্ট্য। ছবি: দ্য ভার্জ

ChatGPT-তে ইমেল সাজানোর বৈশিষ্ট্যটিও অস্থির। তবে, জেমিনির ইমেল পাঠানোর গতি Perplexity-এর চেয়ে ধীর। কিছু কাজ, যেমন রেস্তোরাঁ রিজার্ভেশন করা, কখনও কখনও সমস্যার সম্মুখীন হয়।

যদিও পেমেন্ট বা ইমেল পাঠানোর মতো সংবেদনশীল কাজ করার আগে সর্বদা ব্যবহারকারীর নিশ্চিতকরণের প্রয়োজন হয়, তবুও AI-এর কাছে কিছু কাজ অর্পণ করা ব্যবহারকারীদের দ্বিধাগ্রস্ত করে তোলে। জেমিনি 3-এর এজেন্ট মোডটি বেশ কার্যকর, তবে ব্যবহারকারীদের এখনও আউটপুট পর্যবেক্ষণ করতে হবে।

সূত্র: https://znews.vn/gemini-3-tot-den-dau-post1607493.html


মন্তব্য (0)

আপনার অনুভূতি শেয়ার করতে একটি মন্তব্য করুন!

একই বিভাগে

একই লেখকের

ঐতিহ্য

চিত্র

ব্যবসা

বর্তমান ঘটনা

রাজনৈতিক ব্যবস্থা

স্থানীয়

পণ্য

Happy Vietnam
হান

হান

ভিয়েতনামের পতাকা

ভিয়েতনামের পতাকা

জীবনের মাধুর্য

জীবনের মাধুর্য