গুগল ডিপমাইন্ড জেনারেটিভ আর্টিফিশিয়াল ইন্টেলিজেন্স (GenAI) এর ক্ষেত্রে একটি বড় পদক্ষেপ নিয়ে এসেছে: জেমিনি ২.৫ ফ্ল্যাশ ইমেজ মডেল।

সম্প্রদায়ের কাছে স্নেহের সাথে "ন্যানো কলা" নামে পরিচিত, এই মডেলটি একটি শক্তিশালী হাতিয়ার, যা টেক্সটকে ছবিতে রূপান্তর করতে এবং বিদ্যমান ছবিগুলিকে অত্যন্ত নির্ভুলতা এবং নমনীয়তার সাথে সম্পাদনা করতে সক্ষম।

এটি জেমিনি মডেল লাইনেরই ধারাবাহিকতা, তবে এটি বিশেষভাবে চিত্র-সম্পর্কিত কাজের জন্য অপ্টিমাইজ করা হয়েছে।

c732a0fbdcce57900edf.jpg
৪ সেপ্টেম্বর ভিয়েতনামে গুগল ট্রেন্ডসে জেমিনি কীওয়ার্ডটি ট্রেন্ডিং তালিকার শীর্ষে ছিল। স্ক্রিনশট।

ছবি তৈরি এবং সম্পাদনার ক্ষেত্রে অসাধারণ সুবিধার সাথে, ন্যানো ব্যানানা ভিয়েতনাম সহ বিশ্বব্যাপী প্রযুক্তি ব্যবহারকারীদের কাছ থেকে ব্যাপক মনোযোগ আকর্ষণ করছে।

গুগল ট্রেন্ডস অনুসারে, গত ২৪ ঘন্টায় জেমিনি এবং ন্যানো ব্যানানা সম্পর্কে অনুসন্ধান আকাশচুম্বী হয়েছে। ৪ সেপ্টেম্বরের পরিসংখ্যান থেকে দেখা যায় যে "জেমিনি" শব্দটি সমস্ত বিষয়ের ট্রেন্ডিং চার্টের শীর্ষে রয়েছে।

ফোরাম এবং সোশ্যাল নেটওয়ার্কিং গ্রুপগুলিতে, ব্যবহারকারীরা ন্যানো ব্যানানা ব্যবহার করে ছবি তৈরির কমান্ড এবং স্ক্রিপ্টগুলি ভাগ করে এবং পরীক্ষা করে।

তাদের বেশিরভাগই "দ্রুত, ঝরঝরে এবং চটপটে" ছবি তৈরির ক্ষমতার পাশাপাশি টুলের আউটপুট পণ্যের গুণমানের অত্যন্ত প্রশংসা করেন।

শুধুমাত্র টেক্সট বর্ণনা থেকে ছবি তৈরি করার চেয়েও বেশি কিছুতে, জেমিনি ২.৫ ফ্ল্যাশ ইমেজ বেশ কয়েকটি মূল দিক থেকে উৎকৃষ্ট: চাহিদা অনুযায়ী ছবি সম্পাদনা, চরিত্রের ধারাবাহিকতা, চিত্তাকর্ষক প্রক্রিয়াকরণ গতি এবং সিন্থআইডি নিরাপত্তা প্রযুক্তি।

ব্যবহারকারীরা ছবির উপাদান পরিবর্তন করতে প্রাকৃতিক ভাষা ব্যবহার করতে পারেন। উদাহরণস্বরূপ, "টেবিলের পাশে একটি লাল চেয়ার যোগ করুন" অথবা "পটভূমিকে একটি বনে পরিবর্তন করুন" কমান্ডটি টাইপ করুন এবং মডেলটি নির্ভুলভাবে এবং নির্বিঘ্নে সম্পাদনা করবে।

চরিত্রের ধারাবাহিকতাকে সবচেয়ে যুগান্তকারী বৈশিষ্ট্য হিসেবে বিবেচনা করা হয়। মডেলটি বিভিন্ন ছবিতে ধারাবাহিক বৈশিষ্ট্য (যেমন মুখ, পোশাক, স্টাইল) সহ একটি চরিত্র বা বস্তুর ছবি মুখস্থ করতে এবং পুনরায় তৈরি করতে পারে।

এটি বিশেষ করে এমন সৃজনশীল প্রকল্পগুলির জন্য কার্যকর যেখানে কমিক্স থেকে শুরু করে মার্কেটিং প্রচারণা পর্যন্ত সম্পর্কিত চিত্রগুলির একটি সিরিজ তৈরি করতে হয়।

এর অপ্টিমাইজড আর্কিটেকচারের সাহায্যে, জেমিনি ২.৫ ফ্ল্যাশ ইমেজ কয়েক সেকেন্ডের মধ্যে উচ্চ-মানের ফলাফল তৈরি করতে পারে, যা সৃজনশীল কর্মপ্রবাহকে উল্লেখযোগ্যভাবে ত্বরান্বিত করে।

মডেল দ্বারা তৈরি বা সম্পাদিত সমস্ত ছবি গুগলের একটি মালিকানাধীন অদৃশ্য ডিজিটাল ওয়াটারমার্ক দিয়ে ট্যাগ করা হয়, যা AI-উত্পাদিত ছবিগুলিকে স্বীকৃতি দেওয়ার অনুমতি দেয়, স্বচ্ছতা এবং সামগ্রীর উৎপত্তি নিশ্চিত করতে অবদান রাখে।

জেমিনি ২.৫ ফ্ল্যাশ ইমেজ মডেলটি ব্যবহারকারী থেকে শুরু করে পেশাদার ডেভেলপারদের জন্য বিস্তৃত অ্যাপ্লিকেশন সম্ভাবনার দ্বার উন্মোচন করছে।

ডেভেলপাররা জেমিনি এপিআই এবং গুগল এআই স্টুডিওর মাধ্যমে মডেলটি অ্যাক্সেস করে তাদের নিজস্ব অ্যাপ্লিকেশন তৈরি করতে পারে, অন্যদিকে ব্যবসাগুলি ভার্টেক্স এআই প্ল্যাটফর্মে মডেলটি ব্যবহার করতে পারে।

গড় ব্যবহারকারীর জন্য, মডেলটি সরাসরি গুগল জেমিনি এবং অন্যান্য অ্যাপের মধ্যে তৈরি করা হয়েছে, যা এআই ইমেজিংকে একটি অ্যাক্সেসযোগ্য এবং স্বজ্ঞাত হাতিয়ার করে তোলে।

এর অসাধারণ বৈশিষ্ট্যগুলির সাথে, বিশেষ করে চরিত্রের ধারাবাহিকতা বজায় রাখার ক্ষমতার সাথে, জেমিনি 2.5 ফ্ল্যাশ ইমেজ ফটোশপের মতো ঐতিহ্যবাহী ফটো এডিটিং সফ্টওয়্যারের একটি শক্তিশালী প্রতিযোগী হয়ে উঠবে বলে আশা করা হচ্ছে, যা নির্মাতা এবং ব্যবহারকারীদের ডিজিটাল চিত্রগুলির সাথে যোগাযোগের পদ্ধতি পরিবর্তন করবে।

বিশ্বব্যাপী AI অনুবাদ প্রতিযোগিতায় চীন অপ্রত্যাশিতভাবে মার্কিন যুক্তরাষ্ট্রকে ছাড়িয়ে গেছে । WMT25 সম্মেলনের কাঠামোর মধ্যে আন্তর্জাতিক মেশিন অনুবাদ প্রতিযোগিতায় টেনসেন্টের ওপেন-সোর্স হুনয়ুয়ান-এমটি-7বি মডেল (চীন) প্রায় সম্পূর্ণরূপে মার্কিন 'জায়ান্টদের' উপর জয়লাভ করেছে।

সূত্র: https://vietnamnet.vn/nano-banana-la-gi-ma-khien-moi-nguoi-xon-xao-dung-dau-google-trends-viet-nam-2439283.html