গুগল ডিপমাইন্ড জেনারেটিভ আর্টিফিশিয়াল ইন্টেলিজেন্স (GenAI) এর ক্ষেত্রে একটি বড় অগ্রগতি এনেছে: জেমিনি ২.৫ ফ্ল্যাশ ইমেজ মডেল।

সম্প্রদায়ের কাছে স্নেহের সাথে "ন্যানো কলা" নামে পরিচিত, এই মডেলটি একটি শক্তিশালী হাতিয়ার যা টেক্সটকে ছবিতে রূপান্তর করতে এবং বিদ্যমান ছবিগুলিকে উচ্চ নির্ভুলতা এবং নমনীয়তার সাথে সম্পাদনা করতে সক্ষম।

এটি জেমিনি মডেল লাইনের উত্তরসূরী, তবে বিশেষভাবে চিত্র-সম্পর্কিত কাজের জন্য অপ্টিমাইজ করা হয়েছে।

c732a0fbdcce57900edf.jpg
৪ঠা সেপ্টেম্বর ভিয়েতনামে গুগল ট্রেন্ডসে জেমিনি কীওয়ার্ড ট্রেন্ডিং তালিকার শীর্ষে ছিল। (স্ক্রিনশট)

ছবি তৈরি এবং সম্পাদনার ক্ষেত্রে অসাধারণ দক্ষতার সাথে, ন্যানো ব্যানানা ভিয়েতনাম সহ বিশ্বব্যাপী প্রযুক্তি ব্যবহারকারীদের কাছ থেকে উল্লেখযোগ্য মনোযোগ আকর্ষণ করছে।

গুগল ট্রেন্ডস অনুসারে, গত ২৪ ঘন্টায় জেমিনি এবং ন্যানো ব্যানানার অনুসন্ধান বেড়েছে। ৪ঠা সেপ্টেম্বরের পরিসংখ্যান থেকে দেখা যায় যে "জেমিনি" শব্দটি সমস্ত বিষয়ের ট্রেন্ডিং চার্টের শীর্ষে রয়েছে।

ফোরাম এবং সোশ্যাল মিডিয়া গ্রুপগুলিতে, ব্যবহারকারীরা ন্যানো ব্যানানা ব্যবহার করে ছবি তৈরির কমান্ড এবং দৃশ্যকল্প শেয়ার এবং পরীক্ষা-নিরীক্ষা করে।

বেশিরভাগ মানুষই এই টুলটির দ্রুত এবং দক্ষতার সাথে ছবি তৈরির ক্ষমতার প্রশংসা করে, সেইসাথে এর আউটপুটের গুণমানেরও প্রশংসা করে।

কেবল টেক্সট বর্ণনা থেকে ছবি তৈরি করার পাশাপাশি, জেমিনি ২.৫ ফ্ল্যাশ ইমেজ বেশ কয়েকটি মূল ক্ষেত্রে উৎকৃষ্ট: কমান্ড-ভিত্তিক ছবি সম্পাদনা, চরিত্রের ধারাবাহিকতা বজায় রাখা, চিত্তাকর্ষক প্রক্রিয়াকরণ গতি এবং সিন্থআইডি নিরাপত্তা প্রযুক্তি।

ব্যবহারকারীরা ছবির উপাদান পরিবর্তন করতে প্রাকৃতিক ভাষা ব্যবহার করতে পারেন। উদাহরণস্বরূপ, "টেবিলের পাশে একটি লাল চেয়ার যোগ করুন" অথবা "পটভূমিকে একটি বনে পরিবর্তন করুন" কমান্ডটি প্রবেশ করালে, মডেলটি নির্ভুলভাবে এবং নির্বিঘ্নে সম্পাদনাগুলি সম্পাদন করবে।

চরিত্রের ধারাবাহিকতা বজায় রাখা সবচেয়ে যুগান্তকারী বৈশিষ্ট্য হিসেবে বিবেচিত হয়। মডেলটি একাধিক ভিন্ন ছবিতে ধারাবাহিক বৈশিষ্ট্য (যেমন মুখ, পোশাক, স্টাইল) সহ একটি চরিত্র বা বস্তুর চিত্র মনে রাখতে এবং পুনরুত্পাদন করতে পারে।

এটি বিশেষ করে সৃজনশীল প্রকল্পগুলির জন্য কার্যকর যেখানে কমিক্স থেকে শুরু করে মার্কেটিং প্রচারণা পর্যন্ত বিভিন্ন ধরণের সম্পর্কিত চিত্র তৈরি করতে হয়।

এর অপ্টিমাইজড আর্কিটেকচারের সাহায্যে, জেমিনি ২.৫ ফ্ল্যাশ ইমেজ মাত্র কয়েক সেকেন্ডের মধ্যে উচ্চমানের ফলাফল তৈরি করতে পারে, যা সৃজনশীল প্রক্রিয়াকে উল্লেখযোগ্যভাবে ত্বরান্বিত করে।

মডেল দ্বারা তৈরি বা সম্পাদিত সমস্ত ছবি গুগলের একটি মালিকানাধীন অদৃশ্য ডিজিটাল ওয়াটারমার্ক দিয়ে ট্যাগ করা হয়, যা AI ব্যবহার করে তৈরি ছবিগুলি সনাক্ত করার অনুমতি দেয়, এইভাবে সামগ্রীর স্বচ্ছতা এবং উৎপত্তি নিশ্চিত করতে সহায়তা করে।

জেমিনি ২.৫ ফ্ল্যাশ ইমেজ মডেলটি ব্যক্তিগত ব্যবহারকারী থেকে শুরু করে পেশাদার ডেভেলপার পর্যন্ত অনেক সম্ভাব্য অ্যাপ্লিকেশন উন্মোচন করছে।

ডেভেলপাররা জেমিনি এপিআই এবং গুগল এআই স্টুডিওর মাধ্যমে মডেলটি অ্যাক্সেস করে তাদের নিজস্ব অ্যাপ্লিকেশন তৈরি করতে পারে, অন্যদিকে ব্যবসাগুলি ভার্টেক্স এআই প্ল্যাটফর্মে মডেলটি ব্যবহার করতে পারে।

গড় ব্যবহারকারীর জন্য, এই মডেলটি সরাসরি গুগল জেমিনি এবং অন্যান্য অ্যাপ্লিকেশনের সাথে একীভূত করা হয়েছে, যা এআই ইমেজ তৈরিকে একটি অ্যাক্সেসযোগ্য এবং স্বজ্ঞাত হাতিয়ার করে তোলে।

এর অসাধারণ বৈশিষ্ট্যগুলির সাথে, বিশেষ করে চরিত্রের ধারাবাহিকতা বজায় রাখার ক্ষমতার সাথে, জেমিনি ২.৫ ফ্ল্যাশ ইমেজ ফটোশপের মতো ঐতিহ্যবাহী ফটো এডিটিং সফ্টওয়্যারের একটি শক্তিশালী প্রতিযোগী হয়ে উঠবে বলে আশা করা হচ্ছে, যা নির্মাতা এবং ব্যবহারকারীদের ডিজিটাল চিত্রগুলির সাথে যোগাযোগের পদ্ধতি পরিবর্তন করবে।

বিশ্বব্যাপী AI অনুবাদ প্রতিযোগিতায় চীন অপ্রত্যাশিতভাবে মার্কিন যুক্তরাষ্ট্রকে ছাড়িয়ে গেছে । WMT25 সম্মেলনে অনুষ্ঠিত আন্তর্জাতিক মেশিন অনুবাদ প্রতিযোগিতায় টেনসেন্টের (চীন) ওপেন-সোর্স মডেল হুনুয়ান-এমটি-৭বি আমেরিকান জায়ান্টদের উপর প্রায় চূড়ান্ত বিজয় অর্জন করেছে।

সূত্র: https://vietnamnet.vn/nano-banana-la-gi-ma-khien-moi-nguoi-xon-xao-dung-dau-google-trends-viet-nam-2439283.html