هوش مصنوعی تولید تصویر گوگل یک مشکل دشوار را حل می‌کند

گوگل به تازگی Nano Banana Pro، جدیدترین مدل ایجاد و ویرایش عکس خود را عرضه کرده است. این مدل هوش مصنوعی بعدی است که این شرکت این هفته پس از Gemini 3 معرفی کرده است. Nano Banana Pro بر اساس Gemini 3 Pro ساخته شده است. گوگل تأکید می‌کند که این «پیشرفته‌ترین مدل ویرایش عکس» است که این شرکت تاکنون منتشر کرده است. پیشرفت‌های این مدل حول ویرایش عکس، ایجاد حروف خوانا و حفظ ثبات در طراحی می‌چرخد.

کاربران می‌توانند Nano Banana Pro را در برنامه Gemini تجربه کنند (گزینه Create Image > Brainstorm را انتخاب کنید). حساب‌های کاربری رایگان می‌توانند از این مدل به تعداد دفعات محدود استفاده کنند و سپس به نسخه قدیمی بازگردند.

اپلیکیشن یادداشت‌برداری NotebookLM نیز Nano Banana Pro را در کنار محصولات توسعه‌دهندگان، سازمانی و تولیدکنندگان محتوای گوگل ادغام خواهد کرد.

در ایالات متحده، کاربران AI Pro و AI Ultra می‌توانند Nano Banana Pro را در حالت جستجوی هوش مصنوعی گوگل تجربه کنند. علاوه بر این، مدل جدید با تعدادی از برنامه‌های طراحی محبوب مانند Canva، Figma و Photoshop نیز یکپارچه شده است.

گوگل می‌گوید با قابلیت‌های استدلال پیشرفته‌ی Gemini 3، Nano Banana Pro از ایجاد تصاویر با محتوای بصری و فونت‌های خواناتر پشتیبانی می‌کند. برای مثال، این فناوری می‌تواند متن دستور غذا را به نمودارهای مصور تبدیل کند یا اطلاعات بلادرنگ مانند آب و هوا یا ورزش را به صورت بصری نمایش دهد.

تولید متن یکی از پیشرفت‌هایی است که گوگل در Nano Banana Pro بر آن تأکید دارد. در مقایسه با نسخه قبلی، این مدل می‌تواند متن دقیق و خوانا ایجاد کند و از ترجمه به زبان‌های مختلف پشتیبانی می‌کند. کاربران حتی می‌توانند متن‌هایی با جلوه‌ها و طرح‌بندی‌های ویژه ایجاد کنند که برای استفاده در طراحی مقاله و پوسترهای تبلیغاتی مناسب است.

نانو موز پرو همچنین ثبات طراحی را بهبود می‌بخشد. طبق گفته گوگل، کاربران می‌توانند تا ۱۴ تصویر مختلف ارائه دهند و مدل آنها را به دلخواه مرتب کند، در حالی که ویژگی‌های حداکثر پنج تصویر را حفظ می‌کند. این ابزار ظاهر و حس دوستان، خانواده و حیوانات خانگی را صرف نظر از مدل مو یا لباس آنها حفظ می‌کند.

کاربران می‌توانند درخواست ویرایش جزئیات عکس‌های موجود، تغییر زاویه عکاسی، نسبت تصویر، تنظیم رنگ، موقعیت فوکوس و حتی نورپردازی را بدهند، درست مانند زمانی که مستقیماً با دوربین عکس می‌گیرند.

گوگل تأکید می‌کند که تصاویر ایجاد شده توسط Nano Banana با یک SynthID پنهان برای شناسایی محتوای هوش مصنوعی برچسب‌گذاری شده‌اند. در نسخه جدید، Gemini امکان آپلود تصاویر را فراهم می‌کند و می‌پرسد که آیا تصویر توسط Google AI تولید شده است یا خیر. این شرکت قصد دارد در آینده این ویژگی را به صدا و تصویر نیز گسترش دهد. علاوه بر SynthID، تصاویر ایجاد شده توسط مدل گوگل همچنان هنگام استفاده از طرح رایگان یا Google AI Pro دارای واترمارک خواهند بود. این واترمارک برای مشترکین AI Ultra حذف خواهد شد.

از زمان عرضه اولیه‌اش در ماه آگوست، نانو موز به دلیل توانایی‌اش در ایجاد تصاویر بسیار واقع‌گرایانه از حیوانات خانگی، افراد و مناظر، توجه‌ها را به خود جلب کرده است. در ماه سپتامبر، جاش وودوارد، معاون آزمایشگاه‌های گوگل و جمینی، گفت که نانو موز به برنامه جمینی کمک کرد تا در عرض چهار روز ۱۳ میلیون کاربر جدید جذب کند. وودوارد گفت که نانو موز پرو قادر به عملکرد بهتر از نسخه اصلی است و ویژگی‌هایی مانند ایجاد اینفوگرافیک، اسلایدهای ارائه و تضمین هماهنگی بین تصاویر را برجسته می‌کند.

گوگل به دنبال کسب برتری نسبت به OpenAI در رقابت هوش مصنوعی مولد است که از زمان راه‌اندازی ChatGPT در سال ۲۰۲۲ به اوج خود رسیده است. هفته گذشته، OpenAI نسخه GPT-5.1 را معرفی کرد که بر بهبود تعامل کاربر تمرکز دارد. ChatGPT در حال حاضر برترین برنامه رایگان در فروشگاه App ایالات متحده است، در حالی که Gemini شماره ۲ است.

وقتی جمینی ۳ منتشر شد، گوگل اعلام کرد که اپلیکیشن جمینی بیش از ۶۵۰ میلیون کاربر ماهانه دارد و AI Overviews نیز ۲ میلیارد کاربر ماهانه دارد. در ماه اکتبر، سم آلتمن، مدیرعامل OpenAI، گفت که ChatGPT به ۸۰۰ میلیون کاربر هفتگی رسیده است. بسیاری از افراد برای افزایش محدودیت‌های خود در استفاده از مدل‌های پیشرفته، در طرح‌های جمینی ثبت‌نام می‌کنند.