
گوگل به تازگی Nano Banana Pro، جدیدترین مدل ایجاد و ویرایش عکس خود را عرضه کرده است. این مدل هوش مصنوعی بعدی است که این شرکت این هفته پس از Gemini 3 معرفی کرده است. Nano Banana Pro بر اساس Gemini 3 Pro ساخته شده است. گوگل تأکید میکند که این «پیشرفتهترین مدل ویرایش عکس» است که این شرکت تاکنون منتشر کرده است. پیشرفتهای این مدل حول ویرایش عکس، ایجاد حروف خوانا و حفظ ثبات در طراحی میچرخد.

کاربران میتوانند Nano Banana Pro را در برنامه Gemini تجربه کنند (گزینه Create Image > Brainstorm را انتخاب کنید). حسابهای کاربری رایگان میتوانند از این مدل به تعداد دفعات محدود استفاده کنند و سپس به نسخه قدیمی بازگردند.

اپلیکیشن یادداشتبرداری NotebookLM نیز Nano Banana Pro را در کنار محصولات توسعهدهندگان، سازمانی و تولیدکنندگان محتوای گوگل ادغام خواهد کرد.

در ایالات متحده، کاربران AI Pro و AI Ultra میتوانند Nano Banana Pro را در حالت جستجوی هوش مصنوعی گوگل تجربه کنند. علاوه بر این، مدل جدید با تعدادی از برنامههای طراحی محبوب مانند Canva، Figma و Photoshop نیز یکپارچه شده است.

گوگل میگوید با قابلیتهای استدلال پیشرفتهی Gemini 3، Nano Banana Pro از ایجاد تصاویر با محتوای بصری و فونتهای خواناتر پشتیبانی میکند. برای مثال، این فناوری میتواند متن دستور غذا را به نمودارهای مصور تبدیل کند یا اطلاعات بلادرنگ مانند آب و هوا یا ورزش را به صورت بصری نمایش دهد.

تولید متن یکی از پیشرفتهایی است که گوگل در Nano Banana Pro بر آن تأکید دارد. در مقایسه با نسخه قبلی، این مدل میتواند متن دقیق و خوانا ایجاد کند و از ترجمه به زبانهای مختلف پشتیبانی میکند. کاربران حتی میتوانند متنهایی با جلوهها و طرحبندیهای ویژه ایجاد کنند که برای استفاده در طراحی مقاله و پوسترهای تبلیغاتی مناسب است.

نانو موز پرو همچنین ثبات طراحی را بهبود میبخشد. طبق گفته گوگل، کاربران میتوانند تا ۱۴ تصویر مختلف ارائه دهند و مدل آنها را به دلخواه مرتب کند، در حالی که ویژگیهای حداکثر پنج تصویر را حفظ میکند. این ابزار ظاهر و حس دوستان، خانواده و حیوانات خانگی را صرف نظر از مدل مو یا لباس آنها حفظ میکند.

کاربران میتوانند درخواست ویرایش جزئیات عکسهای موجود، تغییر زاویه عکاسی، نسبت تصویر، تنظیم رنگ، موقعیت فوکوس و حتی نورپردازی را بدهند، درست مانند زمانی که مستقیماً با دوربین عکس میگیرند.

گوگل تأکید میکند که تصاویر ایجاد شده توسط Nano Banana با یک SynthID پنهان برای شناسایی محتوای هوش مصنوعی برچسبگذاری شدهاند. در نسخه جدید، Gemini امکان آپلود تصاویر را فراهم میکند و میپرسد که آیا تصویر توسط Google AI تولید شده است یا خیر. این شرکت قصد دارد در آینده این ویژگی را به صدا و تصویر نیز گسترش دهد. علاوه بر SynthID، تصاویر ایجاد شده توسط مدل گوگل همچنان هنگام استفاده از طرح رایگان یا Google AI Pro دارای واترمارک خواهند بود. این واترمارک برای مشترکین AI Ultra حذف خواهد شد.

از زمان عرضه اولیهاش در ماه آگوست، نانو موز به دلیل تواناییاش در ایجاد تصاویر بسیار واقعگرایانه از حیوانات خانگی، افراد و مناظر، توجهها را به خود جلب کرده است. در ماه سپتامبر، جاش وودوارد، معاون آزمایشگاههای گوگل و جمینی، گفت که نانو موز به برنامه جمینی کمک کرد تا در عرض چهار روز ۱۳ میلیون کاربر جدید جذب کند. وودوارد گفت که نانو موز پرو قادر به عملکرد بهتر از نسخه اصلی است و ویژگیهایی مانند ایجاد اینفوگرافیک، اسلایدهای ارائه و تضمین هماهنگی بین تصاویر را برجسته میکند.

گوگل به دنبال کسب برتری نسبت به OpenAI در رقابت هوش مصنوعی مولد است که از زمان راهاندازی ChatGPT در سال ۲۰۲۲ به اوج خود رسیده است. هفته گذشته، OpenAI نسخه GPT-5.1 را معرفی کرد که بر بهبود تعامل کاربر تمرکز دارد. ChatGPT در حال حاضر برترین برنامه رایگان در فروشگاه App ایالات متحده است، در حالی که Gemini شماره ۲ است.

وقتی جمینی ۳ منتشر شد، گوگل اعلام کرد که اپلیکیشن جمینی بیش از ۶۵۰ میلیون کاربر ماهانه دارد و AI Overviews نیز ۲ میلیارد کاربر ماهانه دارد. در ماه اکتبر، سم آلتمن، مدیرعامل OpenAI، گفت که ChatGPT به ۸۰۰ میلیون کاربر هفتگی رسیده است. بسیاری از افراد برای افزایش محدودیتهای خود در استفاده از مدلهای پیشرفته، در طرحهای جمینی ثبتنام میکنند.
منبع: https://khoahocdoisong.vn/ai-tao-anh-cua-google-giai-duoc-bai-toan-kho-nhan-post2149071838.html






نظر (0)