גוגל דיפמיינד הציגה זה עתה צעד משמעותי קדימה בתחום הבינה המלאכותית הגנרטיבית (GenAI): מודל Gemini 2.5 Flash Image.

מודל זה, המכונה בחיבה "ננו בננה" על ידי הקהילה, הוא כלי רב עוצמה, המסוגל להמיר טקסט לתמונות ולערוך תמונות קיימות בדיוק וגמישות רבה.

זהו המשך של קו הדגמים של ג'מיני, אך מותאם במיוחד למשימות הקשורות לתמונה.

c732a0fbdcce57900edf.jpg
מילת המפתח "תאומים" הובילה לראש רשימת הטרנדים בגוגל טרנדס בווייטנאם ב-4 בספטמבר. צילום מסך.

עם יתרונות יוצאי דופן ביכולות יצירת ועריכת תמונות, ננו בננה מושכת תשומת לב רבה מצד משתמשי טכנולוגיה גלובליים, כולל וייטנאם.

לפי גוגל טרנדס, חיפושים אחר תאומים וננו בננה זינקו ב-24 השעות האחרונות. סטטיסטיקות מה-4 בספטמבר מראות כי מילת המפתח "תאומים" בראש טבלת ה"טרנדים" בכל הנושאים.

בפורומים ובקבוצות רשתות חברתיות, משתמשים גם משתפים ובודקים פקודות וסקריפטים ליצירת תמונות באמצעות Nano Banana.

רובם מעריכים מאוד את היכולת ליצור תמונות "מהירות, מסודרות וזריזות" כמו גם את איכות התוצר המתקבל מהכלי.

יותר מאשר רק יצירת תמונות מתיאורי טקסט, Gemini 2.5 Flash Image מצטיינת במספר היבטים מרכזיים: עריכת תמונות לפי דרישה, עקביות תווים, מהירות עיבוד מרשימה וטכנולוגיית אבטחה של SynthID.

משתמשים יכולים להשתמש בשפה טבעית כדי לשנות אלמנטים בתמונה. לדוגמה, פשוט הקלידו את הפקודה "הוסיפו כיסא אדום ליד השולחן" או "שנו את הרקע ליער" והמודל יבצע את העריכה בצורה מדויקת וחלקה.

עקביות דמויות נחשבת לתכונה פורצת הדרך ביותר. המודל יכול לשנן ולשחזר תמונה של דמות או אובייקט עם מאפיינים עקביים (כמו פנים, בגדים, סגנון) בתמונות רבות ושונות.

זה שימושי במיוחד עבור פרויקטים יצירתיים הדורשים יצירת סדרה של תמונות קשורות, מקומיקס ועד קמפיינים שיווקיים.

בעזרת הארכיטקטורה המותאמת שלו, Gemini 2.5 Flash Image יכול לייצר תוצאות באיכות גבוהה תוך שניות, ולהאיץ משמעותית את זרימת העבודה היצירתית.

כל התמונות שנוצרו או נערכו על ידי המודל מתויגות בסימן מים דיגיטלי בלתי נראה קנייני של גוגל, המאפשר זיהוי של תמונות שנוצרו על ידי בינה מלאכותית, ותורם להבטחת שקיפות ומקור התוכן.

מודל Gemini 2.5 Flash Image פותח מגוון רחב של פוטנציאל יישומים, החל ממשתמשים פרטיים ועד למפתחים מקצועיים.

מפתחים יכולים לגשת למודל דרך ממשק ה-API של Gemini ו-Google AI Studio כדי לבנות יישומים משלהם, בעוד שעסקים יכולים להשתמש במודל בפלטפורמת הבינה המלאכותית של Vertex.

עבור המשתמש הממוצע, המודל מובנה ישירות בגוגל ג'מיני ובאפליקציות אחרות, מה שהופך את הדמיית הבינה המלאכותית לכלי נגיש ואינטואיטיבי.

עם תכונותיו המצוינות, ובמיוחד היכולת לשמור על עקביות בדמויות, צפוי ש-Gemini 2.5 Flash Image תהפוך למתחרה אדיר לתוכנות עריכת תמונות מסורתיות כמו פוטושופ, ותשנה את האופן שבו יוצרים ומשתמשים מקיימים אינטראקציה עם תמונות דיגיטליות.

סין עוקפת באופן בלתי צפוי את ארה"ב בתחרות התרגום העולמית בתחום הבינה המלאכותית . מודל הקוד הפתוח Hunyuan-MT-7B של טנסנט (סין) ניצח כמעט לחלוטין את ה"ענקים" האמריקאים בתחרות התרגום המכונה הבינלאומית במסגרת כנס WMT25.

מקור: https://vietnamnet.vn/nano-banana-la-gi-ma-khien-moi-nguoi-xon-xao-dung-dau-google-trends-viet-nam-2439283.html