הפרדוקס של יצירת תמונות באמצעות בינה מלאכותית

במקום לשפר את איכות התמונה, מודלים רבים של בינה מלאכותית מדמים באופן פעיל רעש, תאורה לקויה ועיוות חזותי כדי לשפר את הריאליזם.

ZNews•17/12/2025

ל-Nano Banana Pro של גוגל יש איכות תמונה מציאותית למדי. צילום: Mashable .

בשנים הראשונות של טכנולוגיית ההדמיה מבוססת בינה מלאכותית (AI), המוצרים שהתקבלו היו לרוב מזוהים בקלות כמזויפים. תמונות עם יותר מדי אצבעות, פרטי גוף מעוותים או תאורה לא מציאותית היו סימנים נפוצים.

עם זאת, עידן זה מתקרב לסיומו. כלי יצירת תמונות המופעלים על ידי בינה מלאכותית הופכים משכנעים יותר ויותר, לא על ידי שכלול התמונה עצמה, אלא על ידי שילוב מכוון של פגמים המחקים תצלומים אמיתיים.

מגמות ביצירת תמונות באמצעות בינה מלאכותית

OpenAI השיקה את כלי יצירת התמונות DALL-E שלה לפני פחות מחמש שנים. הגרסה הראשונה יכלה ליצור תמונות ברזולוציה של 256 x 256 פיקסלים בלבד, מה שהפך אותה לניסיונית יותר מאשר מעשית. עם DALL-E 2, הרזולוציה הוגדלה ל-1024 x 1024 פיקסלים, וכתוצאה מכך תמונות ריאליסטיות משמעותית יותר. עם זאת, פרטים עדיין מראים סימנים של אנומליות, החל ממשטחים מטושטשים ועד לעצמים שקשה להסביר אותם ויזואלית.

במקביל, גם Midjourney ו-Stable Diffusion זכו במהירות לתשומת לב מצד הקהילה היצירתית. במהלך השנים הבאות, המודלים שופרו ללא הרף, מה שצמצם שגיאות גיאומטריות ושיפור נראות הטקסט. עם זאת, חלק ניכר מהבינה המלאכותית עדיין הרגיש "מושלם מדי", כאשר התאורה, הקומפוזיציה והחלקות דמו יותר לאיורים מאשר לתמונות אמיתיות.

מודלים רבים של בינה מלאכותית מייצרים תמונות ריאליסטיות מדי. צילום: בלומברג .

מגמה זו משתנה. מפתחים מתחילים לנוע לעבר ריאליזם, ומשחזרים את הפגמים הטבועים בתמונות שצולמו במכשירים נפוצים, במיוחד מצלמות טלפונים.

במחצית השנייה של 2025, גוגל הציגה את מודל יצירת התמונות Nano Banana באפליקציית Gemini, ולאחר מכן שדרוגים נוספים עם Nano Banana Pro. על פי ענקית החיפוש, זהו מודל התמונה הריאליסטי ביותר עד כה, עם היכולת לנצל ידע מהעולם האמיתי ולהציג טקסט בצורה יעילה יותר.

ראוי לציין שתמונות רבות המופקות על ידי דגם זה דומות מאוד לאלו שצולמו בסמארטפונים, החל מניגודיות ופרספקטיבה ועד תאורה וחדות.

לתמונות שצולמו במצלמות סמארטפונים יש סגנון ייחודי משלהן. עקב מגבלות בגודל החיישן והעדשה, סמארטפונים מסתמכים על עיבוד מרובה פריימים כדי לשפר את איכות התמונה. זה יוצר תמונות עם אזורים כהים משופרים, פרטים מודגשים ומותאמות לתצוגה על מסכים קטנים. בינה מלאכותית הלומדת סגנון זה הופכת את התמונות למוכרות יותר לצופים, ובכך מפחיתה את תחושת המלאכותיות.

הפרדוקס של תמונות ריאליסטיות

גוגל אינה המקרה היחיד. Adobe Firefly מציעה אפשרות "שיפור תמונה", המאפשרת למשתמשים להפחית את הליטוש של תמונות בינה מלאכותית כדי שיהיו דומות יותר לתמונות אמיתיות. Meta כוללת גם מחוון "עיצוב", המאפשר למשתמשים להתאים את רמת הריאליזם.

בתחום הווידאו , כלים כמו Sora של OpenAI או Veo של גוגל משמשים ליצירת קליפים באיכות נמוכה ומגורענים המחקים תמונות ממצלמות אבטחה, שהן "גרועות" מספיק כדי להיות אמינות.

סרטונים המופקים באמצעות בינה מלאכותית הופכים יותר ויותר מציאותיים. צילום: בלומברג .

על פי כמה מומחי צילום, היכולת של בינה מלאכותית לדמות פגמים מוכרים יכולה לעזור למודלים להימנע מליפול ל"עמק יוצא הדופן", מצב שבו תמונות דומות מאוד למציאות אך עדיין יוצרות תחושת אי נוחות אצל הצופה. במקום לשחזר את המציאות, בינה מלאכותית פשוט צריכה לחקות את האופן שבו בני אדם לוכדים תמונות על כל המגבלות והאי דיוקים הטבועים בהן.

התפתחות זו מציבה אתגר משמעותי ליכולת להבחין בין תמונות אמיתיות לתמונות מזויפות. ככל שתמונות בינה מלאכותית דומות יותר ויותר לתמונות קונבנציונליות, זיהוי מקורן הופך קשה יותר. בתגובה לכך, מיושם תקן אישורי התוכן C2PA כדי להוסיף חתימות קריפטוגרפיות לתמונות, מה שמאפשר מעקב מרגע יצירתן.

נכון לעכשיו, רוב התמונות שצולמו בסמארטפונים חסרות מידע אימות, בעוד שהגבול בין תמונות שנערכו דיגיטלית לבין תמונות שנוצרו כולן על ידי בינה מלאכותית הולך ומטשטש. עד ליישום אחיד של סטנדרטים בכל החומרה ופלטפורמות השיתוף, משתמשים עדיין צריכים לנקוט משנה זהירות בנוגע לתמונות במרחב הדיגיטלי.

מקור: https://znews.vn/nghich-ly-cua-ai-tao-anh-post1612058.html