Paradoxen med AI-bildskapande

Istället för att förbättra bildkvaliteten simulerar många AI-modeller aktivt brus, dålig belysning och visuell distorsion för att förbättra realismen.

ZNews•17/12/2025

Googles Nano Banana Pro har ganska realistisk bildkvalitet. Foto: Mashable .

Under de första åren av bildteknik med artificiell intelligens (AI) var de resulterande produkterna ofta lätt identifierbara som förfalskningar. Bilder med för många fingrar, förvrängda kroppsdetaljer eller orealistisk belysning var vanliga avslöjande tecken.

Den eran närmar sig dock sitt slut. AI-drivna bildskapandeverktyg blir alltmer övertygande, inte genom att finslipa själva bilden, utan genom att medvetet införliva brister som efterliknar verkliga fotografier.

Trender inom AI-bildskapande

OpenAI lanserade sitt bildgenereringsverktyg DALL-E för mindre än fem år sedan. Den första versionen kunde bara skapa bilder med en upplösning på 256 x 256 pixlar, vilket gjorde det mer experimentellt än praktiskt. Med DALL-E 2 ökades upplösningen till 1024 x 1024 pixlar, vilket resulterade i betydligt mer realistiska bilder. Detaljer visar dock fortfarande tecken på avvikelser, från suddiga ytor till objekt som är svåra att visuellt förklara.

Samtidigt fick Midjourney och Stable Diffusion snabbt uppmärksamhet från den kreativa världen. Under de närmaste åren förbättrades modellerna kontinuerligt, vilket minskade geometriska fel och förbättrade textens synlighet. Mycket av AI:n kändes dock fortfarande "för perfekt", där ljussättning, komposition och jämnhet liknade illustrationer mer än riktiga fotografier.

Många AI-modeller producerar bilder som är för realistiska för att vara verklighetstrogna. Foto: Bloomberg .

Denna trend håller på att förändras. Utvecklare börjar röra sig mot realism och återskapar de ofullkomligheter som finns i foton tagna med vanliga enheter, särskilt telefonkameror.

Under senare hälften av 2025 introducerade Google bildmodellen Nano Banana i Gemini-appen, följt av ytterligare uppgraderingar med Nano Banana Pro. Enligt sökjätten är detta den mest realistiska bildmodellen hittills, med möjligheten att utnyttja verklighetstrogen kunskap och visa text mer effektivt.

Det är värt att notera att många bilder som produceras av den här modellen liknar de som tagits med smartphones, från kontrast och perspektiv till ljussättning och skärpa.

Foton tagna med smarttelefonkameror har sin egen unika stil. På grund av begränsningar i sensor- och objektivstorlek förlitar sig smartphones på multibildbehandling för att förbättra bildkvaliteten. Detta skapar foton med förbättrade mörka områden, markerade detaljer och optimerade för visning på små skärmar. AI-inlärning av denna stil gör bilderna mer bekanta för tittarna, vilket minskar känslan av artificiellhet.

Paradoxen med realistiska bilder

Google är inte det enda fallet. Adobe Firefly erbjuder ett alternativ för "bildförbättring", vilket gör det möjligt för användare att minska poleringen av AI-bilder så att de mer liknar riktiga fotografier. Meta innehåller också ett reglage för "styling", vilket gör det möjligt för användare att justera realismnivån.

Inom video används verktyg som OpenAI:s Sora eller Googles Veo för att skapa lågkvalitativa, korniga klipp som härmar bilder från säkerhetskameror, vilka är tillräckligt "dåliga" för att vara trovärdiga.

Videor producerade med AI blir alltmer realistiska. Foto: Bloomberg .

Enligt vissa fotoexperter kan AI:s förmåga att simulera välbekanta brister hjälpa modeller att undvika att hamna i den "ovanliga dalen", ett tillstånd där bilder liknar verkligheten men ändå skapar en känsla av obehag för betraktaren. Istället för att återskapa verkligheten behöver AI helt enkelt härma hur människor fångar bilder med alla dess inneboende begränsningar och felaktigheter.

Denna utveckling innebär en betydande utmaning för förmågan att skilja mellan äkta och falska bilder. I takt med att AI-bilder alltmer liknar konventionella fotografier blir det svårare att identifiera deras ursprung. Som svar på detta implementeras standarden C2PA Content Credentials för att lägga till kryptografiska signaturer till bilder, vilket möjliggör spårbarhet från skapandet.

För närvarande saknar de flesta foton som tagits med smartphones autentiseringsinformation, medan gränsen mellan digitalt redigerade bilder och de som skapats helt med AI blir alltmer suddig. Tills standarder implementeras enhetligt över hårdvara och delningsplattformar måste användare fortfarande iaktta nödvändig försiktighet när det gäller bilder i det digitala rummet.

Källa: https://znews.vn/nghich-ly-cua-ai-tao-anh-post1612058.html