Googles bildgenererande AI löser ett svårt problem

Google har precis lanserat Nano Banana Pro, sin senaste modell för fotoskapande och redigering. Detta är nästa AI-modell som företaget introducerar denna vecka efter Gemini 3. Nano Banana Pro är byggd på Gemini 3 Pro. Google betonar att detta är den "mest avancerade fotoredigeringsmodellen" som företaget någonsin har släppt. Modellens förbättringar kretsar kring fotoredigering, att skapa läsbara bokstäver och att bibehålla en enhetlig design.

Användare kan uppleva Nano Banana Pro i Gemini-appen (välj funktionen Skapa bild > Brainstorma ). Gratiskonton kan använda modellen ett begränsat antal gånger och sedan växla tillbaka till den gamla versionen.

Anteckningsappen NotebookLM kommer också att integrera Nano Banana Pro, tillsammans med Googles produkter för utvecklare, företag och innehållsskapare.

I USA kan AI Pro- och AI Ultra-användare uppleva Nano Banana Pro i Google Search AI-läge. Dessutom är den nya modellen integrerad i ett antal populära designappar som Canva, Figma och Photoshop.

Google säger att Nano Banana Pro, med Gemini 3:s förbättrade resonemangsfunktioner, stöder skapandet av illustrationer med visuellt innehåll och lättlästa teckensnitt. Till exempel kan den här tekniken förvandla recepttext till illustrerade diagram eller visualisera realtidsinformation som väder eller sport .

Textgenerering är en av de förbättringar som Google betonar i Nano Banana Pro. Jämfört med den tidigare versionen kan den här modellen skapa korrekt och lättläst text, med stöd för översättning till många språk. Användare kan till och med skapa text med specialeffekter och layouter, lämpliga för användning i artikeldesign och reklamaffischer.

Nano Banana Pro förbättrar också designkonsekvensen. Enligt Google kan användare tillhandahålla upp till 14 olika bilder och låta modellen arrangera dem som önskat, samtidigt som funktionerna hos upp till fem bilder bevaras. Verktyget behåller utseendet och känslan hos vänner, familj och husdjur oavsett frisyrer eller kläder.

Användare kan begära att få redigera detaljer i befintliga foton, ändra fotograferingsvinkel, bildförhållande, färgjustering, fokusposition och till och med ljussättning, som om de tog ett foto direkt med kameran.

Google betonar att bilder som skapats av Nano Banana är taggade med ett dolt SynthID för att identifiera AI-innehåll. I den nya versionen tillåter Gemini uppladdning av bilder och frågar om bilden genererades av Google AI. Företaget planerar att utöka funktionen till ljud och video i framtiden. Förutom SynthID kommer bilder som skapats av Googles modell fortfarande att ha en vattenstämpel när man använder gratisplanen eller Google AI Pro. Vattenstämpeln kommer att tas bort för AI Ultra-prenumeranter.

Sedan debuten i augusti har Nano Banana uppmärksammats för sin förmåga att skapa mycket realistiska bilder av husdjur, människor och landskap. I september sa Josh Woodward, vice vd för Google Labs och Gemini, att Nano Banana hjälpte Gemini-appen att locka 13 miljoner nya användare på fyra dagar. Woodward sa att Nano Banana Pro kan prestera bättre än originalversionen, med fokus på funktioner som att skapa infografik, presentationsbilder och säkerställande av konsekvens mellan bilder.

Google vill få en fördel gentemot OpenAI i den generativa AI-kapplöpningen, som har exploderat sedan ChatGPT lanserades 2022. Förra veckan tillkännagav OpenAI version GPT-5.1, som fokuserar på att förbättra användarinteraktionen. ChatGPT är för närvarande den mest populära gratisappen på den amerikanska App Store, medan Gemini är nummer 2.

När Gemini 3 lanserades meddelade Google att Gemini-appen hade fler än 650 miljoner användare varje månad och AI Overviews hade 2 miljarder användare varje månad. I oktober sa OpenAI:s VD Sam Altman att ChatGPT hade nått 800 miljoner användare varje vecka. Många prenumererar på Gemini-planer för att öka sina gränser för avancerad modellanvändning.