Google DeepMind har nettopp introdusert et stort sprang fremover innen generativ kunstig intelligens (GenAI): Gemini 2.5 Flash Image-modellen.

Denne modellen, kjærlig kjent som «Nano Banana» av fellesskapet, er et kraftig verktøy som er i stand til å transformere tekst til bilder og redigere eksisterende bilder med høy presisjon og fleksibilitet.

Dette er en etterfølger til Gemini-modellserien, men spesielt optimalisert for bilderelaterte oppgaver.

c732a0fbdcce57900edf.jpg
Søkeordet Gemini toppet trendlisten på Google Trends i Vietnam 4. september. (Skjermbilde)

Med sine enestående muligheter innen bildeoppretting og -redigering tiltrekker Nano Banana seg betydelig oppmerksomhet fra teknologibrukere over hele verden, inkludert Vietnam.

Ifølge Google Trends har søk etter Gemini og Nano Banana økt kraftig de siste 24 timene. Statistikk fra 4. september viser at søkeordet «Gemini» toppet Trending-listene på tvers av alle emner.

På forum og sosiale mediegrupper deler og eksperimenterer brukere også med kommandoer og scenarier for bildeoppretting ved hjelp av Nano Banana.

De fleste setter pris på verktøyets evne til å lage bilder raskt og effektivt, samt kvaliteten på resultatet.

Utover å bare lage bilder fra tekstbeskrivelser, utmerker Gemini 2.5 Flash Image seg på flere kjerneområder: kommandobasert bilderedigering, opprettholdelse av tegnkonsistens, imponerende behandlingshastighet og SynthID-sikkerhetsteknologi.

Brukere kan bruke naturlig språk for å endre elementer i et bilde. For eksempel, ved å bare skrive inn kommandoen «legg til en rød stol ved siden av bordet» eller «endre bakgrunnen til en skog», vil modellen utføre redigeringen nøyaktig og sømløst.

Å opprettholde karakterkonsistens regnes som den mest banebrytende funksjonen. Modellen kan huske og reprodusere bildet av en karakter eller et objekt med konsistente egenskaper (som ansikt, klær, stil) på tvers av flere forskjellige bilder.

Dette er spesielt nyttig for kreative prosjekter som trenger å generere en serie relaterte bilder, fra tegneserier til markedsføringskampanjer.

Med sin optimaliserte arkitektur kan Gemini 2.5 Flash Image produsere resultater av høy kvalitet på bare sekunder, noe som akselererer den kreative prosessen betydelig.

Alle bilder som er laget eller redigert av modellen er merket med et proprietært, usynlig digitalt vannmerke fra Google, som muliggjør identifisering av bilder laget med AI, og dermed bidrar til å sikre innholdets gjennomsiktighet og opprinnelse.

Gemini 2.5 Flash Image-modellen åpner for mange potensielle bruksområder, fra individuelle brukere til profesjonelle utviklere.

Utviklere kan få tilgang til modellen via Gemini API og Google AI Studio for å bygge sine egne applikasjoner, mens bedrifter kan bruke modellen på Vertex AI-plattformen.

For den gjennomsnittlige brukeren er denne modellen integrert direkte i Google Gemini og andre applikasjoner, noe som gjør AI-bildeoppretting til et tilgjengelig og intuitivt verktøy.

Med sine enestående funksjoner, spesielt evnen til å opprettholde karakterkonsistens, forventes Gemini 2.5 Flash Image å bli en formidabel konkurrent til tradisjonell fotoredigeringsprogramvare som Photoshop, og endre måten skapere og brukere samhandler med digitale bilder.

Kina overgår uventet USA i den globale konkurransen om AI-oversettelse . Tencents (Kina) åpen kildekode-modell Hunyuan-MT-7B oppnådde en nesten absolutt seier over amerikanske giganter i den internasjonale maskinoversettelseskonkurransen som ble holdt på WMT25-konferansen.

Kilde: https://vietnamnet.vn/nano-banana-la-gi-ma-khien-moi-nguoi-xon-xao-dung-dau-google-trends-viet-nam-2439283.html