Google Gemini tilt AI naar een hoger niveau: verander achtergrond, kapsel en combineer foto's met slechts één commando

De Google Gemini-upgrade maakt gebruik van het 'nanobanaan'-beeldmodel, ontwikkeld door Google DeepMind. De functie is nu wereldwijd beschikbaar voor zowel gratis als betaalde gebruikers. De grootste kracht is de consistentie van gezichten en objecten in afbeeldingen, iets waar andere AI-tools vaak moeite mee hebben.

"We hebben de beeldkwaliteit en het vermogen van het model om instructies op te volgen echt verbeterd", aldus Nicole Brichtova, productleider bij DeepMind. "Deze update maakt het bewerken soepeler en de resultaten zijn goed genoeg om voor elk doel te gebruiken."

Houd “jij” op elke foto

Een van de dingen die AI-foto's nep maakt, is dat kleine details vervormd raken. Volgens Google lost Gemini dit probleem op, waardoor je de hele scène kunt veranderen terwijl het gezicht en de uitdrukking hetzelfde blijven. Je kunt een nieuw kapsel uitproberen, de kleur van de muur veranderen of een huisdier in beeld brengen zonder je zorgen te maken over beeldvervorming.

Foto's samenvoegen.gif — Voeg foto's samen met nieuwe context uit twee bestaande afbeeldingen met Google Gemini. Bron: Google

Met Gemini kunt u ook meerdere foto's uploaden en deze combineren tot één foto. Zo kunt u bijvoorbeeld een portret van uw kat combineren tot een foto van jullie samen op de weg.

Gemini ondersteunt multi-turn editing, waardoor gebruikers elk detail aan een ruimte kunnen toevoegen: van behang, meubels tot de kleur van de verf. Het voordeel is dat alleen het te bewerken deel verandert, de rest blijft hetzelfde.

Bovendien kan Tweelingen stijlen tussen foto's combineren. Verander bijvoorbeeld regenlaarzen in schoenen met bloemenprint, of creëer een jurk met vlindermotief.

Race tussen technologiegiganten op het gebied van AI-beeldcreatie

De upgrade van Google komt nu de strijd om AI-beelden oplaait. OpenAI lanceerde eerder al GPT-4o, dat direct beelden kan genereren, en ging viraal met een reeks memes in de stijl van Studio Ghibli. CEO Sam Altman onthulde dat het aantal gebruikers zo sterk toenam dat de GPU's van het bedrijf bijna "smolten".

Om bij te blijven, kondigde Meta een partnerschap aan met Midjourney, terwijl de Duitse startup Black Forest Labs met zijn FLUX-model veel hitlijsten domineert.

multi-turn editing.gif — De mogelijkheden voor fotobewerking in meerdere stappen van Google Gemini. Bron: Google

Google hoopt dat Gemini de kloof met ChatGPT kan dichten. Volgens CEO Sundar Pichai heeft Gemini momenteel 450 miljoen maandelijkse gebruikers, veel minder dan ChatGPT, dat meer dan 700 miljoen wekelijkse gebruikers heeft.

Brichtova zei dat Gemini is ontworpen voor realistische scenario's, van het visualiseren van woonkamers en tuinen tot het maken van leuke foto's. Het model heeft een betere ' wereldkennis ' en kan meerdere foto's en kleurenpaletten combineren tot één rendering.

Google stelt echter ook strikte limieten. Alle gegenereerde afbeeldingen hebben een duidelijk watermerk en verborgen identificatiegegevens in de metadata. Het bedrijf verbiedt ten strengste het onvrijwillig creëren van gevoelige afbeeldingen om deepfake-misbruik te voorkomen.

Google heeft eerder zijn excuses aangeboden voor de onnauwkeurige historische beelden in Gemini. Dit keer denkt het bedrijf een balans te hebben gevonden tussen creativiteit en veiligheid. "We willen dat gebruikers creatief zijn, maar niet alles is toegestaan", benadrukte Brichtova.

Met Gemini 2.5 Flash Image wil Google de AI-fotobewerkingservaring verbeteren. Daarmee hoopt het bedrijf oude gebruikers te behouden en nieuwe aan te trekken in een felle technologierace met OpenAI, Meta en andere concurrenten.

(Volgens TechCrunch, Tom's Guide)

Voor 85 miljoen VND per 'brein' maakt Nvidia de weg vrij voor het tijdperk van robots die door mensen worden gemaakt. Nvidia heeft zojuist Jetson AGX Thor gelanceerd - een chip die het 'robotbrein' wordt genoemd en die machines kan helpen zien, denken en handelen als mensen. De fysieke AI-race begint voor een prijs van 3.499 dollar.

Bron: https://vietnamnet.vn/google-gemini-nang-tam-ai-tao-anh-doi-nen-kieu-toc-chi-bang-mot-cau-lenh-2436782.html