De Google Gemini-upgrade maakt gebruik van het "nanobanaan"-model, ontwikkeld door Google DeepMind. De functie is nu wereldwijd beschikbaar voor zowel gratis als betaalde gebruikers. De grootste kracht is de consistentie van gezichten en objecten in foto's, iets waar andere AI-tools vaak moeite mee hebben.

"We hebben de kwaliteit van de afbeeldingen en de mogelijkheid van het model om instructies op te volgen echt verbeterd", aldus Nicole Brichtova, productleider bij DeepMind. "Deze update maakt de bewerkingen soepeler en de resultaten zijn goed genoeg om voor elk doel te gebruiken."

Houd “jij” op elke foto

Een van de dingen die AI-foto's nep maakt, is dat kleine details vervormd raken. Volgens Google lost Gemini dit probleem op, waardoor je de hele scène kunt veranderen terwijl het gezicht en de uitdrukking hetzelfde blijven. Je kunt een nieuw kapsel uitproberen, de kleur van de muur veranderen of een huisdier in beeld brengen zonder je zorgen te maken over beeldvervorming.

Foto's samenvoegen.gif
Voeg foto's samen met nieuwe context uit twee bestaande afbeeldingen met Google Gemini. Bron: Google

Met Gemini kunt u ook meerdere foto's uploaden en deze combineren tot één foto. Zo kunt u bijvoorbeeld een portret van uw kat combineren tot een foto van jullie samen op de weg.

Gemini ondersteunt multi-turn editing, waardoor gebruikers elk detail aan een ruimte kunnen toevoegen: van behang, meubels tot de kleur van de verf. Het voordeel is dat alleen het te bewerken deel verandert, de rest blijft hetzelfde.

Bovendien kan Tweelingen stijlen tussen foto's combineren. Verander bijvoorbeeld regenlaarzen in schoenen met bloemenprint, of creëer een jurk met vlindermotief.

Race tussen technologiegiganten in AI-beeldcreatie

De upgrade van Google komt nu de strijd om AI-beeldvorming oplaait. OpenAI lanceerde eerder al GPT-4o, dat direct beelden kan genereren, en ging viraal met een reeks memes in de stijl van Studio Ghibli. CEO Sam Altman onthulde dat het aantal gebruikers zo sterk toenam dat de GPU's van het bedrijf "bijna smolten".

Om bij te blijven, kondigde Meta een partnerschap aan met Midjourney, terwijl de Duitse startup Black Forest Labs met zijn FLUX-model veel hitlijsten domineert.

multi-turn editing.gif
De mogelijkheden voor fotobewerking in meerdere stappen van Google Gemini. Bron: Google

Google hoopt dat Gemini de kloof met ChatGPT kan dichten. Volgens CEO Sundar Pichai heeft Gemini momenteel 450 miljoen maandelijkse gebruikers, ver achter ChatGPT, dat meer dan 700 miljoen wekelijkse gebruikers heeft.

Brichtova zei dat Gemini is ontworpen voor realistische scenario's, van het visualiseren van woonkamers en tuinen tot het maken van leuke foto's. Het model heeft een betere ' wereldkennis ' en kan meerdere foto's en kleurenpaletten combineren tot één rendering.

Google hanteert echter ook strenge limieten. Alle gegenereerde afbeeldingen hebben een duidelijk watermerk en een identificatiemerk verborgen in de metadata. Het bedrijf verbiedt het maken van gevoelige afbeeldingen zonder toestemming ten strengste om deepfake-misbruik te voorkomen.

Google heeft eerder zijn excuses aangeboden voor de onnauwkeurige historische beelden in Gemini. Dit keer denkt het bedrijf een balans te hebben gevonden tussen creativiteit en veiligheid. "We willen dat gebruikers creatief zijn, maar niet alles is toegestaan", benadrukte Brichtova.

Met Gemini 2.5 Flash Image wil Google de AI-fotobewerkingservaring verbeteren. Daarmee hoopt het bedrijf oude gebruikers te behouden en nieuwe aan te trekken in een felle technologierace met OpenAI, Meta en andere concurrenten.

(Volgens TechCrunch, Tom's Guide)

Voor 85 miljoen VND per 'brein' baant Nvidia de weg voor het tijdperk van robots die door mensen worden gemaakt. Nvidia heeft zojuist Jetson AGX Thor gelanceerd - een chip die het 'robotbrein' wordt genoemd en die machines kan helpen zien, denken en handelen als mensen. Daarmee opent Nvidia de fysieke AI-race voor 3.499 dollar.

Bron: https://vietnamnet.vn/google-gemini-nang-tam-ai-tao-anh-doi-nen-kieu-toc-chi-bang-mot-cau-lenh-2436782.html