Google DeepMind vient de réaliser une avancée majeure dans le domaine de l'intelligence artificielle générative (GenAI) : le modèle d'image Flash Gemini 2.5.
Affectueusement surnommé « Nano Banana » par la communauté, ce modèle est un outil puissant capable de transformer du texte en images et de modifier des images existantes avec une grande précision et flexibilité.
Il s'agit d'un successeur de la gamme Gemini, mais spécifiquement optimisé pour les tâches liées à l'image.

Grâce à ses capacités exceptionnelles en matière de création et de retouche d'images, Nano Banana attire l'attention de nombreux utilisateurs de technologies du monde entier, y compris du Vietnam.
D'après Google Trends, les recherches concernant Gemini et Nano Banana ont explosé ces dernières 24 heures. Les statistiques du 4 septembre montrent que le mot-clé « Gemini » dominait les tendances tous sujets confondus.
Sur les forums et les groupes de médias sociaux, les utilisateurs partagent et expérimentent également des commandes et des scénarios de création d'images à l'aide de Nano Banana.
La plupart des utilisateurs apprécient la capacité de cet outil à créer des images rapidement et efficacement, ainsi que la qualité de ses résultats.
Au-delà de la simple création d'images à partir de descriptions textuelles, Gemini 2.5 Flash Image excelle dans plusieurs domaines clés : l'édition d'images par commandes, le maintien de la cohérence des caractères, une vitesse de traitement impressionnante et la technologie de sécurité SynthID.
Les utilisateurs peuvent utiliser le langage naturel pour modifier des éléments d'une photo. Par exemple, en saisissant simplement la commande « ajouter une chaise rouge à côté de la table » ou « changer l'arrière-plan en forêt », le modèle effectuera les modifications avec précision et fluidité.
La préservation de la cohérence des personnages est considérée comme la fonctionnalité la plus révolutionnaire. Le modèle peut mémoriser et reproduire l'image d'un personnage ou d'un objet avec des caractéristiques constantes (visage, vêtements, style, etc.) sur plusieurs images différentes.
Ceci est particulièrement utile pour les projets créatifs qui nécessitent la génération d'une série d'images liées entre elles, des bandes dessinées aux campagnes marketing.
Grâce à son architecture optimisée, Gemini 2.5 Flash Image peut produire des résultats de haute qualité en quelques secondes seulement, accélérant considérablement le processus créatif.
Toutes les images créées ou modifiées par le mannequin sont marquées d'un filigrane numérique invisible propriétaire de Google, permettant l'identification des images créées avec l'IA et contribuant ainsi à garantir la transparence et l'origine du contenu.
Le modèle Gemini 2.5 Flash Image ouvre la voie à de nombreuses applications potentielles, allant des utilisateurs individuels aux développeurs professionnels.
Les développeurs peuvent accéder au modèle via l'API Gemini et Google AI Studio pour créer leurs propres applications, tandis que les entreprises peuvent utiliser le modèle sur la plateforme Vertex AI.
Pour l'utilisateur moyen, ce modèle est directement intégré à Google Gemini et à d'autres applications, ce qui fait de la création d'images par IA un outil accessible et intuitif.
Grâce à ses fonctionnalités exceptionnelles, notamment sa capacité à maintenir une cohérence des caractères, Gemini 2.5 Flash Image devrait devenir un concurrent redoutable pour les logiciels de retouche photo traditionnels comme Photoshop, changeant ainsi la façon dont les créateurs et les utilisateurs interagissent avec les images numériques.

Source : https://vietnamnet.vn/nano-banana-la-gi-ma-khien-moi-nguoi-xon-xao-dung-dau-google-trends-viet-nam-2439283.html








Comment (0)