Google DeepMind vient de présenter une avancée majeure dans le domaine de l'intelligence artificielle générative (GenAI) : le modèle Gemini 2.5 Flash Image.
Affectueusement connu sous le nom de « Nano Banana » par la communauté, ce modèle est un outil puissant, capable de transformer du texte en images et d'éditer des images existantes avec une grande précision et flexibilité.
Il s'agit d'une continuation de la gamme de modèles Gemini, mais elle est spécifiquement optimisée pour les tâches liées à l'image.

Avec des avantages exceptionnels en matière de création et de capacités d'édition de photos, Nano Banana attire une grande attention des utilisateurs de technologies du monde entier, y compris du Vietnam.
Selon Google Trends, les recherches pour « Gemini » et « Nano Banana » ont explosé ces dernières 24 heures. Les statistiques du 4 septembre montrent que le mot-clé « Gemini » est en tête du classement des tendances, tous sujets confondus.
Sur les forums et les groupes de réseaux sociaux, les utilisateurs partagent et testent également des commandes et des scripts de création d'images à l'aide de Nano Banana.
La plupart des gens apprécient la capacité de l’outil à créer des images « rapidement, proprement et rapidement » ainsi que la qualité du produit final.
Plus que la simple création d'images à partir de descriptions textuelles, Gemini 2.5 Flash Image excelle dans plusieurs aspects essentiels : l'édition d'images à la demande, la cohérence des caractères, une vitesse de traitement impressionnante et la technologie de sécurité SynthID.
Les utilisateurs peuvent utiliser le langage naturel pour modifier des éléments d'une photo. Par exemple, il suffit de saisir la commande « ajouter une chaise rouge à côté de la table » ou « changer l'arrière-plan en forêt » et le modèle effectuera la modification avec précision et fluidité.
La cohérence des personnages est considérée comme la fonctionnalité la plus révolutionnaire. Le modèle peut mémoriser et recréer l'image d'un personnage ou d'un objet présentant des caractéristiques cohérentes (visage, vêtements, style, etc.) sur plusieurs photos.
Ceci est particulièrement utile pour les projets créatifs qui nécessitent la création d'une série d'images liées, des bandes dessinées aux campagnes marketing.
Grâce à son architecture optimisée, Gemini 2.5 Flash Image peut produire des résultats de haute qualité en quelques secondes, accélérant considérablement le flux de travail créatif.
Toutes les images créées ou éditées par le modèle sont marquées d'un filigrane numérique invisible propriétaire de Google, permettant la reconnaissance des images créées avec l'IA, contribuant à garantir la transparence et l'origine du contenu.
Le modèle d'image Flash Gemini 2.5 ouvre un large éventail de possibilités d'application, des utilisateurs individuels aux développeurs professionnels.
Les développeurs peuvent accéder au modèle via l'API Gemini et Google AI Studio pour créer leurs propres applications, tandis que les entreprises peuvent utiliser le modèle sur la plateforme Vertex AI.
Pour l’utilisateur moyen, le modèle est intégré directement dans Google Gemini et d’autres applications, faisant de l’imagerie IA un outil accessible et intuitif.
Grâce à ses fonctionnalités exceptionnelles, notamment sa capacité à maintenir la cohérence des caractères, Gemini 2.5 Flash Image devrait devenir un concurrent redoutable des logiciels de retouche photo traditionnels tels que Photoshop, changeant la façon dont les créateurs et les utilisateurs interagissent avec les images numériques.

Source : https://vietnamnet.vn/nano-banana-la-gi-ma-khien-moi-nguoi-xon-xao-dung-dau-google-trends-viet-nam-2439283.html
Comment (0)