(CLO) Google vient de lancer un nouvel outil d'intelligence artificielle (IA) appelé « Whist », qui permet aux utilisateurs de télécharger des photos pour récupérer des images composites générées par l'IA, même sans entrer de texte.
Whisk utilise l'IA pour combiner le sujet, le contexte et le style de la photo téléchargée, créant ainsi une image nouvelle et plus unique.
Google décrit Whisk comme un « outil créatif » qui permet aux utilisateurs de générer rapidement de nouvelles idées visuelles sans avoir besoin de compétences professionnelles en retouche photo. Selon Google, il ne s'agit pas d'un éditeur d'images traditionnel, mais plutôt d'un outil d'IA innovant conçu pour stimuler la créativité et favoriser les découvertes rapides.
Lorsqu'un utilisateur télécharge une image, Whisk utilise une combinaison du service d'IA de Google, Gemini, et de la technologie Imagen 3 – un outil de création d'images à partir de texte que Google a acquis auprès de DeepMind.
Gemini analysera la photo et créera une légende, puis Imagen 3 combinera les éléments de cette photo de manière créative, en conservant « l’essence » du sujet plutôt qu’en la copiant exactement.
Interface de l'outil Whisk. Capture d'écran.
Cela signifie que le résultat final peut ne pas être identique à 100 % à l'image originale. Par exemple, la taille, la coiffure ou le teint des sujets de la nouvelle image peuvent différer de l'originale. Cependant, les utilisateurs peuvent toujours ajuster les informations saisies, modifier l'arrière-plan, le style ou combiner plusieurs thèmes pour créer des images différentes.
Whisk peut générer des images non seulement à partir de texte, mais aussi à partir d'images originales, élargissant ainsi les possibilités créatives sans exiger de compétences en retouche photo. Thomas Iljic, directeur de la gestion des produits chez Google Labs, a déclaré : « Whisk est conçu pour aider les utilisateurs à remixer de manière créative sujets, arrière-plans et styles, leur permettant d'explorer visuellement plutôt que de retoucher méticuleusement chaque pixel. »
Bien que Whisk soit encore à ses débuts en matière de développement, l'outil a été lancé sous forme de site web sur Google Labs et est désormais disponible pour les utilisateurs aux États-Unis.
Dan Ives, directeur général et analyste principal chez Wedbush Securities, a déclaré que Whisk marque un nouveau « moment de force » pour Google dans la course technologique.
Ives a également souligné que DeepMind, le laboratoire d'IA acquis par Google en 2014, est un atout crucial qui permet à Google de maintenir sa position dans le domaine de l'IA. Les produits d'IA, dont Whisk, constituent un élément clé de la stratégie de développement de produits de Google pour les années à venir, avec de nombreux nouveaux produits attendus en 2025.
Les outils de Whisk ouvrent de nouvelles perspectives pour l'utilisation de l'IA dans la création de produits innovants nécessitant une intervention minimale de l'utilisateur. Ceci témoigne des progrès de l'IA dans la compréhension et la combinaison créative d'éléments visuels.
Whisk s'inscrit dans une tendance forte observée chez les grandes entreprises technologiques, telles que Google et OpenAI, qui développent des outils d'IA pour les consommateurs. Ces outils visent à offrir des expériences créatives innovantes, de la création d'images et de textes à la réalisation de vidéos . Récemment, OpenAI a également lancé Sora, un outil de création de vidéos à partir de texte, concurrent direct de Whisk.
Ngoc Anh (selon CNN, The Verge, ZDNET)
Source : https://www.congluan.vn/google-ra-mat-cong-cu-tao-hinh-anh-ai-tu-hinh-anh-that-post326441.html










Comment (0)