(CLO) Google vient de lancer un nouvel outil d'intelligence artificielle (IA) appelé « Whiskk », permettant aux utilisateurs de télécharger des photos pour récupérer des images combinées générées par l'IA, même si l'utilisateur ne saisit aucun texte.
Whisk utilise l'IA pour combiner le sujet, le contexte et le style d'une photo téléchargée, créant ainsi une image nouvelle et plus unique.
Whisk est décrit par Google comme un « outil créatif » permettant aux utilisateurs de générer rapidement de nouvelles idées visuelles sans nécessiter de compétences professionnelles en retouche photo. Selon Google, il ne s'agit pas d'un éditeur d'images traditionnel, mais plutôt d'un outil d'IA ludique visant à stimuler la créativité et la découverte rapide.
Lorsqu'un utilisateur télécharge une photo, Whisk utilise une combinaison du service d'IA de Google, Gemini, et de la technologie Imagen 3, un outil qui crée des images à partir de texte que Google a acquis auprès de DeepMind.
Gemini analysera la photo et créera une légende, puis Imagen 3 combinera les éléments de cette photo de manière créative, en conservant « l’essence » du sujet plutôt que de le copier exactement.
Interface de l'outil Fouet. Capture d'écran
Cela signifie que le résultat final peut ne pas être identique à 100 % à l'image originale. Par exemple, la taille, la coiffure ou le teint des sujets de la nouvelle image peuvent différer de l'original. Cependant, les utilisateurs peuvent toujours ajuster les informations d'entrée, modifier la scène, le style ou combiner plusieurs sujets pour créer des images différentes.
Whisk permet de créer des images non seulement à partir de texte, mais aussi d'images brutes, élargissant ainsi les possibilités créatives sans nécessiter d'expérience en retouche photo. « Whisk est conçu pour aider les utilisateurs à remixer sujets, contextes et styles de manière créative, en leur permettant d'explorer visuellement plutôt que de retoucher méticuleusement chaque pixel », a déclaré Thomas Iljic, directeur de la gestion des produits chez Google Labs.
Bien que Whisk soit à ses débuts de développement, l'outil a été lancé en tant que site Web sur Google Labs et est désormais disponible pour les utilisateurs aux États-Unis.
Dan Ives, directeur général et analyste principal chez Wedbush Securities, a déclaré que Whisk marque un autre « moment de démonstration de force » pour Google dans la course technologique.
Ives a également souligné que DeepMind, le laboratoire d'IA acquis par Google en 2014, est un atout clé pour aider Google à maintenir sa position dans le secteur de l'IA. Les produits d'IA, dont Whisk, constituent un élément clé de la stratégie de développement de Google pour les années à venir, avec plusieurs nouveaux produits attendus d'ici 2025.
L'outil Whisk ouvre de nouvelles perspectives d'utilisation de l'IA pour créer des produits créatifs avec une intervention minimale de l'utilisateur. Cela témoigne des progrès de l'IA dans la compréhension et la combinaison créative d'éléments visuels.
Whisk s'inscrit dans une tendance croissante parmi les grandes entreprises technologiques, dont Google et OpenAI, visant à développer des outils d'IA destinés aux consommateurs, visant à offrir de nouvelles expériences créatives, en générant des images, du texte et des vidéos . OpenAI a également récemment lancé un générateur de conversion de texte en vidéo appelé Sora, qui concurrence directement Whisk.
Ngoc Anh (selon CNN, The Verge, ZDNET)
Source : https://www.congluan.vn/google-ra-mat-cong-cu-tao-hinh-anh-ai-tu-hinh-anh-that-post326441.html
Comment (0)