ChatGPT «dessine comme une photographie»
Le 26 mars, les communautés d'utilisateurs d'IA du monde entier et du Vietnam étaient en émoi suite à la publication officielle par OpenAI de la fonctionnalité Images dans ChatGPT, un outil dédié à la création d'images pour les utilisateurs de son modèle intelligent. Auparavant, ChatGPT offrait également des fonctionnalités de création d'images, mais celles-ci étaient limitées et reposaient sur un autre modèle de conversion texte-image bien connu : DALL-E.
La capacité de cet outil à transformer du texte en dessins et à réaliser une fusion d'images d'une qualité comparable à celle de Photoshop a rapidement suscité l'intérêt. De nombreux utilisateurs ont qualifié la qualité des images obtenues d'« étonnante », la plupart la jugeant « supérieure » à celle d'autres modèles d'IA populaires du marché.
ChatGPT crée des images réalistes de tasses à café en utilisant une simple commande.
Selon Gabriel Goh, directeur de la recherche chez OpenAI, l'amélioration significative des capacités de génération d'images de ChatGPT grâce au modèle GPT-4o réside dans la « liaison » : un terme désignant la capacité du générateur d'images par IA à maintenir les liens entre les attributs et les objets. Goh affirme que GPT-4o peut associer avec précision les attributs de 15 à 20 objets différents sans erreur, améliorant ainsi considérablement la précision et la fiabilité du contenu généré.
Non seulement le module Images de ChatGPT excelle dans la création d'images, mais il corrige également une faiblesse majeure des autres outils de création d'images par IA : le rendu du texte dans les images. En effet, de nombreuses images contenant du texte sont rendues avec précision, ce qui rend de plus en plus difficile la distinction entre les images authentiques et les images truquées.
L'inconvénient de cet outil réside dans son temps de création d'images relativement long, mais ce délai est jugé acceptable car la production d'images de haute qualité, aux détails précis et correspondant à la description de l'utilisateur, exige toujours de la patience. L'équipe de recherche a indiqué que ce problème de délai sera résolu ultérieurement.
De nombreuses inquiétudes ont été soulevées quant à la possibilité de manipulation d'images.
Au-delà du plaisir initial que procurent ChatGPT et OpenAI, les préoccupations liées à la sécurité des informations, à la confidentialité et aux risques d'exploitation sont de nouveau au premier plan. « Bientôt, les images que vous voyez en ligne ne seront peut-être plus réelles », s'inquiète un utilisateur de Facebook au Vietnam. Il pourrait en effet demander à ChatGPT de créer des images entièrement fabriquées, d'un réalisme saisissant, comme par exemple une photo de l'acteur et ancien catcheur Dwayne Johnson (The Rock) faisant la publicité d'une marque de chewing-gum, ou encore une chatte calico assise sur une cuisinière, d'un réalisme photographique parfait.
Grâce aux commandes détaillées fournies, les utilisateurs peuvent obtenir des résultats surprenants sans avoir besoin d'une connaissance approfondie des outils de retouche photo traditionnels.
En fait, de nombreuses personnes ont même testé la nouvelle fonctionnalité de « déshabillage » de l'outil. TN ( Hanoi ) a indiqué avoir utilisé la photo d'un mannequin trouvée sur Internet pour demander à ChatGPT de changer ses vêtements, et que la quasi-totalité de ses demandes avait été satisfaite avec une grande précision. « Cependant, quelques demandes ont été refusées, principalement pour non-respect du règlement du système concernant la création d'images protégées par le droit d'auteur ou de contenus trop suggestifs », a-t-elle précisé.
Lors de tests menés par le journal Thanh Nien , ChatGPT a refusé de créer des images représentant des personnages célèbres ou protégés par le droit d'auteur, qu'ils soient issus du monde réel, du cinéma ou de la bande dessinée. « Je ne peux pas créer l'image demandée car l'image de référence que vous avez envoyée montre clairement Doctor Strange – un personnage protégé par le droit d'auteur de Marvel – et cela enfreint notre politique de contenu actuelle », a répondu le système lorsqu'on lui a demandé de créer une image de Doctor Strange assis… en train de boire un thé glacé au Vietnam.
Jackie Shannon, responsable des produits multimodaux chez ChatGPT, affirme que la fonctionnalité Images de ChatGPT offre une protection efficace contre les deepfakes, les contenus pornographiques et les contenus frauduleux. Notamment, les images générées intègrent des métadonnées C2PA standard permettant de les identifier comme des produits d'IA, mais nécessitent un outil distinct pour leur vérification.
Cependant, nombreuses sont les personnes qui parviennent encore à contourner les règles et à utiliser des images de célébrités à des fins de divertissement. Par exemple, une photo du PDG Tim Cook tenant un téléphone Samsung au lieu d'un iPhone, une image de l'acteur Robert Downey Jr. mâchant un bonbon en forme de légume, ou encore une série de tableaux représentant Cristiano Ronaldo et Lionel Messi se disputant un ballon dans une ruelle du Vietnam, sous le regard de nombreux badauds…
Source : https://thanhnien.vn/lo-ngai-gia-mao-voi-kha-nang-tao-anh-nhu-that-cua-chatgpt-185250327005110274.htm






Comment (0)