ChatGPT « dessine comme une photo »
Le 26 mars, la communauté des utilisateurs d'IA (intelligence artificielle) du monde entier, et notamment du Vietnam, était en émoi suite à la publication officielle par OpenAI de la fonctionnalité Images dans ChatGPT, mettant l'accent sur la création d'images pour les utilisateurs de son modèle intelligent. Auparavant, ChatGPT permettait également de créer des images, mais cette fonctionnalité était limitée et nécessitait le passage par un autre modèle de conversion texte-image réputé : DALL-E.
La capacité de cet outil à transformer du texte en dessins et à « combiner des images comme Photoshop » a rapidement suscité l'intérêt. Nombreux sont ceux qui ont qualifié la qualité d'image obtenue d'« incroyable » et la plupart l'ont jugée « supérieure » aux modèles d'IA populaires du marché.
ChatGPT crée des tasses à café réalistes avec une simple commande.
Selon Gabriel Goh, chef d'équipe de recherche chez OpenAI, l'amélioration significative des capacités de génération d'images de ChatGPT grâce au modèle GPT-4o réside dans la « liaison », un terme désignant la capacité du générateur d'images IA à maintenir le lien entre les attributs et les objets. M. Goh affirme que GPT-4o peut associer avec précision les attributs de 15 à 20 objets différents sans confusion, améliorant ainsi considérablement la précision et la fiabilité du contenu généré.
Non seulement il excelle dans la création d'images, mais Images in ChatGPT résout également le problème majeur des autres outils d'IA de génération d'images : l'affichage du texte à l'intérieur de l'image. En effet, de nombreuses images contenant du texte sont affichées avec précision, ce qui rend la distinction entre les images authentiques et les images truquées plus difficile.
L'inconvénient de cet outil réside dans le temps de génération des images, mais ce délai est jugé acceptable car la production d'images de haute qualité, la précision des détails et la correspondance avec la description de l'utilisateur exigent toujours de la patience. L'équipe de recherche a indiqué que ce problème de délai sera résolu ultérieurement.
De nombreuses inquiétudes subsistent quant à la possibilité de combiner des photos.
Outre l'aspect ludique de l'expérience initiale offerte par ChatGPT et OpenAI, les questions de sécurité des informations, de confidentialité et de risques d'exploitation sont de nouveau au cœur des préoccupations. « Dans un avenir proche, les images que vous voyez en ligne ne seront plus forcément réelles », s'inquiète un utilisateur Facebook vietnamien. Il explique avoir pu demander à ChatGPT de créer des images totalement fictives, mais d'un réalisme saisissant, comme par exemple une photo de l'acteur et ancien catcheur Dwayne Johnson (The Rock) faisant la promotion d'une marque de chewing-gum, ou encore une image d'un chat calico assis sur la cuisinière, d'un réalisme bluffant.
Grâce aux commandes détaillées fournies, les utilisateurs peuvent obtenir des résultats surprenants sans avoir besoin de connaissances approfondies des outils de retouche photo traditionnels.
Nombreux sont ceux qui ont même testé la fonction de « déshabillage » du nouvel outil. TN ( Hanoi ) a indiqué avoir utilisé la photo d'un mannequin trouvée sur Internet pour demander à ChatGPT de changer de vêtements, et que la quasi-totalité des commandes avait été exécutée avec une grande précision. « Cependant, il y a eu quelques refus, principalement pour non-respect du règlement du système concernant la création d'images protégées par le droit d'auteur ou la présence de contenu trop suggestif », a-t-il précisé.
Lors des tests de Thanh Nien , ChatGPT a refusé de créer des images représentant des personnages célèbres ou protégés par le droit d'auteur, qu'ils soient issus du monde réel, du cinéma ou de la littérature. « Je ne peux pas créer l'image demandée car l'image de référence que vous avez envoyée montre clairement le personnage de Doctor Strange, une propriété intellectuelle de Marvel, ce qui enfreint la politique de contenu en vigueur », a répondu le système lorsqu'on lui a demandé de créer une image de Doctor Strange assis… en train de boire un thé glacé au Vietnam.
Jackie Shannon, responsable des produits multimodaux chez ChatGPT, a confirmé que les images de ChatGPT bénéficient d'une protection renforcée contre les deepfakes, les contenus pornographiques et frauduleux. Notamment, les images générées intègrent les métadonnées standard C2PA pour les identifier comme des produits d'IA, mais nécessitent des outils distincts pour être vérifiées.
Cependant, nombreux sont ceux qui parviennent encore à contourner la loi et à utiliser des images de célébrités à des fins de divertissement. Par exemple, l'image du PDG Tim Cook tenant un téléphone Samsung au lieu d'un iPhone, celle de l'acteur Robert Downey Jr. mâchant un bonbon en forme de légume, ou encore la photo de Cristiano Ronaldo se disputant un ballon avec Lionel Messi dans une ruelle du Vietnam, devant une foule de passants…
Source : https://thanhnien.vn/lo-ngai-gia-mao-voi-kha-nang-tao-anh-nhu-that-cua-chatgpt-185250327005110274.htm






Comment (0)