ChatGPT « dessine comme une photo »
Le 26 mars, la communauté des utilisateurs d'IA (intelligence artificielle) du monde entier et du Vietnam a été en émoi lorsqu'OpenAI a officiellement lancé Images in ChatGPT, une fonctionnalité axée sur la création d'images pour les utilisateurs du modèle intelligent de l'entreprise. Auparavant, ChatGPT permettait également de créer des images, mais cette fonctionnalité était limitée et devait passer par un autre modèle de conversion de texte en image bien connu, DALL-E.
La capacité de l'outil à transformer du texte en dessin et à « combiner des images comme Photoshop » a rapidement attiré l'attention. Nombreux sont ceux qui ont qualifié la qualité de l'image de sortie d'« exceptionnelle » et la plupart l'ont jugée « supérieure » aux modèles d'IA courants du marché.
ChatGPT crée des tasses à café réalistes avec une simple commande
Selon Gabriel Goh, responsable de l'équipe de recherche chez OpenAI, l'amélioration significative des capacités de génération d'images de ChatGPT grâce au modèle GPT-4o réside dans la « liaison », terme désignant le degré de connexion entre les attributs et les objets par le générateur d'images IA. M. Goh a affirmé que GPT-4o est capable de lier avec précision les attributs de 15 à 20 objets différents sans confusion, améliorant ainsi considérablement la précision et la fiabilité du contenu généré.
Non seulement Images in ChatGPT est remarquable par sa capacité à créer des images, mais il corrige également la faiblesse fatale des autres outils d'IA de génération d'images, à savoir l'affichage d'écritures et de texte à l'intérieur de l'image. En effet, de nombreuses images contenant du texte sont affichées avec précision, ce qui rend la distinction entre le vrai et le faux encore plus difficile.
L'inconvénient de cet outil est la lenteur de la génération des images, mais ce délai est considéré comme raisonnable, car il est dû au fait que des images de bonne qualité, des détails précis et la correspondance avec la description de l'utilisateur exigent toujours de la patience. L'équipe de recherche a indiqué que ce problème de délai serait résolu à l'avenir.
De nombreuses inquiétudes concernant la possibilité de combiner des photos
Outre le plaisir de l'expérience initiale offerte par ChatGPT et OpenAI, la question de la sécurité des informations, de la confidentialité et du risque d'exploitation est à nouveau mise en avant. « Dans un avenir proche, les images que vous verrez en ligne ne seront peut-être pas forcément réelles », s'est inquiété un utilisateur Facebook vietnamien, qui pourrait demander à ChatGPT de créer des images totalement irréelles, aussi vraies que des photos. Par exemple, une photo de l'acteur et ancien catcheur Dwayne Johnson (The Rock) faisant la promotion d'une marque de chewing-gum, ou une photo d'un chat calico assis sur une cuisinière, parfaitement identique à une photo.
Grâce aux commandes détaillées fournies, les utilisateurs peuvent créer des résultats surprenants sans avoir besoin de connaissances approfondies sur l'utilisation des outils d'édition de photos traditionnels.
De nombreuses personnes ont même testé la fonctionnalité « déshabillage » du nouvel outil. TN ( Hanoï ) a déclaré avoir utilisé une photo de mannequin trouvée sur Internet pour demander à ChatGPT de changer de vêtements, comme demandé, et que presque toutes les demandes ont été satisfaites avec une grande précision. « Cependant, il y a eu quelques refus, principalement en raison de violations de la politique du système concernant la création d'images protégées par le droit d'auteur ou la présence de contenu trop sexy », a partagé TN.
Lors des tests de Thanh Nien , ChatGPT a refusé de créer des images liées à des personnages célèbres ou protégés par le droit d'auteur, qu'ils soient réels, de films ou de nouvelles. « Je ne peux pas créer l'image demandée, car l'image de référence que vous avez envoyée montre clairement le personnage de Doctor Strange – un personnage Marvel protégé par le droit d'auteur, ce qui enfreint la politique de contenu actuelle », a répondu le système lorsqu'on lui a demandé de créer une image de Doctor Strange assis… en train de boire du thé glacé au Vietnam.
Jackie Shannon, responsable des produits multimodaux chez ChatGPT, a confirmé que les images de ChatGPT bénéficient d'une protection renforcée contre les deepfakes, les contenus pornographiques ou frauduleux. Les images générées intégreront notamment les métadonnées standard C2PA pour les identifier comme des produits d'IA, mais nécessiteront des outils de vérification distincts.
Cependant, nombreux sont ceux qui parviennent encore à contourner la loi et à utiliser des images de célébrités à des fins de divertissement. Par exemple, l'image du PDG Tim Cook tenant un téléphone Samsung au lieu d'un iPhone, celle de l'acteur Robert Downey Jr. mâchant un bonbon végétal, ou encore celle de Cristiano Ronaldo jouant au ballon avec Lionel Messi dans une ruelle au Vietnam, devant une foule nombreuse…
Source : https://thanhnien.vn/lo-ngai-gia-mao-voi-kha-nang-tao-anh-nhu-that-cua-chatgpt-185250327005110274.htm
Comment (0)