![]() |
Le Nano Banana Pro de Google offre une qualité d'image assez réaliste. Photo : Mashable . |
Au début de l'ère de l'imagerie par intelligence artificielle (IA), les images obtenues étaient souvent facilement identifiables comme étant fausses. Des images avec trop de doigts, des détails corporels déformés ou un éclairage irréaliste étaient des signes révélateurs courants.
Cependant, cette époque touche à sa fin. Les outils de création d'images basés sur l'IA deviennent de plus en plus convaincants, non pas en perfectionnant l'image elle-même, mais en y intégrant délibérément des défauts qui imitent les photographies réelles.
Tendances en matière de création d'images par IA
OpenAI a lancé son outil de génération d'images DALL-E il y a moins de cinq ans. La première version ne pouvait créer que des images d'une résolution de 256 x 256 pixels, ce qui la rendait plus expérimentale que pratique. Avec DALL-E 2, la résolution a été portée à 1024 x 1024 pixels, offrant des images nettement plus réalistes. Cependant, certains détails présentent encore des anomalies, allant de surfaces floues à des objets difficiles à identifier visuellement.
Parallèlement, Midjourney et Stable Diffusion ont rapidement attiré l'attention de la communauté créative. Au cours des années suivantes, les modèles ont été continuellement améliorés, réduisant les erreurs géométriques et optimisant la visibilité du texte. Cependant, une grande partie de l'IA paraissait encore « trop parfaite », l'éclairage, la composition et la fluidité ressemblant davantage à des illustrations qu'à de véritables photographies.
![]() |
De nombreux modèles d'IA produisent des images trop réalistes pour être fidèles à la réalité. Photo : Bloomberg . |
Cette tendance est en train de changer. Les développeurs s'orientent de plus en plus vers le réalisme, recréant les imperfections inhérentes aux photos prises avec des appareils courants, notamment les appareils photo de téléphones portables.
Au cours du second semestre 2025, Google a intégré le modèle de création d'images Nano Banana à l'application Gemini, avant de proposer des mises à jour ultérieures avec Nano Banana Pro. Selon le géant de la recherche, il s'agit du modèle d'image le plus réaliste à ce jour, capable d'exploiter des connaissances du monde réel et d'afficher le texte de manière plus efficace.
À noter que de nombreuses images produites par ce modèle ressemblent fortement à celles prises avec des smartphones, que ce soit au niveau du contraste, de la perspective, de l'éclairage ou de la netteté.
Les photos prises avec un smartphone possèdent un style unique. Du fait des limitations de leur capteur et de leur objectif, les smartphones utilisent le traitement multi-images pour améliorer la qualité d'image. Il en résulte des photos aux zones sombres rehaussées, aux détails accentués et optimisées pour l'affichage sur petits écrans. L'intelligence artificielle, en apprenant ce style, rend les images plus naturelles et moins artificielles.
Le paradoxe des images réalistes
Google n'est pas un cas isolé. Adobe Firefly propose une option d'« amélioration d'image » permettant d'atténuer le lissage des images générées par IA pour qu'elles ressemblent davantage à des photographies. Meta inclut également un curseur de « style » permettant d'ajuster le niveau de réalisme.
Dans le domaine de la vidéo , des outils comme Sora d'OpenAI ou Veo de Google sont utilisés pour créer des clips granuleux de faible qualité qui imitent les images des caméras de sécurité, suffisamment « mauvaises » pour être crédibles.
![]() |
Les vidéos produites grâce à l'IA deviennent de plus en plus réalistes. Photo : Bloomberg . |
D'après certains experts en photographie, la capacité de l'IA à simuler des défauts familiers peut aider les modèles à éviter de tomber dans la « vallée de l'inhabituel », un état où les images ressemblent fortement à la réalité tout en créant un sentiment de malaise chez le spectateur. Au lieu de recréer la réalité, l'IA doit simplement imiter la façon dont les humains capturent des images, avec toutes leurs limitations et imprécisions inhérentes.
Cette évolution complexifie considérablement la distinction entre images authentiques et falsifiées. À mesure que les images générées par l'IA ressemblent de plus en plus à des photographies classiques, identifier leur origine devient plus difficile. Pour y remédier, la norme C2PA Content Credentials est mise en œuvre afin d'ajouter des signatures cryptographiques aux images, permettant ainsi leur traçabilité dès leur création.
Actuellement, la plupart des photos prises avec un smartphone ne comportent pas d'informations d'authentification, et la frontière entre les images retouchées numériquement et celles entièrement créées par l'IA est de plus en plus floue. Tant que les normes ne seront pas uniformément appliquées à l'ensemble du matériel et des plateformes de partage, les utilisateurs devront rester vigilants face aux images numériques.
Source : https://znews.vn/nghich-ly-cua-ai-tao-anh-post1612058.html









Comment (0)