![]() |
Το Nano Banana Pro της Google έχει αρκετά ρεαλιστική ποιότητα εικόνας. Φωτογραφία: Mashable . |
Στα πρώτα χρόνια της τεχνολογίας απεικόνισης με τεχνητή νοημοσύνη (AI), τα προϊόντα που προέκυπταν ήταν συχνά εύκολα αναγνωρίσιμα ως ψεύτικα. Εικόνες με πάρα πολλά δάχτυλα, παραμορφωμένες λεπτομέρειες σώματος ή μη ρεαλιστικός φωτισμός ήταν συνηθισμένα αποκαλυπτικά σημάδια.
Ωστόσο, αυτή η εποχή πλησιάζει στο τέλος της. Τα εργαλεία δημιουργίας εικόνων με τεχνητή νοημοσύνη γίνονται ολοένα και πιο πειστικά, όχι τελειοποιώντας την ίδια την εικόνα, αλλά ενσωματώνοντας σκόπιμα ατέλειες που μιμούνται πραγματικές φωτογραφίες.
Τάσεις στη δημιουργία εικόνων με τεχνητή νοημοσύνη
Η OpenAI λάνσαρε το εργαλείο δημιουργίας εικόνων DALL-E πριν από λιγότερο από πέντε χρόνια. Η πρώτη έκδοση μπορούσε να δημιουργήσει μόνο εικόνες με ανάλυση 256 x 256 pixel, γεγονός που την καθιστούσε περισσότερο πειραματική παρά πρακτική. Με το DALL-E 2, η ανάλυση αυξήθηκε στα 1024 x 1024 pixel, με αποτέλεσμα σημαντικά πιο ρεαλιστικές εικόνες. Ωστόσο, οι λεπτομέρειες εξακολουθούν να εμφανίζουν σημάδια ανωμαλιών, από θολές επιφάνειες έως αντικείμενα που είναι δύσκολο να εξηγηθούν οπτικά.
Ταυτόχρονα, τα Midjourney και Stable Diffusion κέρδισαν γρήγορα την προσοχή της δημιουργικής κοινότητας. Τα επόμενα χρόνια, τα μοντέλα βελτιώνονταν συνεχώς, μειώνοντας τα γεωμετρικά σφάλματα και ενισχύοντας την ορατότητα του κειμένου. Ωστόσο, μεγάλο μέρος της τεχνητής νοημοσύνης εξακολουθούσε να φαίνεται «υπερβολικά τέλειο», με τον φωτισμό, τη σύνθεση και την ομαλότητα να μοιάζουν περισσότερο με εικόνες παρά με πραγματικές φωτογραφίες.
![]() |
Πολλά μοντέλα τεχνητής νοημοσύνης παράγουν εικόνες που είναι πολύ ρεαλιστικές για να είναι αληθινές. Φωτογραφία: Bloomberg . |
Αυτή η τάση αλλάζει. Οι προγραμματιστές αρχίζουν να κινούνται προς τον ρεαλισμό, αναδημιουργώντας τις ατέλειες που είναι εγγενείς στις φωτογραφίες που λαμβάνονται με κοινές συσκευές, ειδικά με κάμερες τηλεφώνων.
Στο δεύτερο εξάμηνο του 2025, η Google παρουσίασε το μοντέλο δημιουργίας εικόνων Nano Banana στην εφαρμογή Gemini, ακολουθούμενο από περαιτέρω αναβαθμίσεις με το Nano Banana Pro. Σύμφωνα με τον γίγαντα της αναζήτησης, αυτό είναι το πιο ρεαλιστικό μοντέλο εικόνας μέχρι σήμερα, με τη δυνατότητα να αξιοποιεί την πραγματική γνώση και να εμφανίζει κείμενο πιο αποτελεσματικά.
Αξίζει να σημειωθεί ότι πολλές εικόνες που παράγονται από αυτό το μοντέλο μοιάζουν πολύ με εκείνες που τραβήχτηκαν με smartphone, από την αντίθεση και την προοπτική έως τον φωτισμό και την ευκρίνεια.
Οι φωτογραφίες που λαμβάνονται με κάμερες smartphone έχουν το δικό τους μοναδικό στυλ. Λόγω περιορισμών στο μέγεθος του αισθητήρα και του φακού, τα smartphone βασίζονται στην επεξεργασία πολλαπλών καρέ για τη βελτίωση της ποιότητας της εικόνας. Αυτό δημιουργεί φωτογραφίες με βελτιωμένες σκοτεινές περιοχές, επισημασμένες λεπτομέρειες και βελτιστοποιημένες για προβολή σε μικρές οθόνες. Η τεχνητή νοημοσύνη, μαθαίνοντας αυτό το στυλ, κάνει τις εικόνες πιο οικείες στους θεατές, μειώνοντας έτσι την αίσθηση της τεχνητότητας.
Το παράδοξο των ρεαλιστικών εικόνων
Η Google δεν είναι η μόνη περίπτωση. Το Adobe Firefly προσφέρει μια επιλογή «βελτίωσης εικόνας», επιτρέποντας στους χρήστες να μειώσουν την επιφανειακή επεξεργασία των εικόνων AI ώστε να μοιάζουν περισσότερο με πραγματικές φωτογραφίες. Το Meta περιλαμβάνει επίσης ένα ρυθμιστικό «στυλ», επιτρέποντας στους χρήστες να προσαρμόσουν το επίπεδο ρεαλισμού.
Στον τομέα του βίντεο , εργαλεία όπως το Sora της OpenAI ή το Veo της Google χρησιμοποιούνται για τη δημιουργία κλιπ χαμηλής ποιότητας, με κοκκώδη υφή, τα οποία μιμούνται εικόνες από κάμερες ασφαλείας, οι οποίες είναι αρκετά «κακές» για να είναι πιστευτές.
![]() |
Τα βίντεο που παράγονται με τεχνητή νοημοσύνη γίνονται ολοένα και πιο ρεαλιστικά. Φωτογραφία: Bloomberg . |
Σύμφωνα με ορισμένους ειδικούς φωτογραφίας, η ικανότητα της Τεχνητής Νοημοσύνης να προσομοιώνει γνωστά ελαττώματα μπορεί να βοηθήσει τα μοντέλα να αποφύγουν να πέσουν στην «ασυνήθιστη κοιλάδα», μια κατάσταση όπου οι εικόνες μοιάζουν πολύ με την πραγματικότητα, αλλά εξακολουθούν να δημιουργούν μια αίσθηση ανησυχίας στον θεατή. Αντί να αναδημιουργεί την πραγματικότητα, η Τεχνητή Νοημοσύνη απλώς πρέπει να μιμείται τον τρόπο με τον οποίο οι άνθρωποι καταγράφουν εικόνες με όλους τους εγγενείς περιορισμούς και ανακρίβειές τους.
Αυτή η εξέλιξη θέτει μια σημαντική πρόκληση για την ικανότητα διάκρισης μεταξύ γνήσιων και ψεύτικων εικόνων. Καθώς οι εικόνες τεχνητής νοημοσύνης μοιάζουν ολοένα και περισσότερο με συμβατικές φωτογραφίες, ο προσδιορισμός της προέλευσής τους καθίσταται πιο δύσκολος. Σε απάντηση σε αυτό, εφαρμόζεται το πρότυπο C2PA Content Credentials για την προσθήκη κρυπτογραφικών υπογραφών στις εικόνες, επιτρέποντας την ιχνηλασιμότητα από τη στιγμή της δημιουργίας.
Προς το παρόν, οι περισσότερες φωτογραφίες που λαμβάνονται με smartphone δεν διαθέτουν πληροφορίες ελέγχου ταυτότητας, ενώ η διαχωριστική γραμμή μεταξύ ψηφιακά επεξεργασμένων εικόνων και εκείνων που δημιουργούνται εξ ολοκλήρου από τεχνητή νοημοσύνη γίνεται ολοένα και πιο θολή. Μέχρι να εφαρμοστούν ομοιόμορφα πρότυπα σε όλο το υλικό και τις πλατφόρμες κοινής χρήσης, οι χρήστες πρέπει να εξακολουθούν να επιδεικνύουν την απαραίτητη προσοχή σχετικά με τις εικόνες στον ψηφιακό χώρο.
Πηγή: https://znews.vn/nghich-ly-cua-ai-tao-anh-post1612058.html









Σχόλιο (0)