Το ChatGPT "σχεδιάζει σαν φωτογραφία"
Στις 26 Μαρτίου, η κοινότητα χρηστών Τεχνητής Νοημοσύνης (ΤΝ) σε όλο τον κόσμο , καθώς και στο Βιετνάμ, ενθουσιάστηκε όταν η OpenAI κυκλοφόρησε επίσημα το Images in ChatGPT, εστιάζοντας στις δυνατότητες δημιουργίας εικόνων για τους χρήστες του έξυπνου μοντέλου της εταιρείας. Προηγουμένως, το ChatGPT είχε επίσης τη δυνατότητα δημιουργίας εικόνων, αλλά ήταν περιορισμένο και έπρεπε να περάσει από ένα άλλο διάσημο μοντέλο μετατροπής κειμένου σε εικόνα, το DALL-E.
Η ικανότητα του εργαλείου να μετατρέπει κείμενο σε σχέδια και να «συνδυάζει εικόνες όπως το Photoshop» τράβηξε γρήγορα την προσοχή. Πολλοί είπαν ότι η ποιότητα της εικόνας εξόδου ήταν «εκπληκτική» και οι περισσότεροι την αξιολόγησαν ως «ανώτερη» σε σύγκριση με τα δημοφιλή μοντέλα τεχνητής νοημοσύνης στην αγορά.
Το ChatGPT δημιουργεί ρεαλιστικά φλιτζάνια καφέ με μια απλή εντολή
Σύμφωνα με τον Gabriel Goh, επικεφαλής της ερευνητικής ομάδας στην OpenAI, η σημαντική βελτίωση στις δυνατότητες δημιουργίας εικόνων του ChatGPT χρησιμοποιώντας το μοντέλο GPT-4o είναι η «Δέσμευση» - ένας όρος για τον βαθμό στον οποίο η γεννήτρια εικόνων AI διατηρεί τη σύνδεση μεταξύ χαρακτηριστικών και αντικειμένων. Ο κ. Goh υποστήριξε ότι το GPT-4o μπορεί να συνδέσει με ακρίβεια χαρακτηριστικά για 15-20 διαφορετικά αντικείμενα χωρίς σύγχυση, βελτιώνοντας σημαντικά την ακρίβεια και την αξιοπιστία του παραγόμενου περιεχομένου.
Το Images in ChatGPT, όχι μόνο εξαιρετικό στην ικανότητα δημιουργίας εικόνων, λύνει επίσης την «μοιραία» αδυναμία άλλων εργαλείων τεχνητής νοημοσύνης που δημιουργούν εικόνες, η οποία είναι η εμφάνιση γραφής και κειμένου μέσα στην εικόνα. Στην πραγματικότητα, πολλές εικόνες που περιέχουν κείμενο εμφανίζονται με ακρίβεια, καθιστώντας ακόμη πιο δύσκολο να διακριθεί η εικόνα μεταξύ ψεύτικου και πραγματικού.
Το μειονέκτημα αυτού του εργαλείου είναι ότι χρειάζεται πολύς χρόνος για τη δημιουργία εικόνων, αλλά θεωρείται λογικό επειδή η καθυστέρηση δημιουργείται επειδή οι εικόνες καλής ποιότητας, οι ακριβείς λεπτομέρειες και η αντιστοίχιση με την περιγραφή του χρήστη απαιτούν πάντα υπομονή. Η ερευνητική ομάδα δήλωσε ότι το πρόβλημα της καθυστέρησης θα βελτιωθεί στο μέλλον.
Πολλές ανησυχίες σχετικά με τη δυνατότητα συνδυασμού φωτογραφιών
Εκτός από τη διασκέδαση στην αρχική εμπειρία που προσφέρουν στους χρήστες το ChatGPT και το OpenAI, το ζήτημα της ασφάλειας των πληροφοριών, της ιδιωτικότητας, καθώς και ο κίνδυνος εκμετάλλευσης έρχεται για άλλη μια φορά στο προσκήνιο. «Στο εγγύς μέλλον, οι εικόνες που βλέπετε στο διαδίκτυο μπορεί να μην είναι απαραίτητα αληθινές», εξέφρασε ένας χρήστης του Facebook στο Βιετνάμ την ανησυχία του όταν ζήτησε από το ChatGPT να δημιουργήσει εντελώς εξωπραγματικές εικόνες που μοιάζουν τόσο αληθινές όσο οι φωτογραφίες, για παράδειγμα, μια φωτογραφία του ηθοποιού και πρώην παλαιστή Dwayne Johnson (The Rock) που διαφημίζει μια μάρκα τσίχλας ή μια φωτογραφία μιας γάτας από βελούδο που κάθεται στη σόμπα και μοιάζει ακριβώς με φωτογραφία.
Με λεπτομερείς εντολές που παρέχονται, οι χρήστες μπορούν να δημιουργήσουν εκπληκτικά αποτελέσματα χωρίς να χρειάζονται εις βάθος γνώση της χρήσης παραδοσιακών εργαλείων επεξεργασίας φωτογραφιών.
Πολλοί άνθρωποι έχουν δοκιμάσει ακόμη και την ικανότητα «γδύσης» του νέου εργαλείου. Ο TN ( Ανόι ) είπε ότι χρησιμοποίησε μια φωτογραφία μοντέλου που τραβήχτηκε από το διαδίκτυο για να ζητήσει από το ChatGPT να αλλάξει ρούχα όπως του ζητήθηκε και σχεδόν όλες οι παραγγελίες ικανοποιήθηκαν με μεγάλη ακρίβεια. «Ωστόσο, υπήρξαν ακόμη κάποιες απορρίψεις, κυρίως λόγω παραβιάσεων της πολιτικής του συστήματος σχετικά με τη δημιουργία εικόνων που προστατεύονται από πνευματικά δικαιώματα ή την ύπαρξη υπερβολικά σέξι περιεχομένου», μοιράστηκε ο TN.
Στις δοκιμές του Thanh Nien , το ChatGPT αρνήθηκε να δημιουργήσει εικόνες που σχετίζονται με διάσημους ή χαρακτήρες που προστατεύονται από πνευματικά δικαιώματα στον πραγματικό κόσμο ή σε ταινίες και ιστορίες. «Δεν μπορώ να δημιουργήσω την εικόνα όπως ζητήθηκε επειδή η εικόνα αναφοράς που στείλατε δείχνει καθαρά τον χαρακτήρα Doctor Strange - έναν χαρακτήρα της Marvel που προστατεύεται από πνευματικά δικαιώματα και αυτό παραβιάζει την τρέχουσα πολιτική περιεχομένου», απάντησε το σύστημα όταν του ζητήθηκε να δημιουργήσει μια εικόνα του Doctor Strange να κάθεται... πίνει παγωμένο τσάι στο Βιετνάμ.
Η Jackie Shannon, επικεφαλής πολυτροπικών προϊόντων στο ChatGPT, επιβεβαίωσε ότι οι εικόνες στο ChatGPT διαθέτουν ισχυρή προστασία από Deepfake, πορνογραφικό ή δόλιο περιεχόμενο. Αξίζει να σημειωθεί ότι οι εικόνες που δημιουργούνται θα ενσωματώνουν τα τυπικά μεταδεδομένα C2PA για να τις επισημαίνουν ως προϊόντα τεχνητής νοημοσύνης, αλλά χρειάζονται ξεχωριστά εργαλεία για τον έλεγχο.
Ωστόσο, εξακολουθούν να υπάρχουν πολλοί άνθρωποι που «παρακάμπτουν» με επιτυχία τον νόμο και χρησιμοποιούν εικόνες διάσημων προσώπων για ψυχαγωγικούς σκοπούς. Για παράδειγμα, η εικόνα του Διευθύνοντος Συμβούλου Τιμ Κουκ να κρατάει ένα τηλέφωνο Samsung αντί για iPhone, ή η εικόνα του ηθοποιού Ρόμπερτ Ντάουνι Τζούνιορ να μασουλάει μια λαχανόπιτα, ή η εικόνα του Κριστιάνο Ρονάλντο να παίζει για μια μπάλα με τον Λιονέλ Μέσι σε ένα μικρό σοκάκι στο Βιετνάμ μπροστά σε πολλούς ανθρώπους...
[διαφήμιση_2]
Πηγή: https://thanhnien.vn/lo-ngai-gia-mao-voi-kha-nang-tao-anh-nhu-that-cua-chatgpt-185250327005110274.htm
Σχόλιο (0)