Το V7, το μοντέλο της MidJourney, λέγεται ότι είναι σε θέση να δημιουργεί λεπτομέρειες όπως τα χέρια με μεγαλύτερη συνέπεια. Φωτογραφία: Xeophon . |
Η Midjourney, μία από τις πρώτες γεννήτριες εικόνων με τεχνητή νοημοσύνη στο διαδίκτυο, μόλις κυκλοφόρησε το πρώτο της νέο μοντέλο μετά από σχεδόν ένα χρόνο.
Το μοντέλο, με την ονομασία V7, κυκλοφόρησε σε beta έκδοση τα μεσάνυχτα της 4ης Απριλίου (ώρα ΗΠΑ). Μια εβδομάδα νωρίτερα, η OpenAI είχε επίσης λανσάρει μια παρόμοια λειτουργία με το ChatGPT και γρήγορα δημιούργησε θόρυβο στα μέσα κοινωνικής δικτύωσης με τη νέα τάση δημιουργίας φωτογραφιών σε στυλ Ghibli.
Αν δεν έχετε χρησιμοποιήσει ποτέ το Midjourney, θα πρέπει πρώτα να αξιολογήσετε τις 200 εικόνες που προτείνει με βάση τις προτιμήσεις σας. Στη συνέχεια, το εργαλείο θα δημιουργήσει ένα εξατομικευμένο προφίλ που θα δημιουργεί φωτογραφίες που ταιριάζουν με την αισθητική σας. Το V7 είναι το πρώτο μοντέλο της Midjourney που έχει ενεργοποιημένη την εξατομίκευση από προεπιλογή.
Μπορείτε να ενεργοποιήσετε ή να απενεργοποιήσετε το V7 κάνοντας κλικ στη γραμμή εργαλείων «έκδοση» στον ιστότοπο. Επιπλέον, αυτό το μοντέλο μπορεί να χρησιμοποιηθεί στον διακομιστή Midjourney Discord.
Ο Διευθύνων Σύμβουλος της Midjourney, David Holz, περιέγραψε την V7 ως μια «εντελώς διαφορετική αρχιτεκτονική» σε μια ανάρτηση στο X. «Η V7 είναι πολύ πιο έξυπνη όσον αφορά τον χειρισμό εντολών κειμένου», συνέχισε ο Holz στο Discord.
Σχολίασε ότι το μοντέλο έχει επίσης την ικανότητα να επεξεργάζεται την αρχική εικόνα αρκετά καλά. Η ποιότητα της εικόνας έχει βελτιωθεί σημαντικά με υψηλή τελειότητα. Από τα μέρη του σώματος όπως τα χέρια, τα πόδια, μέχρι τις φακίδες, τα κεραμικά σχέδια είναι ομοιόμορφα σε κάθε λεπτομέρεια.
![]() |
Μερικά δείγματα εικόνων που δημιουργήθηκαν από το μοντέλο V7. Φωτογραφία: X/MidJourney. |
Εκτός από τις δύο λειτουργίες: Turbo (η οποία κοστίζει περισσότερο) και Relax, το V7 υποστηρίζει ένα νέο εργαλείο που ονομάζεται Draft Mode, το οποίο επιτρέπει τη δημιουργία εικόνων με 10 φορές μεγαλύτερη ταχύτητα και κοστίζει μόνο τα μισά από την τυπική λειτουργία. Οι εικόνες στη λειτουργία Draft θα έχουν χαμηλότερη ποιότητα, αλλά οι χρήστες μπορούν να αναβαθμίσουν και να αναδημιουργήσουν την εικόνα με ένα μόνο κλικ.
Σύμφωνα με τον Holz, ορισμένα από τα τυπικά χαρακτηριστικά του Midjourney δεν είναι ακόμη διαθέσιμα με το V7, συμπεριλαμβανομένης της αναβάθμισης και της αναδιαμόρφωσης υφών. Είπε ότι αυτά τα χαρακτηριστικά θα προστεθούν στο εγγύς μέλλον, πιθανώς μέσα στους επόμενους δύο μήνες.
«Πρόκειται για ένα εντελώς νέο μοντέλο με τα δικά του δυνατά σημεία και ίσως και κάποιες αδυναμίες», έγραψε ο Holz στο Discord. Σημείωσε ότι το V7 πιθανότατα θα απαιτήσει ένα νέο στυλ γραφής και ενθάρρυνε τους ανθρώπους να δοκιμάσουν την έκδοση για να βοηθήσουν στην παροχή σχολίων.
Ο δημοσιογράφος του Techcrunch, Kyle Wiggers, σημείωσε ότι το V7 απέδωσε καλά στις βασικές του εντολές. «Το μοντέλο του Midjourney δεν είναι ειδικά βελτιστοποιημένο για το Ghibli, τουλάχιστον όχι επίσημα, αλλά μπορεί να παράγει αισθητικά ευχάριστο έργο», πρόσθεσε.
Σύμφωνα με ειδικούς στην Τεχνητή Νοημοσύνη στο Βιετνάμ, η λειτουργία δημιουργίας εικόνων του ChatGPT μπορεί να είναι πιο εύχρηστη και πιο βολική από τις πρώιμες γεννήτριες εικόνων όπως το MidJourney και το Stable Diffusion. Ωστόσο, το μοντέλο του OpenAI δεν έχει ακόμη δημιουργήσει κάποια σημαντική ανακάλυψη στην ποιότητα της εικόνας, η οποία μπορεί να είναι χειρότερη από προηγούμενα εργαλεία.
Η Midjourney είναι μια μάλλον ασυνήθιστη εταιρεία. Ιδρύθηκε το 2022 από τον Holz, ο οποίος συνίδρυσε την εταιρεία κατασκευής περιφερειακών υπολογιστών Leap Motion, και η Midjourney δεν έχει λάβει ποτέ καμία εξωτερική επένδυση.
Η εταιρεία επίσης δεν αποκαλύπτει τα έσοδά της, αλλά η CBInsights εκτιμά ότι η Midjourney θα έχει έσοδα περίπου 200 εκατομμυρίων δολαρίων μέχρι το τέλος του 2023. Η εταιρεία δήλωσε πρόσφατα ότι δημιουργεί μια ομάδα υλικού για να εργαστεί σε ορισμένα μη δημοσιοποιημένα έργα και να συνεχίσει την εκπαίδευση μοντέλων που έχουν ανακοινωθεί προηγουμένως για τη δημιουργία βίντεο και τρισδιάστατων αντικειμένων.
Όπως και το ChatGPT, έτσι και το MidJourney αντιμετωπίζει αρκετές αγωγές, ισχυριζόμενες ότι παραβίασε τα δικαιώματα εκατομμυρίων καλλιτεχνών εκπαιδεύοντας εργαλεία τεχνητής νοημοσύνης σε εικόνες που αντλήθηκαν από τον ιστό χωρίς τη συγκατάθεση των δημιουργών τους.
Πηγή: https://znews.vn/mo-hinh-tao-anh-ai-tot-hon-chatgpt-post1543472.html
Σχόλιο (0)