Μόλις πριν από λίγα χρόνια, η Κίνα οραματίστηκε ότι τελικά θα κυριαρχούσε στην παγκόσμια κούρσα της τεχνητής νοημοσύνης, αξιοποιώντας τον τεράστιο όγκο δεδομένων της χώρας για την ανάπτυξη εφαρμογών όπως η αναγνώριση προσώπου.

Οι πρόσφατες εξελίξεις στην παραγωγική τεχνητή νοημοσύνη – η χρήση μεγάλων μοντέλων για την παραγωγή περιεχομένου όπως κείμενο, εικόνες και βίντεο – έχουν αλλάξει την ισορροπία, αφήνοντας την Κίνα για άλλη μια φορά να μοιάζει με υστερούσα.

Η κυκλοφορία του Sora στις 16 Φεβρουαρίου έρχεται σε μια περίοδο που η Κίνα αντιμετωπίζει μια αυξανόμενη πρόκληση, καθώς αποκόπτεται από τις προηγμένες μονάδες επεξεργασίας γραφικών (GPU) της Nvidia λόγω των κλιμακούμενων περιορισμών στις εξαγωγές των ΗΠΑ. Οι καλύτεροι παίκτες τεχνητής νοημοσύνης της χώρας βρίσκονται αρκετά χρόνια πίσω από τους ξένους ομολόγους τους.

Ο Zhou Hongyi, ιδρυτής της εταιρείας ασφάλειας στο διαδίκτυο 360 Security Technology, αποκάλεσε τον Sora «έναν κουβά με κρύο νερό που χύθηκε πάνω από την Κίνα», ανέφερε ο Yicai στις 23 Φεβρουαρίου. Είπε ότι βοήθησε πολλούς ανθρώπους να δουν το χάσμα μεταξύ αυτών και των ηγετών του κόσμου .

Η OpenAI δεν έχει ακόμη κυκλοφορήσει το Sora στο κοινό. Δεν είναι ανοιχτού κώδικα όπως ορισμένοι από τους προκατόχους του. Μόνο ένας περιορισμένος αριθμός ατόμων έχει πρόσβαση σε μια δοκιμαστική έκδοση του Sora.

w9xz2qt5.png
Το Sora της OpenAI βοηθά τις κινεζικές εταιρείες τεχνολογίας να συνειδητοποιήσουν το χάσμα μεταξύ αυτών και των κορυφαίων τεχνολογιών τεχνητής νοημοσύνης στον κόσμο. (Φωτογραφία: SCMP)

Στην Κίνα, η Εθνική Διοίκηση Κυβερνοχώρου απαιτεί από όλα τα δημόσια μοντέλα μεγάλων γλωσσών (LLM) να εγγραφούν στην κυβέρνηση. Παγκόσμιοι κολοσσοί όπως η OpenAI και η Google δεν έχουν ακόμη παράσχει επίσημα υπηρεσίες εδώ.

Αυτή η απουσία έχει οδηγήσει πολλούς εγχώριους τεχνολογικούς κολοσσούς να διεκδικούν μια θέση στην αγορά με περισσότερα από 200 LLM. Οι Baidu, Tencent και Alibaba έχουν εισαγάγει τα δικά τους LLM.

Ωστόσο, λίγα εργαλεία μπορούν να συγκριθούν με το Sora, εν μέρει επειδή δεν χρησιμοποιούν ακόμη τη νέα αρχιτεκτονική Diffusion Transformer (DiT). Η μητρική εταιρεία του TikTok, ByteDance, δήλωσε ότι το εσωτερικό εργαλείο ελέγχου κίνησης βίντεο Boximator, το οποίο χρησιμοποιείται για την υποστήριξη της δημιουργίας βίντεο, βρίσκεται ακόμη σε αρχικό στάδιο και δεν είναι έτοιμο για μαζική κυκλοφορία.

Η εταιρεία παραδέχεται ότι υπάρχει μεγάλο χάσμα μεταξύ του Boximator και των κορυφαίων μοντέλων δημιουργίας βίντεο όσον αφορά την ποιότητα εικόνας, την πιστότητα και τη διάρκεια.

Αντί να επικοινωνήσουν με τον Sora, ορισμένοι στον κλάδο βλέπουν το πιο πιεστικό ζήτημα ως την απόκτηση πρόσβασης στα μοντέλα της OpenAI. Ωστόσο, οι Αμερικανοί νομοθέτες επιδιώκουν να περιορίσουν την πρόσβαση της Κίνας στις υπηρεσίες cloud τεχνητής νοημοσύνης της.

Ένας ανώνυμος Κινέζος προγραμματιστής δήλωσε στο SCMP ότι μια πιθανή πορεία για τους Κινέζους μηχανικούς τεχνητής νοημοσύνης είναι «πρώτα να αποκωδικοποιήσουν το Sora και να το εκπαιδεύσουν με τα δικά τους δεδομένα για να δημιουργήσουν ένα παρόμοιο προϊόν». Ο Xu Liang, ένας επιχειρηματίας τεχνητής νοημοσύνης με έδρα το Hangzhou, πιστεύει ότι η Κίνα σύντομα θα έχει παρόμοιες υπηρεσίες, αν και μπορεί να υπάρχει ακόμα ένα μικρό χάσμα μεταξύ των κινεζικών προϊόντων και του Sora.

Ο Wang Shuyi, καθηγητής με εξειδίκευση στην Τεχνητή Νοημοσύνη και τη μηχανική μάθηση στο Πανεπιστήμιο Tianjin Normal (TJNU), σχολίασε: η εμπειρία από την ανάπτυξη μεταπτυχιακών σπουδών LLM κατά το τελευταίο έτος επέτρεψε στις κινεζικές μεγάλες τεχνολογικές εταιρείες να συσσωρεύσουν γνώσεις σε αυτόν τον τομέα και να αποθηκεύσουν το απαραίτητο υλικό, επιτρέποντάς τους να παράγουν προϊόντα όπως το Sora τους επόμενους 6 μήνες.

Λίγους μήνες πριν από την κυκλοφορία του Sora, μια ομάδα ερευνητών κυκλοφόρησε το VBench, ένα εργαλείο συγκριτικής αξιολόγησης για μοντέλα δημιουργίας βίντεο. Η ομάδα του VBench, στην οποία συμμετείχαν ερευνητές από το Τεχνολογικό Πανεπιστήμιο Nanyang της Σιγκαπούρης και το Εργαστήριο Τεχνητής Νοημοσύνης της Σαγκάης στην Κίνα, διαπίστωσε ότι το Sora ξεπέρασε άλλα μοντέλα στη συνολική ποιότητα βίντεο, με βάση τις επιδείξεις που παρείχε το OpenAI.

Ο Λου Γιανξία, διευθυντής έρευνας της IDC China για αναδυόμενες τεχνολογίες, δήλωσε ότι τεχνολογικοί γίγαντες όπως η Baidu, η Alibaba και η Tencent θα είναι από τους πρώτους που θα λανσάρουν παρόμοιες υπηρεσίες στη χώρα.

Επιπλέον, οι iFlyTek, SenseTime και Hikvision – οι οποίες βρίσκονται όλες στον κατάλογο κυρώσεων της Ουάσινγκτον – θα συμμετάσχουν επίσης στην κούρσα, είπε.

Ωστόσο, η Κίνα εξακολουθεί να αντιμετωπίζει μια δύσκολη μάχη, καθώς η αγορά τεχνολογίας της απομονώνεται ολοένα και περισσότερο από τον κόσμο όσον αφορά το κεφάλαιο, το υλικό, τα δεδομένα, ακόμη και τους ανθρώπους, σύμφωνα με αναλυτές.

Το χάσμα στην αγοραία αξία μεταξύ των κορυφαίων τεχνολογικών εταιρειών της Κίνας και εκείνων στις ΗΠΑ, όπως η Microsoft, η Google και η Nvidia, έχει διευρυνθεί σημαντικά τα τελευταία χρόνια, καθώς το Πεκίνο ενίσχυσε την κυριαρχία του.

Επιπλέον, ενώ κάποτε η Κίνα θεωρούνταν ότι είχε πλεονέκτημα όσον αφορά την ποσότητα δεδομένων, ο κ. Lu επεσήμανε ότι η χώρα αντιμετωπίζει πλέον έλλειψη ποιοτικών δεδομένων που απαιτούνται για την εκπαίδευση νεότερων μοντέλων, σε συνδυασμό με την πρόκληση της περιορισμένης πρόσβασης σε προηγμένα τσιπ.

Η έλλειψη ταλέντων αποτελεί μια άλλη ανησυχία, σύμφωνα με στελέχη της IDC, καθώς οι καλύτεροι και λαμπρότεροι στην Τεχνητή Νοημοσύνη συχνά διαπρέπει ευκολότερα εργαζόμενοι για κορυφαίους παίκτες στις ΗΠΑ. Στην OpenAI, για παράδειγμα, ειδικοί τεχνολογίας από την Κίνα αποτελούν μια βασική ομάδα. Από τα 1.677 μέλη του LinkedIn της OpenAI, τα 23 σπούδασαν στο Πανεπιστήμιο Tsinghua.

Ωστόσο, ακόμη και με αρκετό ταλέντο, οι ειδικοί αμφισβητούν πόσο μακριά μπορεί να φτάσει η εγχώρια τεχνητή νοημοσύνη της Κίνας, ενώ αντιμετωπίζει τους υπάρχοντες περιορισμούς από τις εμπορικές εντάσεις μεταξύ ΗΠΑ και Κίνας.

Σε μια έκθεση, η Ping An Securities προειδοποίησε ότι οι συνεχιζόμενες προσπάθειες περιορισμού των εξαγωγών τσιπ από τις ΗΠΑ θα μπορούσαν να επιταχύνουν την ωρίμανση της βιομηχανίας τσιπ τεχνητής νοημοσύνης της Κίνας, αλλά «οι εγχώριες εναλλακτικές λύσεις ενδέχεται να μην ανταποκριθούν στις προσδοκίες».

Η Ουάσινγκτον έχει εμποδίσει τις κινεζικές εταιρείες να έχουν πρόσβαση στους πιο προηγμένους ημιαγωγούς στον κόσμο. Τον Οκτώβριο του 2023, οι ΗΠΑ αυστηροποίησαν εκ νέου τους κανονισμούς, εμποδίζοντας την πρόσβαση στην ηπειρωτική χώρα σε GPU που η Nvidia είχε σχεδιάσει ειδικά για Κινέζους πελάτες, ώστε να αποφύγει προηγούμενους περιορισμούς.

Ο Alexander Harrowell, αναλυτής προηγμένων υπολογιστών στον όμιλο τεχνολογικής έρευνας και συμβούλων Omdia, σημειώνει ότι η Κίνα έχει επιλογές εκτός από τις GPU για την εκπαίδευση LLM, όπως η TPU της Google, η Ascend της Huawei, η Trainium της AWS ή μία από τις προσφορές μιας σειράς νεοσύστατων επιχειρήσεων. Ωστόσο, θα απαιτηθεί περισσότερη προσπάθεια στην ανάπτυξη λογισμικού και τη διαχείριση συστημάτων.

Η κινεζική αγορά θα έχει ειδικές ευκαιρίες, σύμφωνα με τον επιχειρηματία Xu, όταν δημοσιευτούν τεχνικές εκθέσεις για το Sora και το μοντέλο βίντεο ανοιχτού κώδικα. «Θα υπάρχει μια πλατφόρμα από την οποία θα μπορούν να μάθουν οι κινεζικές εταιρείες», είπε. Πρόσθεσε ότι τα τοπικά μοντέλα βίντεο υποστηρίζουν επίσης καλύτερα τα κινεζικά.

(Σύμφωνα με την SCMP)