Οι εταιρείες της ηπειρωτικής Κίνας μειώνουν το κόστος κατασκευάζοντας μοντέλα που έχουν εκπαιδευτεί σε μικρότερες ποσότητες δεδομένων, απαιτώντας λιγότερη υπολογιστική ισχύ αλλά βελτιστοποιημένο υλικό, δήλωσε ο Lee Kai-Fu, ιδρυτής της 01.ai και πρώην επικεφαλής της Google China.

Σύμφωνα με τις κατατάξεις που ανακοινώθηκαν πρόσφατα από το UC Berkeley SkyLab και το LMSYS, το μοντέλο Yi-Lingtning της νεοσύστατης επιχείρησης 01.ai κατατάχθηκε τρίτο, ισόβαθμο με το Grok-2 του x.AI, πίσω από το OpenAI και την Google. Αυτή η κατάταξη βασίζεται στις βαθμολογίες των χρηστών για τις απαντήσεις σε ερωτήματα.

2d82e5b153faa85bf01e3f82affa4e298ec4f24e.avif.jpg
Η μείωση του κόστους των λειτουργιών τεχνητής νοημοσύνης είναι ένας τρόπος για να ανταγωνιστεί η Κίνα τις ΗΠΑ. Φωτογραφία: FT

Οι 01.ai και DeepSeek είναι εταιρείες τεχνητής νοημοσύνης στην ηπειρωτική χώρα που υιοθετούν μια στρατηγική εστίασης σε μικρότερα σύνολα δεδομένων για την εκπαίδευση μοντέλων, ενώ παράλληλα προσλαμβάνουν φθηνό, άκρως εξειδικευμένο εργατικό δυναμικό.

Η FT ανέφερε ότι το κόστος συμπερασμάτων του Yi-Lightning είναι 14 σεντς ανά εκατομμύριο tokens, σε σύγκριση με 26 σεντς για το GPT o1-mini της OpenAI. Εν τω μεταξύ, το GPT 4o κοστίζει έως και 4,40 δολάρια ανά εκατομμύριο tokens. Ο αριθμός των tokens που χρησιμοποιούνται για τη δημιουργία μιας απάντησης εξαρτάται από την πολυπλοκότητα κάθε ερωτήματος.

Οι ιδρυτές της Yi-Lightning αποκάλυψαν ότι η εταιρεία δαπάνησε 3 εκατομμύρια δολάρια σε «αρχική εκπαίδευση», πριν από την τελειοποίηση για διαφορετικές περιπτώσεις χρήσης. Ο Lee είπε ότι ο στόχος τους δεν ήταν «να δημιουργήσουν το καλύτερο μοντέλο», αλλά να κατασκευάσουν ένα ανταγωνιστικό μοντέλο που θα ήταν «5-10 φορές φθηνότερο».

Η μέθοδος που έχουν εφαρμόσει οι 01.ai, DeepSeek, MiniMax και Stepfun ονομάζεται «μοντελοποίηση ειδικών» - που σημαίνει απλώς τον συνδυασμό πολλαπλών νευρωνικών δικτύων που έχουν εκπαιδευτεί σε σύνολα δεδομένων ειδικά για κάθε τομέα.

Οι ερευνητές θεωρούν αυτήν την προσέγγιση ως έναν βασικό τρόπο για να επιτευχθεί το ίδιο επίπεδο νοημοσύνης με τα μοντέλα μεγάλων δεδομένων, αλλά με λιγότερη υπολογιστική ισχύ. Ωστόσο, η δυσκολία με την προσέγγιση έγκειται στο ότι οι μηχανικοί πρέπει να ενορχηστρώσουν τη διαδικασία εκπαίδευσης με «πολλαπλούς ειδικούς» αντί για ένα μόνο γενικό μοντέλο.

Λόγω δυσκολιών στην πρόσβαση σε τσιπ τεχνητής νοημοσύνης υψηλής τεχνολογίας, οι κινεζικές εταιρείες έχουν στραφεί στην ανάπτυξη συνόλων δεδομένων υψηλής ποιότητας, τα οποία μπορούν να χρησιμοποιηθούν για την εκπαίδευση μοντέλων εμπειρογνωμόνων, ανταγωνιζόμενες έτσι τους δυτικούς ανταγωνιστές.

Ο Λι είπε ότι το 01.ai διαθέτει μη παραδοσιακούς τρόπους συλλογής δεδομένων, όπως η σάρωση βιβλίων ή η συλλογή άρθρων στην εφαρμογή ανταλλαγής μηνυμάτων WeChat, τα οποία δεν είναι προσβάσιμα στον ανοιχτό ιστότοπο.

Ο ιδρυτής πιστεύει ότι η Κίνα βρίσκεται σε καλύτερη θέση από τις ΗΠΑ, με την τεράστια δεξαμενή φθηνού τεχνικού ταλέντου που διαθέτει.

(Σύμφωνα με FT, Bloomberg)

Η Meta λανσάρει μοντέλο τεχνητής νοημοσύνης «αυτοδιδασκαλίας» . Ο γίγαντας των μέσων κοινωνικής δικτύωσης Meta μόλις ανακοίνωσε ένα νέο μοντέλο τεχνητής νοημοσύνης με λειτουργία αυτοδιδασκαλίας (STE), η οποία μπορεί να περιορίσει την ανθρώπινη παρέμβαση στη διαδικασία ανάπτυξης της τεχνητής νοημοσύνης.