Οι τεχνολογικοί γίγαντες Alibaba, Baidu και ByteDance αγωνίζονται να μειώσουν το κόστος της τεχνητής νοημοσύνης «συμπερασμάτων», προσφέροντας τιμές που είναι 90% χαμηλότερες από αυτές που προσφέρουν οι αντίστοιχοι των ΗΠΑ.
Οι εταιρείες της ηπειρωτικής Κίνας μειώνουν το κόστος κατασκευάζοντας μοντέλα που έχουν εκπαιδευτεί σε μικρότερες ποσότητες δεδομένων, απαιτώντας λιγότερη υπολογιστική ισχύ αλλά βελτιστοποιημένο υλικό, δήλωσε ο Lee Kai-Fu, ιδρυτής της 01.ai και πρώην επικεφαλής της Google China.
Σύμφωνα με τις κατατάξεις που ανακοινώθηκαν πρόσφατα από το UC Berkeley SkyLab και το LMSYS, το μοντέλο Yi-Lingtning της νεοσύστατης επιχείρησης 01.ai κατατάχθηκε τρίτο, ισόβαθμο με το Grok-2 του x.AI, πίσω από το OpenAI και την Google. Αυτή η κατάταξη βασίζεται στις βαθμολογίες των χρηστών για τις απαντήσεις σε ερωτήματα.
Οι 01.ai και DeepSeek είναι εταιρείες τεχνητής νοημοσύνης στην ηπειρωτική χώρα που υιοθετούν μια στρατηγική εστίασης σε μικρότερα σύνολα δεδομένων για την εκπαίδευση μοντέλων, ενώ παράλληλα προσλαμβάνουν φθηνό, άκρως εξειδικευμένο εργατικό δυναμικό.
Η FT ανέφερε ότι το κόστος συμπερασμάτων του Yi-Lightning είναι 14 σεντς ανά εκατομμύριο tokens, σε σύγκριση με 26 σεντς για το GPT o1-mini της OpenAI. Εν τω μεταξύ, το GPT 4o κοστίζει έως και 4,40 δολάρια ανά εκατομμύριο tokens. Ο αριθμός των tokens που χρησιμοποιούνται για τη δημιουργία μιας απάντησης εξαρτάται από την πολυπλοκότητα κάθε ερωτήματος.
Οι ιδρυτές της Yi-Lightning αποκάλυψαν ότι η εταιρεία δαπάνησε 3 εκατομμύρια δολάρια σε «αρχική εκπαίδευση», πριν από την τελειοποίηση για διαφορετικές περιπτώσεις χρήσης. Ο Lee είπε ότι ο στόχος τους δεν ήταν «να δημιουργήσουν το καλύτερο μοντέλο», αλλά να κατασκευάσουν ένα ανταγωνιστικό μοντέλο που θα ήταν «5-10 φορές φθηνότερο».
Η μέθοδος που έχουν εφαρμόσει οι 01.ai, DeepSeek, MiniMax και Stepfun ονομάζεται «μοντελοποίηση ειδικών» - που σημαίνει απλώς τον συνδυασμό πολλαπλών νευρωνικών δικτύων που έχουν εκπαιδευτεί σε σύνολα δεδομένων ειδικά για κάθε τομέα.
Οι ερευνητές θεωρούν αυτήν την προσέγγιση ως έναν βασικό τρόπο για να επιτευχθεί το ίδιο επίπεδο νοημοσύνης με τα μοντέλα μεγάλων δεδομένων, αλλά με λιγότερη υπολογιστική ισχύ. Ωστόσο, η δυσκολία με την προσέγγιση έγκειται στο ότι οι μηχανικοί πρέπει να ενορχηστρώσουν τη διαδικασία εκπαίδευσης με «πολλαπλούς ειδικούς» αντί για ένα μόνο γενικό μοντέλο.
Λόγω δυσκολιών στην πρόσβαση σε τσιπ τεχνητής νοημοσύνης υψηλής τεχνολογίας, οι κινεζικές εταιρείες έχουν στραφεί στην ανάπτυξη συνόλων δεδομένων υψηλής ποιότητας, τα οποία μπορούν να χρησιμοποιηθούν για την εκπαίδευση μοντέλων εμπειρογνωμόνων, ανταγωνιζόμενες έτσι τους δυτικούς ανταγωνιστές.
Ο Λι είπε ότι το 01.ai διαθέτει μη παραδοσιακούς τρόπους συλλογής δεδομένων, όπως η σάρωση βιβλίων ή η συλλογή άρθρων στην εφαρμογή ανταλλαγής μηνυμάτων WeChat, τα οποία δεν είναι προσβάσιμα στον ανοιχτό ιστότοπο.
Ο ιδρυτής πιστεύει ότι η Κίνα βρίσκεται σε καλύτερη θέση από τις ΗΠΑ, με την τεράστια δεξαμενή φθηνού τεχνικού ταλέντου που διαθέτει.
(Σύμφωνα με FT, Bloomberg)
[διαφήμιση_2]
Πηγή: https://vietnamnet.vn/trung-quoc-giam-90-chi-phi-ai-suy-luan-so-voi-my-2334520.html
Σχόλιο (0)