Το DeepSeek έχει εκθρονιστεί.

Το μοντέλο τεχνητής νοημοσύνης Qwen3 της Alibaba πέρασε με επιτυχία το R1 στις δοκιμές LiveBench, οι οποίες αξιολογούν τις δυνατότητες μοντέλων ανοιχτού κώδικα στον προγραμματισμό, τα μαθηματικά και την ανάλυση δεδομένων.

ZNews•06/05/2025

Qwen3, μια νέα τεχνολογία που λάνσαρε η Alibaba. Φωτογραφία: SCMP .

Σύμφωνα με τις τελευταίες δοκιμές benchmark τεχνητής νοημοσύνης, το πρόσφατα κυκλοφορήσαν μοντέλο τεχνητής νοημοσύνης Qwen3 της Alibaba ξεπέρασε το R1 της DeepSeek και έγινε το μοντέλο ανοιχτού κώδικα με την υψηλότερη βαθμολογία στον κόσμο .

Συγκεκριμένα, δεδομένα από το LiveBench, μια ανεξάρτητη πλατφόρμα που βαθμολογεί μεγάλα γλωσσικά μοντέλα (LLM), τη θεμελιώδη τεχνολογία για υπηρεσίες γενετικής τεχνητής νοημοσύνης όπως το ChatGPT, δείχνουν ότι το Qwen3 έχει ξεπεράσει το R1 στις δοκιμές.

Η αξιολόγηση των δυνατοτήτων των μοντέλων τεχνητής νοημοσύνης ανοιχτού κώδικα περιλαμβάνει τον προγραμματισμό, τα μαθηματικά, την ανάλυση δεδομένων και τη διδασκαλία γλωσσών.

Η Alibaba κυκλοφόρησε τη σειρά μοντέλων AI Qwen3 στις 28 Απριλίου. Η εταιρεία ισχυρίζεται ότι αυτό το chatbot μπορεί να ανταγωνιστεί, ή και να ξεπεράσει, τα καλύτερα τρέχοντα μοντέλα της OpenAI ή της Google σε ορισμένες περιπτώσεις.

Με μέγεθος έως και 235 δισεκατομμύρια παραμέτρους, το Qwen3 έχει απόδοση συγκρίσιμη με το DeepSeek-V2 και το OpenAI GPT-4, τα οποία έχουν περίπου 236 δισεκατομμύρια και 175 δισεκατομμύρια παραμέτρους αντίστοιχα. Οι χρήστες σύντομα θα μπορούν να το κατεβάσουν με ανοιχτή άδεια χρήσης στην πλατφόρμα ανάπτυξης τεχνητής νοημοσύνης Hugging Face και στο Github, μόλις κυκλοφορήσει αυτή η σειρά μοντέλων.

Η εταιρεία δήλωσε ότι η συλλογή Qwen3 περιλαμβάνει υβριδικά μοντέλα, που σημαίνει ότι μπορούν να διαθέσουν ευέλικτα χρόνο για συλλογισμό, ώστε να λύσουν σύνθετα προβλήματα ή να ανταποκριθούν γρήγορα σε απλά αιτήματα. Σε αυτό το μοντέλο, η δυνατότητα συλλογισμού επιτρέπει την αυτοεπαλήθευση της ακρίβειας των πληροφοριών, αλλά αυτό συνοδεύεται από σημαντική χρονική καθυστέρηση.

Αυτός ο σχεδιασμός διευκολύνει τους χρήστες να κατανέμουν κατάλληλα τον προϋπολογισμό σε κάθε συγκεκριμένη εργασία. Επιπλέον, αυτό το μοντέλο μαθαίνει επίσης από πολλούς ανταγωνιστές σε όλο τον κόσμο.

Χρησιμοποιώντας μια αρχιτεκτονική «μείγματος ειδικών» (MoE) παρόμοια με το DeepSeek, το Qwen3 μπορεί να βελτιστοποιήσει την υπολογιστική απόδοση χρησιμοποιώντας μόνο ένα κλάσμα του κόστους εκπαίδευσης. Αυτή η μέθοδος αναλύει τις εργασίες σε πολλά ξεχωριστά μέρη και απαιτεί μόνο επαρκή ποσότητα δεδομένων έντασης δεδομένων για την εκτέλεσή τους.

Σύμφωνα με την ομάδα ανάπτυξης, το Qwen3 υποστηρίζει έως και 119 γλώσσες και εκπαιδεύεται σε ένα σύνολο δεδομένων σχεδόν 36 τρισεκατομμυρίων διακριτικών (tokens), που ισοδυναμούν με 27 τρισεκατομμύρια λέξεις. Τα δεδομένα εκπαίδευσης προέρχονται από διάφορες πηγές, όπως σχολικά βιβλία, σύνολα ερωτήσεων-απαντήσεων, κώδικα προγραμματισμού ή ακόμα και δεδομένα που δημιουργούνται από τεχνητή νοημοσύνη, κ.λπ.

Παρά την κορυφή της κατάταξης των μοντέλων ανοιχτού κώδικα, η εκτεταμένη δοκιμή benchmark του LiveBench δείχνει ότι το Qwen3 εξακολουθεί να υστερεί σε σχέση με τα κορυφαία μοντέλα τεχνητής νοημοσύνης κλειστού κώδικα στον κόσμο. Τα πιο σημαντικά μεταξύ αυτών είναι το o3 της OpenAI, το Gemini Pro 2.5 της Google και το Claude 3.7 της Anthropic.

Προς το παρόν, το πιο προηγμένο μοντέλο OpenAI που υποστηρίζεται από τη Microsoft, το o3-mini high, βρίσκεται στην κορυφή της συνολικής κατάταξης των μοντέλων AI παγκοσμίως.

Πηγή: https://znews.vn/deepseek-bi-soan-ngoi-post1551500.html