Vietnam.vn - Nền tảng quảng bá Việt Nam

Το DeepSeek εκθρονίστηκε

Το μοντέλο τεχνητής νοημοσύνης της Alibaba, που ονομάζεται Qwen3, πέρασε το R1 στις δοκιμές LiveBench που αξιολογούν τις δυνατότητες μοντέλων ανοιχτού κώδικα, συμπεριλαμβανομένου του προγραμματισμού, των μαθηματικών και της ανάλυσης δεδομένων.

ZNewsZNews06/05/2025

Qwen3, μια νέα τεχνολογία που λάνσαρε η Alibaba. Φωτογραφία: SCMP .

Σύμφωνα με τις τελευταίες δοκιμές συγκριτικής αξιολόγησης στον κόσμο της Τεχνητής Νοημοσύνης, το πρόσφατα κυκλοφορήσαν μοντέλο τεχνητής νοημοσύνης Qwen3 της Alibaba ξεπέρασε το R1 της DeepSeek και έγινε το μοντέλο ανοιχτού κώδικα με την υψηλότερη κατάταξη στον κόσμο .

Συγκεκριμένα, δεδομένα από το LiveBench, μια ανεξάρτητη πλατφόρμα που αξιολογεί μεγάλα γλωσσικά μοντέλα (LLM), την τεχνολογία που υποστηρίζει υπηρεσίες γενετικής τεχνητής νοημοσύνης όπως το ChatGPT, δείχνουν ότι το Qwen3 ξεπέρασε το R1 στις δοκιμές.

Η ανασκόπηση των δυνατοτήτων των μοντέλων τεχνητής νοημοσύνης ανοιχτού κώδικα περιλαμβάνει τον προγραμματισμό, τα μαθηματικά, την ανάλυση δεδομένων και τη διδασκαλία γλωσσών.

Η σειρά μοντέλων τεχνητής νοημοσύνης που ονομάζεται Qwen3 κυκλοφόρησε από την Alibaba στις 28 Απριλίου. Η εταιρεία ισχυρίζεται ότι αυτό το chatbot μπορεί να είναι συγκρίσιμο, ακόμη και να ξεπεράσει, τα καλύτερα μοντέλα που διατίθενται αυτήν τη στιγμή από την OpenAI ή την Google σε ορισμένες περιπτώσεις.

Με μέγεθος έως και 235 δισεκατομμύρια παραμέτρους, το Qwen3 είναι εφάμιλλο με το DeepSeek-V2 και το OpenAI GPT-4, τα οποία έχουν περίπου 236 δισεκατομμύρια και 175 δισεκατομμύρια παραμέτρους αντίστοιχα. Οι χρήστες σύντομα θα μπορούν να το κατεβάσουν με ανοιχτή άδεια χρήσης στην πλατφόρμα ανάπτυξης τεχνητής νοημοσύνης Hugging Face και στο Github, μόλις κυκλοφορήσει η σειρά μοντέλων.

Η εταιρεία αναφέρει ότι η συλλογή Qwen3 περιλαμβάνει υβριδικά μοντέλα, που σημαίνει ότι μπορούν να αξιοποιήσουν τον χρόνο τους για να λύσουν σύνθετα προβλήματα ή να ανταποκριθούν γρήγορα σε απλά αιτήματα. Σε αυτήν την περίπτωση, η εξαγωγή συμπερασμάτων επιτρέπει στο μοντέλο να ελέγχει μόνο του την ακρίβεια των πληροφοριών, αλλά παρουσιάζει υψηλή καθυστέρηση.

Αυτός ο σχεδιασμός διευκολύνει τους χρήστες να διαθέσουν τον κατάλληλο προϋπολογισμό για κάθε συγκεκριμένη εργασία. Επιπλέον, αυτό το μοντέλο μαθαίνει από πολλούς ανταγωνιστές σε όλο τον κόσμο.

Χρησιμοποιώντας μια αρχιτεκτονική «μείγματος ειδικών» (MoE) παρόμοια με το DeepSeek, το Qwen3 μπορεί να μεγιστοποιήσει την υπολογιστική απόδοση με ένα κλάσμα του κόστους εκπαίδευσης. Πρόκειται για μια προσέγγιση που αναλύει μια εργασία σε ξεχωριστά μέρη και συνιστά μόνο αρκετά βαθιά δεδομένα για την εκτέλεση.

Σύμφωνα με την ομάδα ανάπτυξης, το Qwen3 υποστηρίζει έως και 119 γλώσσες και εκπαιδεύεται σε ένα σύνολο δεδομένων σχεδόν 36.000 δισεκατομμυρίων tokens, που ισοδυναμούν με 27.000 δισεκατομμύρια λέξεις. Τα δεδομένα εκπαίδευσης προέρχονται από πολλές πηγές, όπως εγχειρίδια, σύνολα ερωτήσεων-απαντήσεων, κώδικα προγραμματισμού ή αυτοδημιουργούμενη τεχνητή νοημοσύνη,...

Παρά το γεγονός ότι βρίσκεται στην κορυφή της κατάταξης των μοντέλων τεχνητής νοημοσύνης ανοιχτού κώδικα, οι εκτεταμένες δοκιμές από το LiveBench δείχνουν ότι το Qwen3 υστερεί σε σχέση με τα κορυφαία μοντέλα τεχνητής νοημοσύνης κλειστού κώδικα στον κόσμο, ιδίως το o3 της OpenAI, το Gemini Pro 2.5 της Google και το Claude 3.7 της Anthropic.

Αυτή τη στιγμή, το κορυφαίο μοντέλο της OpenAI, o3-mini high, που υποστηρίζεται από τη Microsoft, βρίσκεται στην κορυφή της συνολικής κατάταξης μοντέλων Τεχνητής Νοημοσύνης στον κόσμο.

Πηγή: https://znews.vn/deepseek-bi-soan-ngoi-post1551500.html


Σχόλιο (0)

Αφήστε ένα σχόλιο για να μοιραστείτε τα συναισθήματά σας!

Στην ίδια κατηγορία

Ο καθεδρικός ναός της Παναγίας των Παρισίων στην πόλη Χο Τσι Μινχ φωτίστηκε έντονα για να υποδεχτεί τα Χριστούγεννα του 2025
Τα κορίτσια του Ανόι «ντύνονται» όμορφα για την περίοδο των Χριστουγέννων
Λαμπερό μετά την καταιγίδα και την πλημμύρα, το χωριό χρυσάνθεμων Τετ στο Τζία Λάι ελπίζει ότι δεν θα υπάρξουν διακοπές ρεύματος για να σωθούν τα φυτά.
Η πρωτεύουσα του κίτρινου βερίκοκου στην κεντρική περιοχή υπέστη σοβαρές απώλειες μετά από διπλές φυσικές καταστροφές

Από τον ίδιο συγγραφέα

Κληρονομία

Εικόνα

Επιχείρηση

Καφετέρια στο Νταλάτ βλέπει αύξηση 300% στους πελάτες επειδή ο ιδιοκτήτης υποδύεται ρόλο σε «ταινία πολεμικών τεχνών»

Τρέχοντα γεγονότα

Πολιτικό Σύστημα

Τοπικός

Προϊόν

Footer Banner Agribank
Footer Banner LPBank
Footer Banner MBBank
Footer Banner VNVC
Footer Banner Agribank
Footer Banner LPBank
Footer Banner MBBank
Footer Banner VNVC
Footer Banner Agribank
Footer Banner LPBank
Footer Banner MBBank
Footer Banner VNVC
Footer Banner Agribank
Footer Banner LPBank
Footer Banner MBBank
Footer Banner VNVC