Αυτό το νέο μοντέλο όχι μόνο αμφισβητεί την κυριαρχία των αμερικανικών γιγάντων, αλλά αναδιαμορφώνει και ολόκληρο το παιχνίδι με ανοιχτό κώδικα (Εικονογραφημένη εικόνα: DS).
Αυτό το μοντέλο έχει 685 δισεκατομμύρια παραμέτρους και κυκλοφορεί με άδεια ανοιχτού κώδικα. Τα αρχικά αποτελέσματα των δοκιμών δείχνουν απόδοση συγκρίσιμη με ιδιόκτητα συστήματα από το OpenAI ή το Anthropic και ανοίγει νέες προσεγγίσεις στην ανάπτυξη και διανομή προηγμένων μοντέλων τεχνητής νοημοσύνης.
Απόδοση και κόστος
Αμέσως μετά την κυκλοφορία του στην πλατφόρμα Hugging Face, το DeepSeek V3.1 πέτυχε βαθμολογία 71,6% στο τεστ προγραμματισμού Aider. Τεχνικά, το μοντέλο είναι ικανό να χειριστεί συμφραζόμενα με έως και 128.000 διακριτικά (ισοδύναμα με ένα βιβλίο 400 σελίδων). Η δομή παρουσιάζεται ως «υβρίδιο», ενσωματώνοντας λειτουργίες συνομιλίας, συμπερασμού και προγραμματισμού.
Ο ερευνητής τεχνητής νοημοσύνης Andrew Christianson δήλωσε στην πλατφόρμα κοινωνικής δικτύωσης X: «Το DeepSeek V3.1 πέτυχε 71,6% στο Aider, περίπου 1% υψηλότερο από το Claude Opus 4, ενώ κόστισε σημαντικά λιγότερο».
Σύμφωνα με υπολογισμούς, το μέσο κόστος για την ολοκλήρωση μιας εργασίας προγραμματισμού χρησιμοποιώντας την έκδοση V3.1 είναι περίπου 1,01 $, ενώ συγκρίσιμα συστήματα μπορούν να κοστίσουν σχεδόν 70 $.
Ορισμένοι προγραμματιστές κοινοτήτων έχουν επίσης παρατηρήσει την παρουσία τεσσάρων «ειδικών διακριτικών» στην αρχιτεκτονική, επιτρέποντας στο μοντέλο να ενσωματώνει αναζήτηση στο διαδίκτυο σε πραγματικό χρόνο και να χειρίζεται πολύπλοκες διαδικασίες εξαγωγής συμπερασμάτων.
Αυτή η διαφορά μεταφράζεται σε εξοικονόμηση εκατομμυρίων δολαρίων για τις επιχειρήσεις που χειρίζονται χιλιάδες αλληλεπιδράσεις με τεχνητή νοημοσύνη καθημερινά.
Πλεονέκτημα που αλλάζει τα δεδομένα
Η κυκλοφορία της έκδοσης V3.1 συνέπεσε με την ανακοίνωση νέων μοντέλων από την OpenAI και την Anthropic. Επιλέγοντας μια προσέγγιση ανοιχτού κώδικα, η DeepSeek ακολούθησε διαφορετική στρατηγική σε σύγκριση με πολλές αμερικανικές εταιρείες που εμπορευματοποιούν μοντέλα AI μέσω επί πληρωμή API.
Ορισμένοι υποστηρίζουν ότι η ευρεία διαθεσιμότητα προηγμένων δυνατοτήτων μπορεί να διευκολύνει την ταχύτερη ανάπτυξη από οργανισμούς και επιχειρήσεις, ενώ παράλληλα θέτει μια πρόκληση για τα επιχειρηματικά μοντέλα που βασίζονται σε τεχνολογικά μονοπώλια.
Η εμφάνιση του DeepSeek V3.1 δείχνει ότι η προηγμένη Τεχνητή Νοημοσύνη δεν απευθύνεται μόνο σε μεγάλες εταιρείες, αλλά μπορούν να συμμετάσχουν και μικρότερες ερευνητικές ομάδες.
Ο ανταγωνισμός σε αυτόν τον τομέα δεν περιορίζεται πλέον στην κατασκευή του πιο ισχυρού συστήματος, αλλά περιστρέφεται και γύρω από την ικανότητα να καταστεί η τεχνολογία προσβάσιμη και οικονομικά προσιτή.
Σε αυτό το πλαίσιο, το ερώτημα για τις εταιρείες τεχνολογίας είναι πώς να διατηρήσουν την εμπορική αξία τους, όταν αναδύονται όλο και περισσότερα μοντέλα ανοιχτού κώδικα με ανταγωνιστική απόδοση και κόστος.
Πηγή: https://dantri.com.vn/cong-nghe/deepseek-am-tham-ra-phien-ban-ai-moi-20250820121017977.htm






Σχόλιο (0)