Αυτό το νέο μοντέλο όχι μόνο αμφισβητεί την κυριαρχία των αμερικανικών γιγάντων, αλλά αναδιαμορφώνει και ολόκληρο το παιχνίδι με ανοιχτό κώδικα (Εικονογράφηση: DS).
Το μοντέλο έχει 685 δισεκατομμύρια παραμέτρους και κυκλοφορεί με άδεια ανοιχτού κώδικα. Τα αρχικά αποτελέσματα δοκιμών δείχνουν ότι η απόδοσή του είναι εφάμιλλη με ιδιόκτητα συστήματα από την OpenAI ή την Anthropic και ανοίγει μια νέα προσέγγιση στην ανάπτυξη και διανομή προηγμένων μοντέλων τεχνητής νοημοσύνης.
Απόδοση και κόστος
Λίγο μετά την κυκλοφορία του στην πλατφόρμα Hugging Face, το DeepSeek V3.1 σημείωσε βαθμολογία 71,6% στο τεστ προγραμματισμού Aider. Τεχνικά, το μοντέλο είναι ικανό να χειριστεί περιβάλλοντα έως και 128.000 διακριτικών (ισοδύναμα με ένα βιβλίο περίπου 400 σελίδων). Η αρχιτεκτονική παρουσιάζεται ως «υβριδική», ενσωματώνοντας λειτουργίες συνομιλίας, συλλογισμού και προγραμματισμού.
«Το DeepSeek V3.1 πέτυχε 71,6% στο Aider, περίπου 1% καλύτερο από το Claude Opus 4, ενώ κόστισε σημαντικά λιγότερο», δήλωσε ο ερευνητής Τεχνητής Νοημοσύνης Andrew Christianson στο κοινωνικό δίκτυο X.
Εκτιμάται ότι το μέσο κόστος για την ολοκλήρωση μιας εργασίας προγραμματισμού χρησιμοποιώντας την έκδοση V3.1 είναι περίπου 1,01 $, ενώ τα αντίστοιχα συστήματα μπορούν να κοστίσουν πιο κοντά στα 70 $.
Ορισμένοι προγραμματιστές κοινότητας σημείωσαν επίσης την παρουσία τεσσάρων «ειδικών διακριτικών» στην αρχιτεκτονική, τα οποία επιτρέπουν στο μοντέλο να ενσωματώνει αναζήτηση στο διαδίκτυο σε πραγματικό χρόνο και να χειρίζεται πολύπλοκες διαδικασίες εξαγωγής συμπερασμάτων.
Αυτή η διαφορά μεταφράζεται σε εξοικονόμηση εκατομμυρίων δολαρίων για τις επιχειρήσεις που χειρίζονται χιλιάδες αλληλεπιδράσεις με τεχνητή νοημοσύνη καθημερινά.
Πλεονεκτήματα που αλλάζουν τα δεδομένα
Η κυκλοφορία της έκδοσης V3.1 έρχεται λίγες εβδομάδες αφότου οι OpenAI και Anthropic ανακοίνωσαν νέα μοντέλα. Επιλέγοντας μια προσέγγιση ανοιχτού κώδικα, η DeepSeek ακολουθεί διαφορετική στρατηγική από πολλές αμερικανικές εταιρείες που εμπορευματοποιούν μοντέλα AI μέσω επί πληρωμή API.
Κάποιοι υποστηρίζουν ότι η ευρεία διάθεση προηγμένων δυνατοτήτων θα μπορούσε να επιτρέψει σε οργανισμούς και επιχειρήσεις να αναπτύξουν ταχύτερα, ενώ παράλληλα θα αμφισβητούσε επιχειρηματικά μοντέλα που βασίζονται σε τεχνολογικά μονοπώλια.
Η εμφάνιση του DeepSeek V3.1 δείχνει ότι η προηγμένη Τεχνητή Νοημοσύνη δεν είναι μόνο τομέας μεγάλων εταιρειών, αλλά και μικρότερων ερευνητικών ομάδων.
Ο ανταγωνισμός σε αυτόν τον χώρο δεν περιορίζεται πλέον στην κατασκευή του πιο ισχυρού συστήματος, αλλά περιστρέφεται και γύρω από το να καταστεί η τεχνολογία προσβάσιμη και οικονομικά προσιτή.
Σε αυτό το πλαίσιο, το ερώτημα για τις εταιρείες τεχνολογίας είναι πώς να διατηρήσουν την εμπορική τους αξία όταν εμφανίζονται όλο και περισσότερα μοντέλα ανοιχτού κώδικα με ανταγωνιστική απόδοση και κόστος.
Πηγή: https://dantri.com.vn/cong-nghe/deepseek-am-tham-ra-phien-ban-ai-moi-20250820121017977.htm






Σχόλιο (0)