Vietnam.vn - Nền tảng quảng bá Việt Nam

Το DeepSeek Ξανασπάει

Η DeepSeek ανακοίνωσε το μοντέλο DeepSeek-OCR, το οποίο χρησιμοποιεί την οπτική αντίληψη ως μέσο συμπίεσης για την επεξεργασία μεγάλων εγγράφων με έως και 20 φορές λιγότερα tokens από τις παραδοσιακές μεθόδους.

ZNewsZNews23/10/2025

Η DeepSeek κυκλοφόρησε ένα νέο μοντέλο τεχνητής νοημοσύνης ικανό να επεξεργάζεται έγγραφα με 7-20 φορές λιγότερα tokens από τις παραδοσιακές μεθόδους. Φωτογραφία: The Verge .

Σύμφωνα με το SCMP , η DeepSeek κυκλοφόρησε ένα νέο μοντέλο πολυτροπικής τεχνητής νοημοσύνης (AI) ικανό να επεξεργάζεται μεγάλα και σύνθετα έγγραφα με σημαντικά λιγότερα tokens—7-20 φορές λιγότερα—από τις παραδοσιακές μεθόδους επεξεργασίας κειμένου.

Τα διακριτικά (tokens) είναι οι μικρότερες μονάδες κειμένου που επεξεργάζεται η Τεχνητή Νοημοσύνη. Η μείωση του αριθμού των διακριτικών (tokens) σημαίνει εξοικονόμηση υπολογιστικού κόστους και αύξηση της αποτελεσματικότητας ενός μοντέλου Τεχνητής Νοημοσύνης.

Για να επιτευχθεί αυτό, το μοντέλο DeepSeek-OCR (οπτική αναγνώριση χαρακτήρων) χρησιμοποίησε την οπτική αντίληψη ως μέσο συμπίεσης πληροφοριών. Αυτή η προσέγγιση επιτρέπει σε μεγάλα γλωσσικά μοντέλα να επεξεργάζονται τεράστιους όγκους κειμένου χωρίς να επιβαρύνονται με αναλογικά αυξανόμενο υπολογιστικό κόστος.

«Μέσω του DeepSeek-OCR, έχουμε καταδείξει ότι η χρήση της οπτικής αντίληψης για τη συμπίεση πληροφοριών μπορεί να επιτύχει σημαντικές μειώσεις στα tokens — από 7 έως 20 φορές για διαφορετικά ιστορικά στάδια — προσφέροντας μια πολλά υποσχόμενη κατεύθυνση», δήλωσε το DeepSeek.

Σύμφωνα με την ανάρτηση στο ιστολόγιο της εταιρείας, το DeepSeek-OCR αποτελείται από δύο κύρια στοιχεία: το DeepEncoder και το DeepSeek3B-MoE-A570M, το οποίο λειτουργεί ως αποκωδικοποιητής.

Σε αυτό το μοντέλο, το DeepEncoder λειτουργεί ως το βασικό εργαλείο, βοηθώντας στη διατήρηση χαμηλών επιπέδων ενεργοποίησης σε είσοδο υψηλής ανάλυσης, επιτυγχάνοντας παράλληλα ισχυρούς λόγους συμπίεσης για τη μείωση του αριθμού των tokens.

Στη συνέχεια, ο αποκωδικοποιητής είναι ένα μοντέλο Μείγματος Εμπειρογνωμόνων (MoE) με 570 εκατομμύρια παραμέτρους, με στόχο την ανακατασκευή του αρχικού κειμένου. Η αρχιτεκτονική MoE διαιρεί το μοντέλο σε υποδίκτυα που ειδικεύονται στην επεξεργασία ενός υποσυνόλου των δεδομένων εισόδου, βελτιστοποιώντας την απόδοση χωρίς να ενεργοποιούν ολόκληρο το μοντέλο.

Στο OmniDocBench, ένα σημείο αναφοράς για την αναγνωσιμότητα εγγράφων, το DeepSeek-OCR ξεπερνά σε απόδοση τα κύρια μοντέλα OCR όπως το GOT-OCR 2.0 και το MinerU 2.0, ενώ χρησιμοποιεί σημαντικά λιγότερα tokens.

Πηγή: https://znews.vn/deepseek-lai-co-dot-pha-post1595902.html


Σχόλιο (0)

Αφήστε ένα σχόλιο για να μοιραστείτε τα συναισθήματά σας!

Στην ίδια κατηγορία

Χριστουγεννιάτικος χώρος ψυχαγωγίας που προκαλεί αναστάτωση στους νέους στην πόλη Χο Τσι Μινχ με ένα πεύκο 7 μέτρων
Τι υπάρχει στο σοκάκι των 100 μέτρων που προκαλεί σάλο τα Χριστούγεννα;
Συγκλονισμένος από τον σούπερ γάμο που πραγματοποιήθηκε για 7 ημέρες και νύχτες στο Φου Κουόκ
Παρέλαση Αρχαίων Κοστουμιών: Χαρά Εκατό Λουλούδια

Από τον ίδιο συγγραφέα

Κληρονομία

Εικόνα

Επιχείρηση

Ντον Ντεν – Το νέο «μπαλκόνι του ουρανού» του Τάι Νγκουγιέν προσελκύει νεαρούς κυνηγούς νεφών

Τρέχοντα γεγονότα

Πολιτικό Σύστημα

Τοπικός

Προϊόν