Vietnam.vn - Nền tảng quảng bá Việt Nam

Το DeepSeek Ξανασπάει

Η DeepSeek ανακοινώνει το μοντέλο DeepSeek-OCR που χρησιμοποιεί την οπτική αντίληψη ως μέσο συμπίεσης για την επεξεργασία μεγάλων εγγράφων με 20 φορές λιγότερα tokens από τις παραδοσιακές μεθόδους.

ZNewsZNews23/10/2025

Το DeepSeek κυκλοφορεί νέο μοντέλο τεχνητής νοημοσύνης που μπορεί να επεξεργάζεται έγγραφα με 7-20 φορές λιγότερα tokens από τις παραδοσιακές μεθόδους. Φωτογραφία: The Verge .

Σύμφωνα με το SCMP , η DeepSeek κυκλοφόρησε ένα νέο μοντέλο πολυτροπικής τεχνητής νοημοσύνης (AI) που είναι ικανό να επεξεργάζεται μεγάλα και σύνθετα έγγραφα με σημαντικά μικρότερο αριθμό tokens, 7-20 φορές λιγότερο από τις παραδοσιακές μεθόδους επεξεργασίας κειμένου.

Τα διακριτικά (tokens) είναι οι μικρότερες μονάδες κειμένου που επεξεργάζεται η Τεχνητή Νοημοσύνη. Η μείωση του αριθμού των διακριτικών (tokens) σημαίνει εξοικονόμηση υπολογιστικού κόστους και αύξηση της αποτελεσματικότητας ενός μοντέλου Τεχνητής Νοημοσύνης.

Για να επιτευχθεί αυτό, το μοντέλο DeepSeek-OCR (οπτική αναγνώριση χαρακτήρων) χρησιμοποίησε την οπτική αντίληψη ως μέσο συμπίεσης πληροφοριών. Αυτή η προσέγγιση επιτρέπει σε μεγάλα γλωσσικά μοντέλα να επεξεργάζονται τεράστιους όγκους κειμένου χωρίς να επιβαρύνονται με αναλογικά αυξημένο υπολογιστικό κόστος.

«Μέσω του DeepSeek-OCR, έχουμε καταδείξει ότι η χρήση της οπτικής αντίληψης για τη συμπίεση πληροφοριών μπορεί να επιτύχει σημαντικές μειώσεις στα tokens – από 7 έως 20 φορές για διαφορετικές ιστορικές περιόδους, παρέχοντας μια πολλά υποσχόμενη κατεύθυνση», δήλωσε η DeepSeek.

Σύμφωνα με την ανάρτηση στο ιστολόγιο της εταιρείας, το DeepSeek-OCR αποτελείται από δύο κύρια στοιχεία, το DeepEncoder και το DeepSeek3B-MoE-A570M, το οποίο λειτουργεί ως αποκωδικοποιητής.

Μεταξύ αυτών, το DeepEncoder λειτουργεί ως η βασική μηχανή του μοντέλου, βοηθώντας στη διατήρηση χαμηλών επιπέδων ενεργοποίησης υπό είσοδο υψηλής ανάλυσης, επιτυγχάνοντας παράλληλα ισχυρό λόγο συμπίεσης για τη μείωση του αριθμού των tokens.

Ο αποκωδικοποιητής είναι στη συνέχεια ένα μοντέλο Μείγματος Εμπειρογνωμόνων (MoE) 570 εκατομμυρίων παραμέτρων που έχει ως έργο την αναπαραγωγή του αρχικού κειμένου. Η αρχιτεκτονική MoE διαιρεί το μοντέλο σε υποδίκτυα που ειδικεύονται στην επεξεργασία ενός υποσυνόλου των δεδομένων εισόδου, βελτιστοποιώντας την απόδοση χωρίς να χρειάζεται να ενεργοποιηθεί ολόκληρο το μοντέλο.

Στο OmniDocBench, ένα σημείο αναφοράς αναγνωσιμότητας εγγράφων, το DeepSeek-OCR ξεπερνά σε απόδοση τα κύρια μοντέλα OCR όπως το GOT-OCR 2.0 και το MinerU 2.0, ενώ χρησιμοποιεί πολύ λιγότερα tokens.

Πηγή: https://znews.vn/deepseek-lai-co-dot-pha-post1595902.html


Σχόλιο (0)

No data
No data

Στην ίδια κατηγορία

Εκπληκτικά όμορφα χωράφια με αναβαθμίδες στην κοιλάδα Luc Hon
Τα «πλούσια» λουλούδια που κοστίζουν 1 εκατομμύριο VND το καθένα εξακολουθούν να είναι δημοφιλή στις 20 Οκτωβρίου.
Βιετναμέζικες ταινίες και το ταξίδι προς τα Όσκαρ
Οι νέοι πηγαίνουν στα βορειοδυτικά για να κάνουν check in κατά τη διάρκεια της πιο όμορφης εποχής του ρυζιού του χρόνου.

Από τον ίδιο συγγραφέα

Κληρονομία

Εικόνα

Επιχείρηση

Οι νέοι πηγαίνουν στα βορειοδυτικά για να κάνουν check in κατά τη διάρκεια της πιο όμορφης εποχής του ρυζιού του χρόνου.

Τρέχοντα γεγονότα

Πολιτικό Σύστημα

Τοπικός

Προϊόν