Η επίλυση σύνθετων προβλημάτων με φυσική γλώσσα, λύσεις και σαφή, συνεκτικά επιχειρήματα... δεν είναι εύκολη, ακόμη και για μαθητές που είναι καλοί στα μαθηματικά. Ωστόσο, η DeepSeek δημιούργησε ένα μοντέλο τεχνητής νοημοσύνης, το DeepSeekMath-V2, το οποίο είναι ικανό να το κάνει αυτό.

Το DeepSeek εντυπωσίασε όταν δημιούργησε ένα μοντέλο τεχνητής νοημοσύνης ικανό να λύσει προβλήματα σε διεθνές επίπεδο εξετάσεων (Εικονογράφηση: Τεχνητή Νοημοσύνη).
Στις αξιολογήσεις, το DeepSeekMath-V2 πέτυχε βαθμολογίες επιπέδου χρυσού μεταλλίου στην επίλυση προβλημάτων στη Διεθνή Μαθηματική Ολυμπιάδα (IMO) του 2025 και στην Κινεζική Μαθηματική Ολυμπιάδα (CMO) του 2024.
Κατά τη συμμετοχή του στο τεστ IMO-ProofBench για την αξιολόγηση των μαθηματικών δυνατοτήτων ερμηνείας και συλλογισμού των μοντέλων τεχνητής νοημοσύνης, το DeepSeekMath-V2 της DeepSeek πέτυχε εξαιρετικές βαθμολογίες σε σύγκριση με άλλα μοντέλα τεχνητής νοημοσύνης, όπως το DeepMind της Google, το Grok της xAI ή το GPT-5 της OpenAI...
Αξίζει να σημειωθεί ότι το μοντέλο τεχνητής νοημοσύνης του DeepSeek σημείωσε επίσης βαθμολογία 118/120 κατά την επίλυση του Μαθηματικού Διαγωνισμού Putnam το 2024, ενώ το άτομο με την υψηλότερη κατάταξη σε αυτόν τον διαγωνισμό σημείωσε μόνο 90. Ο Διαγωνισμός Putnam θεωρείται ο πιο δύσκολος και αναγνωρισμένος μαθηματικός διαγωνισμός στον κόσμο για φοιτητές, και πραγματοποιείται κάθε Δεκέμβριο.
Πολλά προβλήματα σε διεθνείς διαγωνισμούς μερικές φορές δεν απαιτούν ακριβή αριθμητική απάντηση, αλλά η βαθμολογία βασίζεται στη συλλογιστική που χρησιμοποιείται για την εξεύρεση της λύσης. Ωστόσο, το DeepSeekMath-V2 εξακολουθεί να δείχνει την ικανότητα να συλλογίζεται με ακρίβεια στη φυσική γλώσσα όπως οι άνθρωποι, βοηθώντας αυτό το μοντέλο τεχνητής νοημοσύνης να επιτύχει υψηλή βαθμολογία.
Η DeepSeek αναφέρει ότι για να βοηθήσει το μοντέλο τεχνητής νοημοσύνης της να βρει ακριβείς απαντήσεις και ισχυρά επιχειρήματα, δημιούργησε δύο μεγάλα γλωσσικά μοντέλα και τα αντιμετώπισε το ένα εναντίον του άλλου. Το ένα μοντέλο λειτουργεί ως «αποδεικτικό στοιχείο» για τη δημιουργία μαθηματικών επιχειρημάτων και αποδείξεων, ενώ το άλλο μοντέλο λειτουργεί ως «κριτής» για τον έλεγχο των επιχειρημάτων που παρουσιάζονται.
Αυτός ο τρόπος εργασίας βοηθά στην εξάλειψη αδύναμων υποθέσεων και επιχειρημάτων, εστιάζοντας στη βελτιστοποίηση της λύσης για την εύρεση της σωστής απάντησης και στη διεξαγωγή ενδελεχούς επιχειρηματολογίας.
Το DeepSeekMath-V2 έχει αναπτυχθεί ως ανοιχτού κώδικα, επιτρέποντας στην κοινότητα να τροποποιήσει τον πηγαίο κώδικα και να τον χρησιμοποιήσει για διάφορους σκοπούς.
Η DeepSeek αναφέρει ότι οι σημαντικές ανακαλύψεις που επιτεύχθηκαν με το DeepSeekMath-V2 θα θέσουν τα θεμέλια για την κατασκευή πιο ισχυρών και αξιόπιστων μαθηματικών συστημάτων τεχνητής νοημοσύνης.
Η DeepSeek είναι μια κινεζική εταιρεία τεχνολογίας που έκανε αίσθηση παγκοσμίως όταν λάνσαρε το μοντέλο AI R1 στα τέλη Ιανουαρίου, παρέχοντας γρήγορη και ακριβή ταχύτητα απόκρισης.
Το αποκορύφωμα του R1 είναι ότι η DeepSeek δαπάνησε μόνο περίπου 6,5 εκατομμύρια δολάρια ΗΠΑ για την ανάπτυξη και την εκπαίδευση αυτού του μοντέλου τεχνητής νοημοσύνης, αντί να χρειαστεί να ξοδέψει δισεκατομμύρια δολάρια ΗΠΑ όπως οι αμερικανικές εταιρείες τεχνολογίας για να εκπαιδεύσουν και να λειτουργήσουν τα δικά τους μοντέλα τεχνητής νοημοσύνης.
Επιπλέον, το R1 αναπτύχθηκε και λειτούργησε από την DeepSeek με βάση τσιπ τεχνητής νοημοσύνης παλιάς γενιάς, επειδή οι κινεζικές εταιρείες που βρίσκονται υπό εμπάργκο από την κυβέρνηση των ΗΠΑ δεν μπορούν να παραγγείλουν τσιπ τεχνητής νοημοσύνης υψηλής τεχνολογίας. Ωστόσο, το R1 εξακολουθεί να παρουσιάζει εντυπωσιακή ικανότητα επεξεργασίας και ταχύτητα απόκρισης στα αιτήματα των χρηστών.
Η εμφάνιση του DeepSeek έχει οδηγήσει τις ΗΠΑ στην απώλεια του μονοπωλίου τους στον αγώνα για την ανάπτυξη μοντέλων Τεχνητής Νοημοσύνης και ταυτόχρονα έχει ανοίξει έναν νέο αγώνα δρόμου. Αντί να επικεντρώνονται μόνο στην ευφυΐα και τις δυνατότητες επεξεργασίας, οι εταιρείες τεχνολογίας έχουν αρχίσει να δίνουν μεγαλύτερη προσοχή στο πρόβλημα της οικονομικής αποδοτικότητας στη διαδικασία ανάπτυξης μοντέλων Τεχνητής Νοημοσύνης.
Πηγή: https://dantri.com.vn/cong-nghe/deepseek-ra-mat-cong-cu-ai-co-kha-nang-gianh-hcv-ky-thi-toan-quoc-te-20251130154751624.htm






Σχόλιο (0)