Σύμφωνα με την ανακοίνωση της Tencent στον επίσημο λογαριασμό της στο WeChat, το αναβαθμισμένο μοντέλο T1 προσφέρει ταχύτερους χρόνους απόκρισης και ανώτερο χειρισμό εγγράφων μεγάλου κειμένου.

Η Tencent παρουσίασε το μοντέλο συλλογισμού T1, το οποίο ξεπερνά το DeepSeek σε πολλά κριτήρια που σχετίζονται με τη γνώση και την ικανότητα συλλογισμού.
Η ανάρτηση ανέφερε ότι το T1 μπορεί να «διατηρεί τη λογική του περιεχομένου σαφή και το κείμενο καθαρό και τακτοποιημένο» και ότι το ποσοστό «παραισθήσεων» - το φαινόμενο όπου η Τεχνητή Νοημοσύνη παράγει ανακριβείς πληροφορίες - είναι «εξαιρετικά χαμηλό».
Η κυκλοφορία πραγματοποιήθηκε εν μέσω έντονου ανταγωνισμού στην κινεζική αγορά τεχνητής νοημοσύνης, ειδικά μετά την εισαγωγή μοντέλων από την DeepSeek με απόδοση συγκρίσιμη ή ανώτερη από τα δυτικά συστήματα, με σημαντικά χαμηλότερο κόστος.
Η Tencent είχε κυκλοφορήσει προηγουμένως μια δοκιμαστική έκδοση του T1 μέσω διαφόρων πλατφορμών, συμπεριλαμβανομένης της εφαρμογής βοηθού τεχνητής νοημοσύνης Yuanbao.
Η επίσημη έκδοση θα βασίζεται στο μοντέλο γλώσσας πλατφόρμας Turbo S της Tencent, το οποίο ανακοινώθηκε στα τέλη του περασμένου μήνα. Η εταιρεία ισχυρίζεται ότι το Turbo S επεξεργάζεται τα ερωτήματα πιο γρήγορα από το μοντέλο R1 του ανταγωνιστή DeepSeek.
Ένα διάγραμμα που δημοσιεύτηκε σε μια ανάρτηση που συγκρίνει το μοντέλο T1 με το DeepSeek R1 δείχνει ότι το προϊόν της Tencent υπερέχει σε διάφορες μετρήσεις που σχετίζονται με τη γνώση και την ικανότητα συλλογισμού.
Η Tencent έχει αυξήσει τις επενδύσεις της στην Τεχνητή Νοημοσύνη τους τελευταίους μήνες. Την Πέμπτη, η εταιρεία ανακοίνωσε σχέδια για αύξηση των κεφαλαιουχικών δαπανών το 2025, μετά από σημαντικές δαπάνες στην Τεχνητή Νοημοσύνη καθ' όλη τη διάρκεια του 2024.
Το T1 έχει επιτύχει υψηλές κατατάξεις σε πολλά βασικά σημεία αναφοράς τεχνητής νοημοσύνης. Αυτό το κατατάσσει ανάμεσα στα κορυφαία μοντέλα παγκοσμίως .
Πρόσφατες αξιολογήσεις δείχνουν ότι το T1 σημείωσε 87,2 βαθμούς στο MMLU-Pro, ένα σύνολο δεδομένων που αξιολογεί την ικανότητα θεμελιώδους συλλογισμού σε μεγάλα γλωσσικά μοντέλα. Αυτή η βαθμολογία είναι δεύτερη μόνο σε σχέση με το OpenAI o1.
Επιπλέον, το T1 έχει αποδώσει καλά σε δημόσια διαθέσιμα benchmarks όπως τα CEval, AIME και Zebra Logic. Αυτά τα benchmarks μετρούν γενικές γνώσεις και συλλογισμό τόσο στα κινέζικα όσο και στα αγγλικά.
Πηγή: https://www.baogiaothong.vn/tencent-trinh-lang-mo-hinh-suy-luan-t1-vuot-troi-so-voi-deepseek-192250322131611869.htm







Σχόλιο (0)