Conform anunțului Tencent pe contul său oficial WeChat, modelul T1 actualizat oferă timpi de răspuns mai rapizi și o gestionare superioară a documentelor text lungi.

Tencent a dezvăluit modelul său de raționament T1, care depășește DeepSeek la mai multe criterii legate de cunoștințe și capacitatea de raționament.
Postarea afirma că T1 poate „menține logica conținutului clară și textul ordonat și curat” și că rata de „halucinații” - fenomenul în care inteligența artificială generează informații inexacte - este „extrem de scăzută”.
Lansarea a avut loc în contextul unei concurențe acerbe pe piața chineză a inteligenței artificiale, mai ales după ce DeepSeek a introdus modele cu performanțe comparabile sau superioare sistemelor occidentale, la costuri semnificativ mai mici.
Tencent lansase anterior o versiune de testare a T1 prin diverse platforme, inclusiv prin aplicația sa de asistență AI Yuanbao.
Versiunea oficială va fi bazată pe modelul lingvistic al platformei Turbo S de la Tencent, anunțat la sfârșitul lunii trecute. Compania susține că Turbo S procesează interogările mai rapid decât modelul R1 al concurentului DeepSeek.
Un grafic publicat într-o postare care compară modelul T1 cu DeepSeek R1 arată că produsul Tencent excelează la mai multe valori legate de cunoștințe și capacitatea de raționament.
Tencent și-a intensificat investițiile în inteligența artificială în ultimele luni. Joi, compania a anunțat planuri de creștere a cheltuielilor de capital în 2025, în urma cheltuielilor semnificative pentru inteligența artificială pe parcursul anului 2024.
T1 a obținut clasamente înalte la mai multe teste cheie de inteligență artificială. Acest lucru îl plasează printre modelele de top la nivel mondial .
Recenziile recente indică faptul că T1 a obținut un scor de 87,2 puncte pe MMLU-Pro, un set de date care evaluează capacitatea fundamentală de raționament în modele lingvistice mari. Acest scor este al doilea după OpenAI o1.
În plus, T1 a avut performanțe bune la testele de performanță disponibile publicului, cum ar fi CEval, AIME și Zebra Logic. Aceste teste de performanță măsoară cunoștințele generale și raționamentul atât în chineză, cât și în engleză.
Sursă: https://www.baogiaothong.vn/tencent-trinh-lang-mo-hinh-suy-luan-t1-vuot-troi-so-voi-deepseek-192250322131611869.htm







Comentariu (0)