Podle předběžných výsledků organizátorů se Hunyuan-MT-7B umístil na prvním místě v 30 z 31 testů a překonal tak i slavné systémy od společností Google a OpenAI.
WMT25 je každoroční akce, která sdružuje výzkumníky a vývojáře v oblasti strojového překladu z celého světa a je považována za „špičkové hřiště“ pro hodnocení možností překladatelských technologií.

Pozornost technologického světa upoutala „malá, ale mocná“ konstrukce rakety Hunyuan-MT-7B, která se skládá pouze ze 7 miliard komponent.
Místo sledování trendu rozšiřování počtu parametrů se Tencent zaměřuje na budování „komplexního tréninkového procesu“, který zahrnuje výběr dat, průběžné učení, vícevrstvé doladění a posilovací učení.
Výsledkem je, že model stále produkuje plynulé a přesné výsledky a dokonce překonává mnohonásobně větší konkurenty.
„Silnou stránkou Hunyuan-MT-7B je, že používá méně parametrů k dosažení kvality stejné, nebo dokonce lepší než u obřích modelů,“ sdělil vývojový tým.
Testované jazyky sahají od arabštiny přes estonštinu až po masajštinu, kterými v Keni a Tanzanii hovoří přibližně 1,5 milionu lidí.
Existují také jazykové páry čeština-ukrajinština a japonština-zjednodušená čínština. Pouze bhojpurština – jazyk, kterým mluví více než 50 milionů lidí v Indii a Nepálu – se Hunyuan-MT-7B nedostala na první místo.
Organizátoři však také zdůraznili, že se jedná pouze o předběžné výsledky, založené na automatickém hodnocení.
„Na tato čísla je třeba pohlížet s opatrností, protože v procesu hodnocení může stále existovat zkreslení,“ řekl Tom Kocmi, výzkumník v Cohere a vedoucí organizačního výboru WMT25.
Oficiální výsledky založené na manuálním lidském hodnocení budou oznámeny na konferenci, která se bude konat od 5. do 9. listopadu v čínském městě Su-čou.
Tencent se nezastavil jen v laboratoři, ale tento model přenesl do reálných produktů, jako je platforma pro online setkání Tencent Meeting, webový prohlížeč a podniková verze aplikace WeChat.
Zároveň byl Hunyuan-MT-7B sdílen na Hugging Face a GitHubu, aby ho mohla využít komunita vývojářů umělé inteligence.
Tato událost opět ukazuje, že závod v překladu s využitím umělé inteligence se každým dnem vyostřuje a „temný kůň“ společnosti Tencent, Hunyuan-MT-7B, dokázal, že silný není jen velký model.
(Podle aitechsuite)

Zdroj: https://vietnamnet.vn/trung-quoc-bat-ngo-qua-mat-my-tai-cuoc-thi-dich-thuat-ai-toan-cau-2438801.html
Komentář (0)