YouTube se zaměřuje na vývoj umělé inteligence pro zlepšení uživatelského prostředí. Foto: Digwatch . |
Jakožto největší světová online video platforma je jedním z největších omezení pro diváky YouTube jazyková bariéra. V kontextu silného rozvoje generativní umělé inteligence YouTube nedávno zavedl funkci automatického „dabingu“, která nyní podporuje vietnamštinu.
V působivém videu MKBHD o Samsungu Galaxy S25 Edge je vidět, že při přepnutí na vietnamštinu je vietnamský hlas relativně snadno slyšitelný a čistý. Tento zážitek je velmi podobný profesionálnímu hlasu s umělou inteligencí, který se běžně používá v softwaru pro převod textu na řeč, jako je Google Text-to-Speech neboFPT Play Voice.
Při přepínání mezi původní angličtinou a dabingem je docela dobře sestříhaný a dobře si zachovává nuance a výrazy tvůrce. Hlas má přízvuky, někdy používá zvolání jako „tady, to je ono“, což vytváří pocit, jako by k vám někdo přímo mluvil.
Překlad obsahu generovaného umělou inteligencí je však stále slovo od slova, což dělá věty nepřirozené a neblíží se významu. Diváci budou muset pozorně naslouchat, aby interpretovali význam, který chce tvůrce sdělit.
Přestože je dabing kompletně převzat z vietnamských titulků, umělá inteligence stále nevyslovuje správně slova jako „super, zákazník, burza“, což posluchačům ztěžuje pochopení. To může vést k nudě, nedorozumění nebo nedostatku obsahu oproti originálu.
Před nahráním videa si tvůrci budou moci poslechnout dabing s podporou umělé inteligence. Videa s podporou vietnamštiny budou obvykle mít vietnamské názvy se slovy „dabing“ hned pod nimi.
Umělá inteligence je přítomna v každé fázi, od tvorby nápadů, přes analýzu výkonu videa až po titulkování a napodobování hlasu. YouTube doufá, že během příštích pěti let bude každé nahrané video automaticky dabováno do více jazyků a zároveň si zachová hlas a výraz tvůrce.
Do konce prosince 2024 byla tato funkce dostupná v devíti jazycích při překladu z angličtiny. Začátkem roku 2025 generální ředitel YouTube Neal Mohan oficiálně potvrdil, že automatický dabing s využitím umělé inteligence bude zpřístupněn všem partnerům. Do dubna byla funkce tiše povolena pro všechny kanály, které měly povoleno monetizaci.
Příspěvek na Redditu vyjadřující nespokojenost s touto funkcí získal více než 100 komentářů a 450 lajků. Jeden člověk uvedl, že existuje mnoho softwarů pro hlasový překlad, které si vedou docela dobře, nebo že samotný YouTube má titulky, které uspokojují potřeby uživatelů pro jazykový překlad.
Další komentující uvedl, že umělá inteligence špatně zachytila slovo „časoprostor“ jako „volný čas“, což vedlo k chybnému překladu. Mnoho dalších uživatelů si také stěžovalo, že funkce nefunguje správně, a pokusili se ji v aplikaci deaktivovat.
Samotný YouTube připouští, že automatický dabing s využitím umělé inteligence je stále relativně nový, a chce získat zpětnou vazbu od uživatelů. Před zveřejněním videa platforma upozorní tvůrce na omezení schopnosti umělé inteligence rozumět významu, vyslovovat a rozlišovat hluk. Před distribucí divákům budou muset zkontrolovat přesnost dabingu.
Přesto podle Air.io stojí tato funkce za vyzkoušení. Je to levný způsob, jak otestovat, zda se tvůrcům jejich obsah líbí a zda dokážou s dabovanými verzemi přilákat nové diváky. I když technologie není dokonalá, má potenciál rozšířit dosah obsahu.
V současné době ne všechna videa mají hlasový komentář a uživatelé tuto funkci nemohou ve výchozím nastavení deaktivovat. Zkuste místo toho přepnout jazyk prohlížeče na angličtinu, abyste snížili frekvenci verze s umělou inteligencí.
Zdroj: https://znews.vn/youtube-vua-dung-ai-de-pha-vo-rao-can-ngon-ngu-post1553547.html
Komentář (0)