A YouTube a felhasználói élmény javítása érdekében mesterséges intelligencia fejlesztésére összpontosít. Fotó: Digiwatch . |
A világ legnagyobb online videóplatformjaként a YouTube-nézők egyik legnagyobb korlátja a nyelvi akadály. A mesterséges intelligencia által generált tartalmak gyors fejlődése közepette a YouTube nemrégiben bevezette az automatikus hangalámondás funkciót, amely mostantól a vietnami nyelvet is támogatja.
Az MKBHD Samsung Galaxy S25 Edge-ről szóló lenyűgöző videójában, amikor vietnamira váltottunk, a vietnami hang viszonylag könnyen érthető és tiszta. Ez az élmény meglehetősen hasonlít a professzionális mesterséges intelligencia által létrehozott hangfelolvasáshoz, amelyet gyakran használnak a szövegfelolvasó szoftverekben, például a Google Text-to-Speech ésaz FPT Play Voice alkalmazásokban.
Az eredeti angol verzióval való oda-vissza váltáskor a szinkronizált változat meglehetősen pontos, jól megőrzi az alkotó árnyalatait és kifejezéseit. A hangnak van egy hangsúlya, néha felkiáltásokat használ, mint például az „igen, ez az”, ami azt az érzetet kelti, mintha szinte közvetlen beszélgetés folyna.
A mesterséges intelligencia által generált fordítások azonban gyakran mechanikusak, szóról szóra haladnak, ami természetellenes és pontatlan mondatokat eredményez. A nézőknek figyelmesen kell hallgatniuk, hogy értelmezzék az alkotó szándékolt jelentését.
Bár a narráció teljes egészében vietnami feliratokon alapul, a mesterséges intelligencia továbbra is rosszul ejti ki az olyan szavakat, mint a „szuper”, „vásárló” és „kompromisszum”, ami zavart okozhat a hallgatókban. Ez monotonitáshoz, pontatlan kommunikációhoz vagy az eredeti forrásból származó tartalom hiányosságaihoz vezethet.
Videó feltöltése előtt az alkotók meghallgathatják a mesterséges intelligencia által biztosított narráció előzeteseit. A vietnami narrációt támogató videók általában vietnami címmel rendelkeznek, közvetlenül alatta a „narráció” kifejezéssel.
A mesterséges intelligencia minden szakaszban jelen van, az ötletgenerálástól és a videóteljesítmény elemzésétől kezdve a feliratkészítésen át a hangutánzásig. A YouTube arra számít, hogy a következő öt évben az összes feltöltött videó automatikusan több nyelvre szinkronizálható lesz, miközben megőrzi az alkotó eredeti hangját és arckifejezéseit.
2024 decemberének végére ez a funkció kilenc nyelvet támogatott angolról fordításkor. 2025 elején Neal Mohan, a YouTube vezérigazgatója hivatalosan is megerősítette, hogy a mesterséges intelligenciával működő automatikus szinkronizálást minden partner számára bevezetik. Áprilisra a funkciót csendben aktiválták az összes bevételszerző csatornán.
Egy Reddit-bejegyzés, amelyben elégedetlenséget fejeztek ki ezzel a funkcióval kapcsolatban, több mint 100 hozzászólást és 450 lájkot kapott. Valaki azzal érvelt, hogy sok hangalámondásos szoftver már most is elég jó munkát végez, és maga a YouTube is rendelkezik feliratokkal, amelyek kielégítik a felhasználók fordítási igényeit.
Egy másik hozzászólás szerint a mesterséges intelligencia a „téridő” szót „szabadidőként” értelmezte, ami helytelen fordításokhoz vezetett. Sok más felhasználó is arról számolt be, hogy a funkció hatástalan, és módokat kerestek a letiltására az alkalmazáson belül.
Maga a YouTube is elismeri, hogy a mesterséges intelligencia általi automatikus szinkronizálás még viszonylag új, és örömmel fogadja a felhasználói visszajelzéseket. A videók közzététele előtt a platform értesíti az alkotókat a mesterséges intelligencia jelentésmegértési, kiejtési és zajmegkülönböztetési korlátairól. A nézőknek való közzététel előtt ellenőrizniük kell a szinkronizálás pontosságát.
Az Air.io szerint azonban a funkció megér egy próbát. Ez egy olcsó módja annak, hogy teszteljük, vajon a közönség élvezi-e az alkotó tartalmát, és hogy a csatorna képes-e új nézőket vonzani ezekkel a szinkronizált verziókkal. Bár nem tökéletes, a technológia lehetőséget kínál a tartalom elérésének bővítésére.
Jelenleg nem minden videóhoz lesz szinkronizált verzió, és a felhasználók alapértelmezés szerint nem tudják letiltani ezt a funkciót. Ehelyett próbáld meg angolra váltani a böngésző nyelvét, hogy csökkentsd a mesterséges intelligencia által szinkronizált verziók gyakoriságát.
Forrás: https://znews.vn/youtube-vua-dung-ai-de-pha-vo-rao-can-ngon-ngu-post1553547.html








Hozzászólás (0)