YouTube konzentriert sich auf die Entwicklung künstlicher Intelligenz zur Verbesserung des Benutzererlebnisses. Foto: Digwatch . |
Als weltweit größte Online -Videoplattform ist die Sprachbarriere eine der größten Einschränkungen für YouTube-Zuschauer. Im Zuge der starken Entwicklung generativer KI hat YouTube kürzlich eine automatische Synchronisationsfunktion eingeführt, die nun auch Vietnamesisch unterstützt.
Im beeindruckenden Video von MKBHD zum Samsung Galaxy S25 Edge ist die vietnamesische Stimme beim Wechsel zu Vietnamesisch relativ gut verständlich und klar zu hören. Dieses Erlebnis ähnelt der professionellen KI-Stimme, die häufig in Text-to-Speech-Software wie Google Text-to-Speech und FPT Play Voice verwendet wird.
Beim Wechsel zwischen dem englischen Original ist die Synchronisation gut geschnitten und behält die Nuancen und Ausdrücke des Produzenten gut bei. Die Stimme ist akzentuiert und verwendet manchmal Ausrufe wie „da, das ist es“, wodurch fast das Gefühl entsteht, als würde jemand direkt mit einem sprechen.
Die KI-generierte Inhaltsübersetzung erfolgt jedoch immer noch Wort für Wort, wodurch die Sätze unnatürlich und nicht sinngemäß wiedergegeben werden. Die Zuschauer müssen aufmerksam zuhören, um die Bedeutung zu verstehen, die der Ersteller vermitteln möchte.
Obwohl die Synchronisation vollständig aus vietnamesischen Untertiteln stammt, spricht die KI Wörter wie „Super, Kunde, Umtausch“ immer noch nicht richtig aus, was das Verständnis für die Zuhörer erschwert. Dies kann zu Langeweile, Missverständnissen oder unzureichender Wiedergabe des Originalinhalts führen.
Vor dem Hochladen eines Videos können sich die Ersteller die KI-gestützte Synchronisation anhören. Videos mit vietnamesischer Unterstützung haben in der Regel vietnamesische Titel mit dem Wort „Synchronisation“ direkt darunter.
Künstliche Intelligenz ist in jeder Phase präsent, von der Ideenfindung über die Analyse der Videoleistung bis hin zu Untertiteln und Stimmimitation. YouTube hofft, dass innerhalb der nächsten fünf Jahre jedes hochgeladene Video automatisch in mehrere Sprachen synchronisiert wird und dabei die Stimme und der Ausdruck des Erstellers erhalten bleiben.
Bis Ende Dezember 2024 war die Funktion in neun Sprachen verfügbar, wenn aus dem Englischen übersetzt wurde. Anfang 2025 bestätigte YouTube-CEO Neal Mohan offiziell, dass die KI-Autosynchronisierung für alle Partner eingeführt werden würde. Im April wurde die Funktion stillschweigend für alle Kanäle aktiviert, die die Monetarisierung aktiviert hatten.
Ein Reddit-Beitrag, der seine Unzufriedenheit mit dieser Funktion zum Ausdruck brachte, erhielt über 100 Kommentare und 450 Likes. Ein Nutzer meinte, dass es viele Voiceover-Programme gebe, die recht gut funktionieren, oder dass YouTube selbst Untertitel habe und damit den Bedürfnissen der Nutzer nach Sprachübersetzungen entspreche.
Ein anderer Kommentator sagte, die KI habe das Wort „Raumzeit“ als „Freizeit“ missverstanden, was zu einer Fehlübersetzung geführt habe. Viele andere Nutzer beschwerten sich ebenfalls darüber, dass die Funktion nicht richtig funktionierte und versuchten, sie in der App zu deaktivieren.
YouTube selbst gibt zu, dass die automatische Synchronisation durch KI noch relativ neu ist, und möchte daher Feedback von Nutzern erhalten. Vor der Veröffentlichung eines Videos weist die Plattform die Ersteller auf die Einschränkungen der KI-Fähigkeit hin, Bedeutungen zu verstehen, Aussprachen zu treffen und Geräusche zu unterscheiden. Sie müssen die Genauigkeit der Synchronisation überprüfen, bevor sie diese an die Zuschauer verteilt.
Laut Air.io ist die Funktion dennoch einen Versuch wert. Sie bietet eine kostengünstige Möglichkeit zu testen, ob die Inhalte den Produzenten gefallen und ob sie mit den synchronisierten Versionen neue Zuschauer gewinnen können. Die Technologie ist zwar nicht perfekt, hat aber das Potenzial, die Reichweite von Inhalten zu erhöhen.
Derzeit verfügen nicht alle Videos über ein Voiceover, und Nutzer können diese Funktion standardmäßig nicht deaktivieren. Versuchen Sie stattdessen, Ihre Browsersprache auf Englisch umzustellen, um die Häufigkeit des KI-Voiceovers zu reduzieren.
Quelle: https://znews.vn/youtube-vua-dung-ai-de-pha-vo-rao-can-ngon-ngu-post1553547.html
Kommentar (0)