YouTube konzentriert sich auf die Entwicklung von KI, um das Nutzererlebnis zu verbessern. Foto: Digiwatch . |
Als weltweit größte Online -Videoplattform stellt die Sprachbarriere eine der größten Hürden für YouTube-Nutzer dar. Angesichts der rasanten Entwicklung KI-generierter Inhalte hat YouTube nun eine automatische Sprachausgabefunktion eingeführt, die jetzt auch Vietnamesisch unterstützt.
In MKBHDs beeindruckendem Video über das Samsung Galaxy S25 Edge klingt die vietnamesische Sprachausgabe relativ verständlich und klar. Dieses Hörerlebnis ähnelt der professionellen KI-Sprachausgabe, die häufig in Text-to-Speech-Software wie Google Text-to-Speech undFPT Play Voice zum Einsatz kommt.
Beim Hin- und Herwechseln zwischen der englischen Originalfassung und der Synchronfassung fällt auf, dass die Synchronisation sehr akkurat ist und die Nuancen und Ausdrucksweise des Autors gut wiedergibt. Die Stimme hat eine eigene Betonung und verwendet gelegentlich Ausrufe wie „Ja, genau!“, wodurch der Eindruck eines direkten Gesprächs entsteht.
KI-generierte Übersetzungen sind jedoch oft mechanisch und wortwörtlich, was zu unnatürlichen und fehlerhaften Sätzen führt. Zuschauer müssen aufmerksam zuhören, um die vom Autor beabsichtigte Bedeutung zu erfassen.
Obwohl die Sprachausgabe vollständig auf vietnamesischen Untertiteln basiert, spricht die KI Wörter wie „Super“, „Kunde“ und „Tauschgeschäft“ immer noch falsch aus, was bei den Zuhörern Verwirrung stiftet. Dies kann zu Monotonie, ungenauer Kommunikation oder unvollständigen Inhalten im Vergleich zur Originalquelle führen.
Vor dem Hochladen eines Videos können sich die Ersteller KI-generierte Sprachausgabe in der Vorschau anhören. Videos mit vietnamesischer Sprachausgabe haben in der Regel einen vietnamesischen Titel und den Hinweis „Voiceover“ direkt darunter.
Künstliche Intelligenz ist in jeder Phase präsent, von der Ideenfindung und Videoanalyse bis hin zur Untertitelerstellung und Stimmenimitation. YouTube geht davon aus, dass innerhalb der nächsten fünf Jahre alle hochgeladenen Videos automatisch in mehrere Sprachen synchronisiert werden können, wobei die Originalstimme und Mimik des Erstellers erhalten bleiben.
Ende Dezember 2024 unterstützte diese Funktion neun Sprachen bei Übersetzungen aus dem Englischen. Anfang 2025 bestätigte Neal Mohan, CEO von YouTube, offiziell, dass die KI-gestützte automatische Synchronisation für alle Partner eingeführt wird. Im April wurde die Funktion dann stillschweigend für alle monetarisierten Kanäle aktiviert.
Ein Reddit-Beitrag, der die Unzufriedenheit mit dieser Funktion zum Ausdruck brachte, erhielt über 100 Kommentare und 450 Likes. Jemand argumentierte, dass viele Voiceover-Softwareprogramme bereits recht gute Arbeit leisten und YouTube selbst Untertitel anbietet, wodurch die Bedürfnisse der Nutzer hinsichtlich der Sprachübersetzung erfüllt würden.
Ein weiterer Kommentar besagte, dass die KI „Spacetime“ als „Freizeit“ verstand, was zu fehlerhaften Übersetzungen führte. Viele andere Nutzer berichteten ebenfalls, dass die Funktion ineffektiv sei und suchten nach Möglichkeiten, sie innerhalb der App zu deaktivieren.
YouTube selbst räumt ein, dass die KI-gestützte automatische Synchronisation noch relativ neu ist und begrüßt Nutzerfeedback. Vor der Veröffentlichung eines Videos informiert die Plattform die Urheber über die Grenzen der KI beim Verständnis von Bedeutung, Aussprache und Geräuschunterscheidung. Sie müssen die Genauigkeit der Synchronisation überprüfen, bevor sie das Video für die Zuschauer freigeben.
Laut Air.io ist die Funktion jedoch einen Versuch wert. Sie bietet eine kostengünstige Möglichkeit zu testen, ob die Inhalte eines Creators beim Publikum Anklang finden und ob der Kanal mit den synchronisierten Versionen neue Zuschauer gewinnen kann. Die Technologie ist zwar nicht perfekt, hat aber das Potenzial, die Reichweite von Inhalten zu vergrößern.
Aktuell sind nicht alle Videos in synchronisierter Form verfügbar, und diese Funktion lässt sich nicht standardmäßig deaktivieren. Versuchen Sie stattdessen, die Sprache Ihres Browsers auf Englisch umzustellen, um die Häufigkeit KI-synchronisierter Versionen zu reduzieren.
Quelle: https://znews.vn/youtube-vua-dung-ai-de-pha-vo-rao-can-ngon-ngu-post1553547.html






Kommentar (0)