Vietnam.vn - Nền tảng quảng bá Việt Nam

Vbee und seine Bemühungen zur Stärkung der vietnamesischen Sprache.

Báo Tuổi TrẻBáo Tuổi Trẻ17/02/2025

Als Ho Minh Duc den Wartebereich des Flughafens betrat, inmitten des geschäftigen Treibens der von Geschäftsreisenden zurückkehrenden Menschenmassen, hielt er für ein paar Sekunden inne, als er eine sanfte, vertraute Frauenstimme eine Durchsage über die Lautsprecheranlage verlesen hörte.


Vbee và nỗ lực chắp cánh cho tiếng Việt - Ảnh 1.

Die Mitarbeiter von Vbee arbeiten am Firmensitz in Hanoi - Foto: Zur Verfügung gestellt vom Unternehmen.

Er lächelte erleichtert und glücklich, als würde er einen geliebten Menschen wiedersehen. Dieser „geliebte Mensch“ war einer der 20 KI-Synchronsprecher, mit denen Duc und das Vbee-Team unzählige Tage und Monate gearbeitet hatten. Sie hatten ihr ganzes Herzblut in jede Klangnuance gesteckt und jede einzelne Nuance sorgfältig ausgearbeitet, um sie immer natürlicher und menschenähnlicher klingen zu lassen.

Der holprige Weg der Start-ups

CEO Ho Minh Duc und CTO Nguyen Thi Thu Trang – die beiden Gründer der Vbee Data Services and Solutions Joint Stock Company – haben solche Freude und solchen Stolz schon unzählige Male erlebt.

Diesen „besonderen Bekannten“ begegneten sie in verschiedenen Situationen wieder: den klaren Stimmen aus den Schullautsprechern, den warmen Tönen in Gebäuden oder den professionellen Stimmen aus den automatisierten Telefonsystemen vieler Unternehmen.

Die Kreationen von Vbee sind nicht mehr nur das Ergebnis von Algorithmen und Code; sie dringen tatsächlich in die Realität ein und leisten still und leise, aber wirkungsvolle Beiträge zu vielen Bereichen.

Von Buchrezensionen und Filmsynchronisation bis hin zu automatisierten Callcenter-Ansagen hat Vbee der Sprachtechnologie neues Leben eingehaucht.

Als „Mutter“ dieser Kerntechnologie für Text-to-Speech (TTS) hat Dr. Nguyen Thi Thu Trang stets danach gestrebt, Produkte, die auf der vietnamesischen Sprachsynthesetechnologie basieren – einer Technologie, in die sie seit ihrer Doktorarbeit an der Universität Paris 11 viel Leidenschaft gesteckt hat –, für echte Anwender zugänglich zu machen.

Die Anfangszeit von Vbee war von vielen Herausforderungen geprägt. Obwohl das Tool in den ersten zwei Jahren kostenlos war, fand es nur wenige Nutzer für seine Text-to-Speech-Funktion (TTS). Doch dann wurde COVID-19 unerwartet zum Wendepunkt.

Angesichts der strengen Abstandsregeln mussten Unternehmen wie FE Credit, Momo, Viet Credit, Sacombank usw. Wege finden, um Tausende von Kunden zu erreichen. Hier bot sich Vbee eine Chance: Von Mahnungen bis hin zu automatisierten Antworten – ihr Produkt entwickelte sich schnell zur optimalen Lösung. Damals generierten virtuelle Assistenten und virtuelle Callcenter-Agenten bis zu 80 % des Umsatzes von Vbee.

Mit dem Abklingen der Pandemie und dem Rückgang der Weltwirtschaft stand Vbee vor einer neuen Herausforderung. Der Trend zu generativer KI (GenAI) und digitalen Inhalten belebte das TTS-Tool neu. Heute sind die KI-Stimmen von Vbee allgegenwärtig – von TikTok über YouTube bis Facebook.

„Ein Großteil der aktuellen TTS-Inhalte wird von uns bereitgestellt“, teilte Ho Minh Duc stolz mit. Vbee hat derzeit über zwei Millionen aktive Nutzer, und diese Zahl wächst monatlich stetig um 20 %.

Vbee hat über 20 hochwertige Firmenstimmen trainiert, und wenn man individuell bestellte Stimmen mit einbezieht, haben sie über 200 verschiedene KI-Stimmen erstellt.

Dank einer kürzlich entwickelten und für Tests freigegebenen neuen Technologie zur Spracherkennung benötigt eine neue Stimme jetzt nur noch 3 Minuten Datenaufzeichnung für das Training, anstatt wie vor zwei Jahren 4 bis 10 Stunden Aufzeichnungszeit.

Vbee và nỗ lực chắp cánh cho tiếng Việt - Ảnh 2.

CEO Ho Minh Duc und CTO Nguyen Thi Thu Trang – die beiden Gründer der Vbee Data Services and Solutions Joint Stock Company – Foto: Zur Verfügung gestellt vom Unternehmen.

„Unser Vorteil liegt in unserem Verständnis der vietnamesischen Sprache.“

Im Wettlauf um die Sprachsynthesetechnologie sieht CEO Ho Minh Duc einen Punkt, an dem die Bemühungen um technologische Innovationen allmählich an ihre Grenzen stoßen werden.

Laut seinen Angaben entwickelt Vbee nicht nur Kerntechnologien zur vietnamesischen Sprachverarbeitung, sondern baut auch ein Technologiesystem auf, das in der Lage ist, die vietnamesische Sprache tiefgründig zu verstehen – mit all ihren Feinheiten, Tönen und ihrer einzigartigen Kultur, die nur wahre Vietnamesen vollständig begreifen können.

Als führendes Unternehmen im vietnamesischen TTS-Markt sind die beiden Geschäftsführer von Vbee überzeugt, dass ihr Tool zum Maßstab für KI-gestützte Sprachausgabe in Vietnamesisch geworden ist. Die Nutzer schätzen nicht nur die Genauigkeit, sondern spüren auch die Emotionen in jeder von Vbee entwickelten Stimme.

Im Vietnamesischen beispielsweise hat selbst ein einzelnes Wort wie „ngõ“ (Gasse) je nach Region viele verschiedene Bezeichnungen, wie etwa „hẻm“, „kiệt“ und „xẹc“ – jedes Wort trägt eine eigene Nuance in sich, die die KI verstehen muss.

Um dies zu erreichen, hat Vbee stark in die Sammlung von Beispieldatensätzen sowie in ein leistungsstarkes Serversystem für das Training der KI investiert.

„Um der KI das Verständnis und die korrekte Verarbeitung von Informationen mit solch regionalen Nuancen zu ermöglichen, mussten wir unzählige Stichproben erstellen, und die Kosten für die Verarbeitungsserver waren ebenfalls sehr hoch“, teilte CEO Ho Minh Duc mit.

Dr. Nguyen Thi Thu Trang widmet sich seit über 15 Jahren der Erforschung der Kerntechnologie von Vbee für die Text-to-Speech-Technologie (TTS), um die charakteristischen Töne und die Grammatik der vietnamesischen Sprache zu entschlüsseln. Für sie ist ihre Muttersprache eine subtile Welt voller ausdrucksstarker Nuancen.

„Vietnamesisch ist eine sehr komplexe und interessante Sprache; die Töne sind der schwierigste Aspekt und unterscheiden sich von vielen anderen verbreiteten Sprachen der Welt. Je besser ich die Sprache verstehe, desto genauer wird mein Modell sein“, erklärte sie.

Vbee etabliert sich zunehmend als unverzichtbarer Bestandteil von Werkzeugen und Geräten, die vietnamesische Sprachverarbeitungssoftware im technologischen Zeitalter integrieren.

In jedem Wort und jeder Stimme erforscht und entwickelt das Vbee-Team nicht nur Technologie, sondern strebt auch danach, in seinen KI-Stimmen eine authentische „vietnamesische Emotion“ zu erzeugen.

Der Name Vbee ist eine Abkürzung von „Vietnamesisch BE your Eyes“ und entstand aus meinem ursprünglichen Wunsch, ein Hilfsmittel zu entwickeln, das Sehbehinderten als „Augen“ dienen sollte. In der heutigen Entwicklungswelt, in der viele Menschen dem Hören den Vorrang vor dem Sehen geben, glauben wir jedoch, dass Vbee für alle Menschen zu einem Hilfsmittel werden wird.

Dr. Nguyen Thi Thu Trang (Dozentin an der Fakultät für Informationstechnologie und Kommunikation der Technischen Universität Hanoi, Gründerin und Chief Technology Officer der Vbee Company)

Ein Treffen von Hörbuchbegeisterten

Vbee entstand aus Dr. Nguyen Thi Thu Trangs enger Verbundenheit mit der Gemeinschaft der Sehbehinderten. Bereits während ihres Studiums engagierte sie sich in der Aufnahme von Hörbüchern und der Entwicklung vietnamesischer Text-to-Speech-Systeme zur Unterstützung von Sehbehinderten.

Diese Erfahrungen inspirierten sie zur Entwicklung einer vietnamesischen Text-to-Speech-Software – dem Vorläufer von Vbee. 2018 gründete sie zusammen mit ihrem Kommilitonen Ho Minh Duc – ebenfalls Student an der Technischen Universität Hanoi und mit Erfahrung aus dem Projekt Socbay.com sowie der Digitalisierung von Hörbüchern – Vbee, ein Pionierunternehmen im Bereich Text-to-Speech in Vietnam.

Vbees herausragende Leistungen

- Gewinner des ersten Preises der Qualcomm Vietnam Innovation Challenge 2024

- Sonderpreis beim Youth Start-up Award 2023

- Startup gewinnt das Grab Venture Ignite 2020 Accelerator-Programm.

- Erster Preis bei den Vietnam Talent Awards 2018, zweiter Preis bei den Vietnam Talent Awards 2020.

- Zertifiziert als vietnamesische Kerntechnologie im Nationalen Programm zur digitalen Transformation 2025-2030 des Ministeriums für Information und Kommunikation.

- Das Projekt gewann den Vietnam Digital Media Award 2018 und den Vingroup Funding Award 2019.

Regionale Vision

Nachdem sich Vbee auf dem vietnamesischen Markt etabliert hat, strebt das Unternehmen eine Expansion nach Südostasien an und plant, seine TTS-Technologie bis 2026 in Länder wie Laos, Thailand, Kambodscha und die Philippinen einzuführen.

Laut Dr. Nguyen Thi Thu Trang wird der rasante technologische Fortschritt von heute, insbesondere die Entstehung mehrsprachiger Modelle, die Entwicklung von TTS-Tools für andere Sprachen erleichtern.

Derzeit forscht sie an Sprachtechnologien für Thailändisch, Chinesisch und Englisch und eröffnet damit neue Wege für Vbee auf dem internationalen Markt.

Vbee và nỗ lực chắp cánh cho tiếng Việt - Ảnh 3. Vietnamesisches Start-up auf dem Pariser KI-Gipfel ausgezeichnet

Enfarm, ein vietnamesisches KI-Technologie-Startup für die Landwirtschaft, ist eines von vier asiatischen Unternehmen unter den 50 Projekten, die am 10. und 11. Februar auf dem AI Action Summit in Paris, Frankreich, vorgestellt wurden.



Quelle: https://tuoitre.vn/vbee-va-no-luc-chap-canh-cho-tieng-viet-20250217102146767.htm

Kommentar (0)

Hinterlasse einen Kommentar, um deine Gefühle zu teilen!

Gleiches Thema

Gleiche Kategorie

Gleicher Autor

Erbe

Figur

Unternehmen

Aktuelles

Politisches System

Lokal

Produkt

Happy Vietnam
Spielt auch Boccia

Spielt auch Boccia

Ich liebe Puppen.

Ich liebe Puppen.

Bewundern

Bewundern