Vietnam.vn - Nền tảng quảng bá Việt Nam

Vbee und der Versuch, der vietnamesischen Sprache Flügel zu verleihen

Báo Tuổi TrẻBáo Tuổi Trẻ17/02/2025

Als er die Wartehalle des Flughafens betrat, inmitten des Trubels der von einer Geschäftsreise zurückkehrenden Menschen, hielt Ho Minh Duc einige Sekunden inne, als er eine vertraute, sanfte Frauenstimme hörte, die eine Durchsage über das System vorlas.


Vbee và nỗ lực chắp cánh cho tiếng Việt - Ảnh 1.

Die Mitarbeiter von Vbee arbeiten in der Firmenzentrale in Hanoi – Foto: NVCC

Er lächelte erleichtert und glücklich, als hätte er einen Verwandten getroffen. Dieser „Verwandte“ war eine der 20 KI-Stimmen, mit denen Duc und das Vbee-Team viele Tage und Monate lang „geschlafen und gegessen“ hatten. Sie hatten ihr ganzes Herzblut in jede Tonlinie gesteckt und auf jede Nuance der Stimme geachtet, um sie natürlicher und menschlicher zu machen.

Holpriger Start

Ich weiß nicht, wie oft CEO Ho Minh Duc und CTO Nguyen Thi Thu Trang – die beiden Gründer der Vbee Data Solutions and Services Joint Stock Company – ein solches Gefühl der Freude und des Stolzes erlebt haben.

Sie trafen in vielen verschiedenen Situationen auf „besondere Bekanntschaften“: klare Stimmen aus Schullautsprecheranlagen, warme Stimmen in Gebäuden oder professionelle Stimmen aus den automatischen Telefonzentralen vieler Unternehmen.

Die Geistesprodukte von Vbee sind nicht mehr nur das Ergebnis von Algorithmen und Codes, sondern werden tatsächlich zum Leben erweckt und leisten stille, aber wirkungsvolle Beiträge in vielen Bereichen.

Von Buchvorstellungen über Filmsynchronisationen bis hin zu automatisierten Callcenter-Ansagen hat Vbee der Sprachtechnologie neues Leben eingehaucht.

Als „Mutter“ der TTS-Kerntechnologie ist es Dr. Nguyen Thi Thu Trang stets ein Anliegen, Produkte der vietnamesischen Sprachsynthesetechnologie – der Technologie, der sie seit ihrer Doktorarbeit an der Universität Paris 11 viel Arbeit gewidmet hat – den echten Benutzern zugänglich zu machen.

Die Anfänge von Vbee waren holprig. Obwohl das Text-to-Speech-Tool (TTS) in den ersten zwei Jahren kostenlos war, zog es nur eine kleine Nutzergruppe an. Doch dann sorgte COVID-19 für einen unerwarteten Wendepunkt.

Angesichts strenger Vorschriften zur sozialen Distanzierung mussten Unternehmen wie FE Credit, Momo, Viet Credit und Sacombank Wege finden, Tausende von Kunden zu erreichen. Vbee erhielt diese Chance: Von Mahnungen bis hin zu automatischen Antworten erwiesen sich die Produkte des Unternehmens schnell als optimale Lösung. Virtuelle Assistenten und virtuelle Callcenter erwirtschafteten damals bis zu 80 % des Umsatzes von Vbee.

Als die Pandemie vorüber war und die Weltwirtschaft schwächelte, stand Vbee vor einer neuen Herausforderung. Die Welle der generativen KI (GenAI) und die Trends bei digitalen Inhalten belebten das TTS-Tool neu. Heute sind die KI-Stimmen von Vbee überall zu finden – von TikTok über YouTube bis hin zu Facebook.

„Ein Großteil der heutigen TTS-Inhalte wird von uns bereitgestellt“, erklärte Herr Ho Minh Duc stolz. Derzeit liegt die Zahl der tatsächlichen Vbee-Benutzer bei über 2 Millionen, und diese Zahl steigt weiterhin jeden Monat stetig um 20 %.

Vbee hat über 20 hochwertige Unternehmensstimmen trainiert und wenn man benutzerdefinierte Stimmen mitzählt, hat das Unternehmen über 200 verschiedene KI-Stimmen erstellt.

Mit der neuen Sprachtranskriptionstechnologie, die kürzlich erforscht und getestet wurde, sind zum Trainieren einer neuen Stimme jetzt nur noch 3 Minuten aufgezeichneter Daten erforderlich, statt wie vor zwei Jahren noch 4 bis Dutzende Stunden Aufzeichnung.

Vbee và nỗ lực chắp cánh cho tiếng Việt - Ảnh 2.

CEO Ho Minh Duc und Chief Technology Officer Nguyen Thi Thu Trang – zwei Gründer der Vbee Data Solutions and Services Joint Stock Company – Foto: NVCC

„Wir verstehen Vietnamesisch besser“

Im Wettlauf um die Sprachsynthesetechnologie sieht CEO Ho Minh Duc eine Zeit, in der die Bemühungen um technologische Innovationen allmählich an ihre Grenzen stoßen werden.

Ihm zufolge entwickelt Vbee nicht nur eine Kerntechnologie für die vietnamesische Sprachverarbeitung, sondern baut auch ein Technologiesystem auf, das in der Lage ist, die vietnamesische Sprache gründlich zu verstehen – mit all ihren Feinheiten, Tönen und der einzigartigen Kultur, die nur echte Vietnamesen vollständig verstehen können.

Als Marktführer im TTS-Markt in Vietnam sind die beiden Leiter von Vbee überzeugt, dass ihr Tool zum Standard für KI-Sprachausgabe für Vietnamesisch geworden ist. Die Benutzer schätzen nicht nur die Genauigkeit, sondern spüren auch die „Emotion“ in jeder von Vbee entwickelten Stimme.

Im Vietnamesischen beispielsweise hat ein und dasselbe Wort „Allee“ je nach Region viele verschiedene Namen, wie etwa „Hem“, „Kiem“, „Xec“ – jedes Wort hat eine andere Nuance, die die KI verstehen muss.

Um dies zu erreichen, hat Vbee stark in das Sammeln von Beispieldatensätzen sowie in leistungsstarke Serversysteme für das KI-Training investiert.

„Damit die KI jede regionale Nuance richtig verstehen und verarbeiten kann, mussten wir unzählige Beispielsätze erstellen und die Kosten für den Verarbeitungsserver waren zudem sehr hoch“, erklärte CEO Ho Minh Duc.

Dr. Nguyen Thi Thu Trang hat mehr als 15 Jahre damit verbracht, die TTS-Technologie von Vbee zu erforschen, um die einzigartigen Töne und die Grammatik des Vietnamesischen zu entschlüsseln. Für sie ist ihre Muttersprache eine subtile Welt voller ausdrucksstarker Nuancen.

„Meine vietnamesische Sprache ist sehr komplex und interessant. Die Töne sind der schwierigste Punkt und unterscheiden sich von vielen anderen populären Sprachen der Welt. Je besser ich die Sprache verstehe, desto genauer wird mein Modell sein“, erklärte sie.

Vbee behauptet allmählich, dass sie im Technologiezeitalter ein unverzichtbarer Bestandteil von Tools und Geräten mit integrierter vietnamesischer Sprachverarbeitungssoftware sein werden.

Das Vbee-Team erforscht und entwickelt nicht nur Technologie in jedem Wort und jeder Stimme, sondern ist auch bestrebt, in seinen KI-Stimmen eine echte „vietnamesische Emotion“ zu erzeugen.

Der Name Vbee ist eine Abkürzung des Satzes „Vietnamese BE your Eyes“ (Vietnamesisch: Seien Sie Ihre Augen), der auf meinen ursprünglichen Wunsch zurückzuführen ist, ein Tool zu entwickeln, das zu den „Augen“ von Sehbehinderten wird. Doch angesichts der aktuellen Entwicklung, bei der viele Menschen mehr aufs Hören als aufs Sehen umsteigen möchten, glauben wir, dass Vbee auch zu den „Augen“ aller werden wird.

Dr. Nguyen Thi Thu Trang (Dozentin an der Fakultät für Informationstechnologie und Kommunikation, Hanoi University of Science and Technology, Gründerin und Technologiedirektorin der Vbee Company)

Treffen der Hörbuch-Enthusiasten

Vbee entstand aus der Beziehung zwischen Dr. Nguyen Thi Thu Trang und der Blindengemeinschaft. Seit ihrer Studienzeit beteiligt sie sich an der Aufnahme von Hörbüchern und der Entwicklung eines vietnamesischen Vorleseprogramms zur Unterstützung blinder Menschen.

Diese Erfahrungen inspirierten sie zur Entwicklung einer vietnamesischen Lesesoftware – dem Vorgänger von Vbee. Im Jahr 2018 gründete sie zusammen mit Herrn Ho Minh Duc – einem Kommilitonen an der Hanoi University of Science and Technology mit Erfahrung aus dem Socbay.com-Projekt und der Digitalisierung von Hörbüchern – Vbee, einen Pionier auf dem Gebiet der Text-to-Speech-Technologie in Vietnam.

Vbees herausragende Erfolge

- Erster Preis der Qualcomm Vietnam Innovation Challenge 2024

- Sonderpreis des Tuoi Tre Start-up Award 2023

- Gewinner-Start-up im Grab Venture Ignite 2020 Startup Acceleration Program

- Erster Preis des vietnamesischen Talents 2018, zweiter Preis des vietnamesischen Talents 2020

- Zertifikat für vietnamesische Kerntechnologie im Nationalen Programm zur digitalen Transformation 2025 – 2030 des Ministeriums für Information und Kommunikation

– Gewinnerprojekt beim Vietnam Digital Media Award 2018 und Vingroup Fund 2019.

Regionale Vision

Nachdem Vbee seine Position auf dem vietnamesischen Markt gefestigt hat, strebt das Unternehmen eine Expansion nach Südostasien an und plant, seine TTS-Technologie bis 2026 in Länder wie Laos, Thailand, Kambodscha und die Philippinen zu bringen.

Laut Dr. Nguyen Thi Thu Trang wird der schnelle technologische Fortschritt mit der Entstehung mehrsprachiger Modelle die Entwicklung von TTS-Tools für andere Sprachen erleichtern.

Derzeit erforscht sie Sprachtechnologien für Thailändisch, Chinesisch und Englisch und eröffnet Vbee damit neue Möglichkeiten auf dem internationalen Markt.

Vbee và nỗ lực chắp cánh cho tiếng Việt - Ảnh 3. Vietnamesisches Start-up auf KI-Gipfel in Paris ausgezeichnet

Enfarm, ein Start-up für künstliche Intelligenz (KI)-Technologie für die vietnamesische Landwirtschaft, ist einer von vier asiatischen Vertretern unter den 50 Projekten, die am 10. und 11. Februar auf dem AI Action Summit in Paris (Frankreich) vorgestellt wurden.


[Anzeige_2]
Quelle: https://tuoitre.vn/vbee-va-no-luc-chap-canh-cho-tieng-viet-20250217102146767.htm

Kommentar (0)

No data
No data

Gleiches Thema

Gleiche Kategorie

Vietnam gewinnt den Musikwettbewerb Intervision 2025
Stau in Mu Cang Chai bis zum Abend, Touristen strömen herbei, um reifen Reis zu jagen
Die friedliche goldene Jahreszeit von Hoang Su Phi in den hohen Bergen von Tay Con Linh
Dorf in Da Nang unter den 50 schönsten Dörfern der Welt 2025

Gleicher Autor

Erbe

Figur

Geschäft

No videos available

Nachricht

Politisches System

Lokal

Produkt