Vietnam.vn - Nền tảng quảng bá Việt Nam

Vbee und der Versuch, der vietnamesischen Sprache Flügel zu verleihen

Báo Tuổi TrẻBáo Tuổi Trẻ17/02/2025

Als er inmitten des Trubels der von einer Geschäftsreise zurückkehrenden Menschen die Flughafenlobby betrat, hielt Ho Minh Duc einige Sekunden inne, als er eine vertraute, sanfte Frauenstimme hörte, die eine Durchsage über das System vorlas.


Vbee và nỗ lực chắp cánh cho tiếng Việt - Ảnh 1.

Die Mitarbeiter von Vbee arbeiten in der Firmenzentrale in Hanoi – Foto: NVCC

Er lächelte erleichtert und glücklich, als hätte er einen Verwandten getroffen. Dieser „Verwandte“ war eine der 20 KI-Stimmen, mit denen Duc und das Vbee-Team viele Tage und Monate lang „geschlafen und gegessen“ hatten. Sie hatten ihr ganzes Herzblut in jede Klanglinie gesteckt und auf jede Nuance der Stimme geachtet, um sie natürlicher und menschlicher zu gestalten.

Holpriger Start

Ich weiß nicht, wie oft CEO Ho Minh Duc und CTO Nguyen Thi Thu Trang – die beiden Gründer der Vbee Data Solutions and Services Joint Stock Company – ein solches Gefühl der Freude und des Stolzes erlebt haben.

Sie trafen in vielen verschiedenen Situationen auf „besondere Bekanntschaften“: klare Stimmen aus Schullautsprecheranlagen, warme Stimmen in Gebäuden oder professionelle Stimmen aus den automatischen Telefonzentralen vieler Unternehmen.

Die Geistesprodukte von Vbee sind nicht mehr nur das Ergebnis von Algorithmen und Codes, sondern werden tatsächlich zum Leben erweckt und leisten stille, aber wirkungsvolle Beiträge in vielen Bereichen.

Von Buchvorstellungen über Filmsynchronisationen bis hin zu automatisierten Callcenter-Ansagen – Vbee haucht der Sprachtechnologie neues Leben ein.

Als „Mutter“ der TTS-Kerntechnologie ist Dr. Nguyen Thi Thu Trang stets bestrebt, Produkte der vietnamesischen Sprachsynthesetechnologie – der Technologie, der sie seit ihrer Doktorarbeit an der Universität Paris 11 viel Arbeit gewidmet hat – den echten Benutzern zugänglich zu machen.

Die Anfänge von Vbee waren holprig. Obwohl das Text-to-Speech-Tool (TTS) in den ersten zwei Jahren kostenlos war, fand es nur wenige Nutzer. Doch dann sorgte COVID-19 für einen unerwarteten Wendepunkt.

Angesichts strenger Abstandsregeln mussten Unternehmen wie FE Credit, Momo, Viet Credit und Sacombank Wege finden, Tausende von Kunden zu erreichen. Vbee erhielt hier eine Chance: Von Mahnungen bis hin zu automatischen Antworten erwiesen sich die Produkte des Unternehmens schnell als optimale Lösung. Virtuelle Assistenten und virtuelle Callcenter erwirtschafteten damals bis zu 80 % des Umsatzes von Vbee.

Als die Pandemie vorüber war und die Weltwirtschaft schwächelte, stand Vbee vor einer neuen Herausforderung. Die Welle der generativen KI (GenAI) und digitaler Content-Trends belebte das TTS-Tool neu. Heute sind die KI-Stimmen von Vbee allgegenwärtig – von TikTok über YouTube bis hin zu Facebook.

„Wir stellen derzeit viele TTS-Inhalte bereit“, erklärte Herr Ho Minh Duc stolz. Die Zahl der tatsächlichen Vbee-Nutzer liegt aktuell bei über zwei Millionen, und diese Zahl steigt weiterhin monatlich um 20 %.

Vbee hat über 20 hochwertige Unternehmensstimmen trainiert und, wenn man benutzerdefinierte Stimmen mitzählt, über 200 verschiedene KI-Stimmen erstellt.

Mit der neuen Sprachtranskriptionstechnologie, die kürzlich erforscht und getestet wurde, sind zum Trainieren einer neuen Stimme jetzt nur noch 3 Minuten aufgezeichneter Daten erforderlich, statt wie vor zwei Jahren noch 4 bis Dutzende Stunden Aufzeichnung.

Vbee và nỗ lực chắp cánh cho tiếng Việt - Ảnh 2.

CEO Ho Minh Duc und Chief Technology Officer Nguyen Thi Thu Trang – zwei Gründer der Vbee Data Solutions and Services Joint Stock Company – Foto: NVCC

„Wir verstehen Vietnamesisch besser“

Im Wettlauf um die Sprachsynthesetechnologie sieht CEO Ho Minh Duc eine Zeit, in der die Bemühungen um technologische Innovationen allmählich an ihre Grenzen stoßen werden.

Ihm zufolge entwickelt Vbee nicht nur eine Kerntechnologie zur Verarbeitung vietnamesischer Sprache, sondern baut auch ein Technologiesystem auf, das in der Lage ist, die vietnamesische Sprache gründlich zu verstehen – mit all ihren Feinheiten, Tönen und der einzigartigen Kultur, die nur echte Vietnamesen vollständig verstehen können.

Als führendes Unternehmen im vietnamesischen TTS-Markt sind die beiden Geschäftsführer von Vbee überzeugt, dass ihr Tool zum Standard für KI-Sprachausgabe für Vietnamesisch geworden ist. Nutzer schätzen nicht nur die Genauigkeit, sondern spüren auch die Emotion in jeder von Vbee entwickelten Stimme.

Im Vietnamesischen beispielsweise hat allein das Wort „Gasse“ je nach Region viele verschiedene Namen, etwa „hèm“, „kiệt“, „xếc“ – jedes Wort hat eine andere Nuance, die die KI verstehen muss.

Um dies zu erreichen, hat Vbee massiv in das Sammeln von Beispieldatensätzen sowie in leistungsstarke Serversysteme für das KI-Training investiert.

„Damit die KI jede regionale Nuance richtig verstehen und verarbeiten kann, mussten wir unzählige Beispielsätze erstellen und die Kosten für den Verarbeitungsserver waren zudem sehr hoch“, erklärte CEO Ho Minh Duc.

Dr. Nguyen Thi Thu Trang hat mehr als 15 Jahre lang die TTS-Technologie von Vbee erforscht, um die einzigartigen Töne und die Grammatik des Vietnamesischen zu entschlüsseln. Für sie ist ihre Muttersprache eine subtile Welt voller ausdrucksstarker Nuancen.

„Meine vietnamesische Sprache ist sehr komplex und interessant, die Töne sind die schwierigsten und unterscheiden sich von vielen anderen populären Sprachen der Welt. Je besser ich die Sprache verstehe, desto genauer wird mein Modell sein“, erklärte sie.

Vbee behauptet allmählich, dass sie im Technologiezeitalter ein unverzichtbarer Bestandteil von Tools und Geräten mit integrierter vietnamesischer Sprachverarbeitungssoftware sein werden.

Das Vbee-Team erforscht und entwickelt nicht nur Technologie in jedem Wort und jeder Stimme, sondern ist auch bestrebt, in seinen KI-Stimmen eine echte „vietnamesische Emotion“ zu erzeugen.

Der Name Vbee ist eine Abkürzung des Satzes „Vietnamese BE your Eyes“ (Vietnamesisch: Sei deine Augen) und stammt von meinem ursprünglichen Wunsch, ein Werkzeug zu entwickeln, das zu den „Augen“ von Sehbehinderten wird. Doch angesichts der aktuellen Entwicklung, bei der viele Menschen mehr aufs Hören als aufs Sehen umsteigen möchten, glauben wir, dass Vbee auch zu den „Augen“ aller werden wird.

Dr. Nguyen Thi Thu Trang (Dozentin, School of Information Technology, Hanoi University of Science and Technology, Gründerin und Technologiedirektorin der Vbee Company)

Treffen der Hörbuchliebhaber

Vbee entstand aus der Beziehung zwischen Dr. Nguyen Thi Thu Trang und der Blindengemeinschaft. Seit ihrer Studienzeit beteiligt sie sich an der Aufnahme von Hörbüchern und der Entwicklung eines vietnamesischen Vorleseprogramms zur Unterstützung blinder Menschen.

Diese Erfahrungen inspirierten sie zur Entwicklung einer vietnamesischen Lesesoftware – dem Vorgänger von Vbee. 2018 gründete sie zusammen mit Herrn Ho Minh Duc – einem Kommilitonen an der Hanoi University of Science and Technology mit Erfahrung aus dem Socbay.com-Projekt und der Digitalisierung von Hörbüchern – Vbee, einen Pionier auf dem Gebiet der Text-to-Speech-Konvertierung in Vietnam.

Vbees herausragende Erfolge

- Erster Preis der Qualcomm Vietnam Innovation Challenge 2024

- Sonderpreis Tuoi Tre Start-up Award 2023

- Gewinner-Start-up im Grab Venture Ignite 2020 Accelerator-Programm

- Erster Preis des vietnamesischen Talents 2018, zweiter Preis des vietnamesischen Talents 2020

- Zertifikat für vietnamesische Kerntechnologie im Nationalen Programm zur digitalen Transformation 2025 – 2030 des Ministeriums für Information und Kommunikation

– Gewinnerprojekt beim Vietnam Digital Media Award 2018 und Vingroup Fund 2019.

Regionale Vision

Nachdem Vbee seine Position auf dem vietnamesischen Markt gefestigt hat, strebt das Unternehmen eine Expansion nach Südostasien an und plant, seine TTS-Technologie bis 2026 in Länder wie Laos, Thailand, Kambodscha und die Philippinen zu bringen.

Laut Dr. Nguyen Thi Thu Trang wird der schnelle technologische Fortschritt mit der Entstehung mehrsprachiger Modelle die Entwicklung von TTS-Tools für andere Sprachen erleichtern.

Derzeit erforscht sie Sprachtechnologien für Thailändisch, Chinesisch und Englisch und eröffnet Vbee damit neue Möglichkeiten auf dem internationalen Markt.

Vbee và nỗ lực chắp cánh cho tiếng Việt - Ảnh 3. Vietnamesisches Start-up auf dem AI Summit Paris ausgezeichnet

Enfarm, ein Start-up für künstliche Intelligenz (KI)-Technologie für die vietnamesische Landwirtschaft, ist einer von vier asiatischen Vertretern unter den 50 Projekten, die am 10. und 11. Februar auf dem AI Action Summit in Paris (Frankreich) vorgestellt wurden.


[Anzeige_2]
Quelle: https://tuoitre.vn/vbee-va-no-luc-chap-canh-cho-tieng-viet-20250217102146767.htm

Kommentar (0)

No data
No data

Gleiches Thema

Gleiche Kategorie

Feuerwerk explodiert, Tourismus nimmt zu, Da Nang punktet im Sommer 2025
Erleben Sie nächtliches Tintenfischangeln und Seesternbeobachtung auf der Perleninsel Phu Quoc
Entdecken Sie den Herstellungsprozess des teuersten Lotustees in Hanoi
Bewundern Sie die einzigartige Pagode aus über 30 Tonnen Keramikstücken in Ho-Chi-Minh-Stadt

Gleicher Autor

Erbe

Figur

Geschäft

No videos available

Nachricht

Politisches System

Lokal

Produkt