Vietnam.vn - Nền tảng quảng bá Việt Nam

Dr. Dao Duc Minh: „Die Beherrschung vietnamesischer Daten ist der erste Schritt zur Entwicklung und Beherrschung vietnamesischer Technologie.“

Báo Thanh niênBáo Thanh niên27/05/2024

Bild Nachdem Sie für ein großes KI-Unternehmen in den USA gearbeitet haben, warum haben Sie sich entschieden, nach Vietnam zurückzukehren und VinBigdata beizutreten? Während meiner Zeit in den USA war ich zwar an vielen großen Regierungsprojekten beteiligt, doch meine Ergebnisse beschränkten sich oft auf wenige Schritte in einem komplexen Verarbeitungsprozess. Aufgrund der strengen Vertraulichkeitsrichtlinien der Projekte wusste ich häufig nicht einmal, wie die von mir entwickelten Lösungen tatsächlich eingesetzt wurden. 2017 kehrte ich nach Vietnam zurück, als sich das Land in einer Entwicklungsphase befand und es viele Probleme im Bereich Big Data und Künstliche Intelligenz gab, die gelöst werden mussten. Ich nahm die Einladung von Professor Vu Ha Van an, um gemeinsam das Ziel zu verwirklichen, vietnamesische Technologielösungen zu entwickeln, die dem Leben der vietnamesischen Bevölkerung dienen. Meine Rückkehr nach Vietnam empfinde ich als viel sinnvoller, da ich nun an Problemen mit größerer Tragweite arbeiten kann.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 2.

Dr. Dao Duc Minh in einem Workshop

NVCC

Welche Rolle und welchen Einfluss haben Big Data in der Strategie zur Entwicklung künstlicher Intelligenz? Daten spielen eine entscheidende Rolle beim Training künstlicher Intelligenz. Um ein hochwertiges KI-Modell zu entwickeln, beginnen wir oft mit dem Training einer großen Datenbank. Daher benötigen wir für qualitativ hochwertige KI zunächst gute Daten. Gute Daten müssen bestimmte Standards hinsichtlich Quantität und Umfang, Qualität, Diversität und Universalität erfüllen. Die Sammlung und Verarbeitung von Tausenden von Stunden an Rohdaten, von der Datenbereinigung bis hin zur Erstellung qualitativ hochwertiger Daten für das KI-Modell, ist sehr aufwendig und komplex. Umgekehrt benötigen wir für die Analyse von Big Data künstliche Intelligenz, um die Daten in großem Umfang präzise verarbeiten zu können und so aussagekräftigere oder prädiktivere Ergebnisse zu erzielen. Beispielsweise mussten wir bei der Entwicklung des virtuellen Assistenten ViVi für Vietnamesen zehntausende Stunden hochwertiger Audiodaten sammeln und verarbeiten. Diese stammen von Hunderttausenden Stimmen aus verschiedenen Regionen, Altersgruppen und Geschlechtern und decken Inhalte aus Hunderten von Fachgebieten ab. Oder, um nur ein Beispiel zu nennen: die Einführung von ViGPT – der ersten vietnamesischen Version von ChatGPT für Endnutzer. ViGPT basiert auf einem umfangreichen Sprachmodell, das vollständig im Besitz von VinBigdata ist. Dieses Modell wurde mit 600 GB aufbereiteten vietnamesischen Daten aus verschiedensten Bereichen trainiert. Dank unseres Verständnisses vietnamesischer Daten und der Sprache konnten wir die Einführungszeit von ViGPT auf nur neun Monate nach der Entwicklung von ChatGPT verkürzen. Dies ist die perfekte Verbindung zwischen Big Data und künstlicher Intelligenz.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 3.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 4.
Wie stehen Sie zur Verknüpfung von Forschung und praktischem Nutzen für die Gesellschaft? – Ich glaube, dass Technologieforschung nur dann wirklich erfolgreich ist, wenn sie tatsächlich Anwendung findet, soziale Probleme löst und das Leben der Menschen verbessert. Um praxisnahe Produkte zu entwickeln und wirtschaftliche sowie gesellschaftliche Herausforderungen zu bewältigen, müssen wir uns stets fragen: Welchen Nutzen bringen die Daten in der Praxis? Bisher haben wir eine Vielzahl von Produkten und Lösungen in verschiedenen Bereichen und Berufsfeldern erforscht, darunter ViGPT, VinDr – KI-Lösungen für die medizinische Bilddiagnostik, VinBase – eine Plattform für künstliche Intelligenz – und Vizone – intelligente Bildanalyselösungen.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 5.

Mit wichtigen Mitarbeitern von VinBigdata bei einer Veranstaltung der Vingroup Corporation

NVCC

Die vierte industrielle Revolution schreitet weltweit rasant voran. Welche Vorteile sieht Vietnam Ihrer Meinung nach? Verglichen mit früheren Revolutionen verfügt Vietnam meiner Ansicht nach über viele Vorteile, um in dieser vierten industriellen Revolution den Durchbruch zu schaffen und seine Position auf der Weltkarte zu verbessern. Die beiden Schlüsselfaktoren hierfür sind Daten und die Bevölkerung. Vietnam hat derzeit fast 100 Millionen Einwohner, von denen ein hoher Anteil junger Menschen Smartphones und PCs nutzt. Darüber hinaus verfügen wir über anerkannte Experten im Bereich der künstlichen Intelligenz, junge und hochqualifizierte IT-Fachkräfte und ein sehr gutes mathematisches Fundament. Wo liegen also die Einschränkungen? Die erste Einschränkung besteht darin, dass wir trotz unserer großen Bevölkerung noch Schwierigkeiten haben, Daten zu beherrschen, insbesondere Daten in Betrieben, Unternehmen und Verwaltungseinheiten zu standardisieren und zu synchronisieren. Hinzu kommen weitere Herausforderungen wie begrenzte Investitionsmittel, insbesondere für Investitionen in Hochleistungsrechnerinfrastruktur.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 6.
Wie wichtig ist Ihrer Meinung nach die Beherrschung vietnamesischer Daten für die Entwicklung und den Einsatz von Technologien, die dem Leben der Vietnamesen dienen? Weltweit gibt es derzeit viele führende KI-Produkte, typischerweise KI-Anwendungen, die auf großen Sprachmodellen basieren, wie beispielsweise ChatGPT von OpenAI oder Bard von Google. Vietnamesisch gehört jedoch nicht zu den Kernsprachen dieser Produkte. Daher ist die Qualität der vietnamesischsprachigen Inhalte, die den Nutzern bereitgestellt werden, mehr oder weniger beeinträchtigt und birgt ein hohes Fehlerrisiko, insbesondere aufgrund von Fehlern im Grundlagenwissen. Wir Vietnamesen haben den Vorteil, auf unsere eigenen Datenquellen zugreifen zu können. Nur wir sind in der Lage, die Besonderheiten vietnamesischer Daten sowie die Bedürfnisse und Merkmale der vietnamesischen Bevölkerung zu verstehen. Die Beherrschung vietnamesischer Daten ist daher der Schlüssel zur Beherrschung von Kerntechnologien – jener Technologien, die den Vietnamesen letztendlich dienen werden.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 7.

Interne Schulung für VinBigdata-Mitglieder

NVCC

Wie greift man auf spezifische Datenquellen zu, insbesondere da die meisten Vietnamesen heutzutage soziale Netzwerke aus dem Ausland nutzen? Tatsächlich liegt die größte Quelle menschlicher Daten (nicht nur von Vietnamesen) heutzutage im Internet und in sozialen Netzwerken. Dennoch können wir, basierend auf dem Verständnis der vietnamesischen Datenmerkmale und den jeweiligen Projektvorgaben, Daten aus verschiedenen Quellen abrufen und sammeln. Beispielsweise verfügen die GPT-Modelle von OpenAI über Hunderte, ja sogar Billionen von Parametern, die mit riesigen Datenmengen trainiert wurden und Milliarden von Dollar gekostet haben. Im Vergleich dazu haben wir, basierend auf unserer Forschung, unseren Fähigkeiten und Ressourcen, einen völlig anderen Weg eingeschlagen: Wir haben ein vietnamesisches Sprachmodell mit einer Architektur von nur wenigen Milliarden Parametern entwickelt, das mit einem 600 GB großen vietnamesischen Datensatz trainiert wurde, den wir selbst erhoben und optimiert haben, und das dennoch vergleichbare Fähigkeiten in der Verarbeitung vietnamesischer Texte bietet. Die Ergebnisse zeigen, dass unsere selbstentwickelte Architektur sich selbst optimieren kann, die Trainingszeit des Sprachmodells verkürzt und die Kosten senkt, ohne die Modellqualität zu beeinträchtigen. Welchen Herausforderungen sind Sie und Ihr Team bei der Forschung und Entwicklung von Produkten im Bereich der künstlichen Intelligenz begegnet? Die größte Herausforderung ist sicherlich der Zeitfaktor. Die Welle der künstlichen Intelligenz rast rasant heran und befindet sich in einer Boomphase. Weltweit haben führende Technologieunternehmen in kürzester Zeit hochentwickelte Produkte auf den Markt gebracht, die ständig aktualisiert und verbessert werden. Wer zögert und Produkte nicht rechtzeitig einführt, wird unweigerlich ins Hintertreffen geraten. Umgekehrt müssen wir, wenn wir Produkte entwickeln wollen, die praktische gesellschaftliche Probleme lösen können, auch herausragende, besondere und einzigartige Merkmale identifizieren und ausbauen.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 8.

Präsentation am Vietnam Artificial Intelligence Day (AI4VN 2023)

NVCC

Tatsächlich haben viele Einzelpersonen und Organisationen in Vietnam und weltweit durch Datenlecks erheblichen Schaden erlitten. Wie beurteilen Sie das Thema Datensicherheit? Man kann sagen, dass jede Anwendung heutzutage auf Daten basiert. Bei der Arbeit mit Daten müssen wir einerseits das Ziel verfolgen, mithilfe von Daten die beste Technologie für unser Leben zu entwickeln, und andererseits die Datensicherheit für Einzelpersonen und Organisationen gewährleisten. Der menschliche Faktor ist dabei ein entscheidendes Glied. Dazu gehören Entwickler, Produktnutzer und Anwender. Entwickler müssen sich der Bedeutung von Datensicherheit von Beginn der Datenerfassung und -verarbeitung an bewusst sein. Oftmals ist uns die Wichtigkeit von Datensicherheit nicht bewusst, solange keine Probleme auftreten. Doch wenn es zu einem Datenleck kommt, kann der Schaden enorm sein. Datenpannen können durch technische Probleme oder vorsätzliche Datendiebstähle verursacht werden. Im Falle einer Datenpanne können die Daten von Einzelpersonen oder Organisationen von Kriminellen für illegale Zwecke missbraucht werden, während Unternehmen finanzielle Verluste durch die Behebung der entstandenen Probleme und sogar Imageschäden erleiden können.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 9.

Dr. Dao Duc Minh und das VinBigdata-Team bei einer Veranstaltung

NVCC

Nach dem Bestreben, die Technologie zum Wohle der vietnamesischen Bevölkerung zu beherrschen, werden sicherlich weitere Schritte folgen, um international erfolgreich zu sein. Jedes Unternehmen, das seine Produkte auf dem internationalen Markt anbieten möchte, muss internationale Standards erfüllen. VinBigdata verfügt über Stärken in den Bereichen Lösungen und Technologie, daher ist die Vision, die Welt zu erobern, nur folgerichtig. Um die vielfältigen Produkte und Anwendungen erfolgreich zu implementieren, ist die Zusammenarbeit mit internationalen Partnern unerlässlich, die über langjährige Erfahrung und ein tiefes Verständnis für die Bedürfnisse der Nutzer weltweit verfügen. Vielen Dank!

Thanhnien.vn

Quelle: https://thanhnien.vn/ts-dao-duc-minh-lam-chu-du-lieu-viet-la-buoc-dau-phat-trien-va-nam-giu-cong-nghe-viet-18524052710263732.htm

Kommentar (0)

No data
No data

Gleiches Thema

Gleiche Kategorie

Die Heldin der Arbeit, Thai Huong, wurde im Kreml direkt von Russlands Präsident Wladimir Putin mit der Freundschaftsmedaille ausgezeichnet.
Verloren im Feenmooswald auf dem Weg zur Eroberung von Phu Sa Phin
Heute Morgen präsentiert sich der Strandort Quy Nhon im Nebel wie ein „vertäumter“ Ort.
Die bezaubernde Schönheit von Sa Pa während der „Wolkenjagd“-Saison

Gleicher Autor

Erbe

Figur

Geschäft

Heute Morgen präsentiert sich der Strandort Quy Nhon im Nebel wie ein „vertäumter“ Ort.

Aktuelle Ereignisse

Politisches System

Lokal

Produkt