Nachdem Sie für ein großes Unternehmen im Bereich der künstlichen Intelligenz in den USA gearbeitet haben, warum haben Sie sich entschieden, nach Vietnam zurückzukehren und bei VinBigdata einzusteigen?
Während meiner Tätigkeit in den USA war ich zwar an vielen großen Regierungsprojekten beteiligt, doch meine Ergebnisse stellten oft nur wenige Schritte in einem größeren Prozess dar. Aufgrund der strengen Vertraulichkeit der Projekte wusste ich häufig nicht einmal, wie die von mir entwickelten Lösungen tatsächlich eingesetzt wurden.
Als ich 2017 nach Vietnam zurückkehrte, befand sich das Land in einer Entwicklungsphase, und es gab viele ungelöste Probleme im Bereich Big Data und Künstliche Intelligenz. Ich nahm die Einladung von Professor Vu Ha Van an, gemeinsam mit ihm das Ziel zu verwirklichen, vietnamesische Technologielösungen zu entwickeln, die das Leben der vietnamesischen Bevölkerung verbessern. Meine Rückkehr nach Vietnam war für mich dadurch umso bedeutsamer, da ich an Problemen mit größerer Tragweite arbeiten konnte.
Dr. Dao Duc Minh in einem Workshop
Welche Rolle und welchen Einfluss spielt Big Data in der Strategie zur Entwicklung künstlicher Intelligenz, Herr?
Daten spielen eine entscheidende Rolle beim Training künstlicher Intelligenz. Das Training eines hochwertigen KI-Modells beginnt oft mit dem Training einer großen Datenbank. Um also qualitativ hochwertige KI zu erhalten, benötigen wir zunächst gute Daten.
Gute Daten müssen hinsichtlich Quantität und Umfang, Qualität, Vielfalt und Universalität bestimmte Standards erfüllen. Die Erfassung und Verarbeitung tausender Stunden an Rohdaten – von der Datenbereinigung bis hin zur Erzeugung qualitativ hochwertiger Daten für KI-Modelle – ist sehr aufwendig und komplex. Umgekehrt ist für die Analyse von Big Data der Einsatz von KI unerlässlich, um eine präzise Datenverarbeitung in großem Umfang zu gewährleisten und so bessere, aussagekräftigere oder prädiktive Ergebnisse zu erzielen.
Beispielsweise mussten wir im Rahmen der Entwicklung eines virtuellen Assistenten für Vietnamesen (ViVi) zehntausende Stunden hochwertiger Audiodaten sammeln und verarbeiten, die von Hunderttausenden Stimmen aus verschiedenen Regionen, unterschiedlichen Alters und Geschlechts stammten und Inhalte aus Hunderten von Fachgebieten umfassten...
Oder, um nur ein Beispiel zu nennen, die Einführung von ViGPT – der ersten vietnamesischen Version von ChatGPT für Endnutzer. ViGPT basiert auf einem umfangreichen Sprachmodell, das vollständig im Besitz von VinBigdata ist. Dieses Modell wurde anhand von 600 GB aufbereiteter vietnamesischer Daten aus verschiedenen Bereichen trainiert. Dank unseres Verständnisses vietnamesischer Daten und der Sprache konnten wir die Einführungszeit von ViGPT auf nur neun Monate nach der Entwicklung von ChatGPT verkürzen.
Das ist die Synergie zwischen Big Data und künstlicher Intelligenz.
Wie stehen Sie dazu, Forschung mit praktischem Nutzen für die Gemeinschaft zu verknüpfen?
Ich glaube, dass Technologieforschung nur dann wirklich erfolgreich ist, wenn sie tatsächlich Einzug in den Alltag hält, soziale Probleme löst und das Leben der Menschen verbessert.
Um praxisnahe, kommerzielle Produkte zu entwickeln, die wirtschaftliche und soziale Probleme lösen, müssen wir stets aufmerksam sein und uns die Frage stellen: Welchen Wert bringen die Daten in die Praxis?
Bis heute haben wir eine Vielzahl von Produkten und Lösungen für verschiedene Branchen und Bereiche erforscht und entwickelt, typischerweise ViGPT, VinDr – die KI-Lösungen in der medizinischen Bilddiagnostik bereitstellen, VinBase – eine Plattform für bio-künstliche Intelligenz – oder Vizone – ein intelligentes Lösungsset für die Bildanalyse.
Mit wichtigen Mitarbeitern von VinBigdata bei einer Veranstaltung der Vingroup Corporation
Die vierte industrielle Revolution schreitet weltweit rasant voran. Welche Vorteile sehen Sie für Vietnam?
Im Vergleich zu früheren Revolutionen verfügt Vietnam meiner Ansicht nach derzeit über viele Vorteile, um in der Industrie 4.0 einen Durchbruch zu erzielen und seine Position auf der Weltkarte zu verbessern. Die beiden Schlüssel zum Erreichen dieses Ziels sind Daten und Menschen.
Vietnam hat derzeit fast 100 Millionen Einwohner, von denen ein hoher Anteil junger Menschen Smartphones und PCs nutzt. Darüber hinaus verfügen wir über anerkannte Experten im Bereich der künstlichen Intelligenz, qualifizierte Nachwuchskräfte in der Informationstechnologie und ein sehr gutes mathematisches Fundament.
Welche Einschränkungen gibt es also?
Die erste offensichtliche Einschränkung besteht darin, dass wir trotz einer großen Bevölkerung immer noch Schwierigkeiten haben, Daten zu beherrschen, insbesondere Daten in Einrichtungen, Geschäfts- und Verwaltungseinheiten zu standardisieren und zu synchronisieren.
Darüber hinaus stehen wir vor weiteren Einschränkungen, wie etwa begrenzten Investitionsmitteln, insbesondere für Investitionen in Hochleistungsrechnerinfrastruktur.
Welche Rolle spielt Ihrer Meinung nach die Beherrschung vietnamesischer Daten auf dem Weg zur Entwicklung und Anwendung von Technologien, die dem Leben der vietnamesischen Bevölkerung dienen?
Weltweit gibt es derzeit viele führende KI-Produkte, typischerweise KI-Anwendungen, die auf großen Sprachmodellen wie ChatGPT von OpenAI oder Bard von Google basieren. Vietnamesisch ist jedoch nicht die Hauptsprachgruppe für die Entwicklung dieser Produkte.
Daher wird die Qualität der den Nutzern zurückgegebenen vietnamesisch-spezifischen Inhalte mehr oder weniger beeinträchtigt und birgt ein hohes Fehlerrisiko, insbesondere hinsichtlich grundlegender Wissenslücken.
Als Vietnamesen haben wir den Vorteil, auf unsere eigenen Datenquellen zugreifen zu können. Nur wir sind in der Lage, die Besonderheiten vietnamesischer Daten sowie die Bedürfnisse und Merkmale der vietnamesischen Bevölkerung zu verstehen. Daher ist die Beherrschung vietnamesischer Daten der Schlüssel zur Beherrschung von Kerntechnologien – jener Technologien, die den Vietnamesen dienen werden.
Interne Schulung für VinBigdata-Mitglieder
Wie kann man auf bestimmte Datenquellen zugreifen, insbesondere da die meisten Vietnamesen heutzutage soziale Netzwerke aus dem Ausland nutzen?
Tatsächlich stammen die meisten Humandaten heutzutage (nicht nur von Vietnamesen) aus dem Internet und den sozialen Netzwerken. Dennoch können wir, basierend auf dem Verständnis der vietnamesischen Datenmerkmale und den jeweiligen Projektvorgaben, weiterhin Daten aus verschiedenen Quellen abrufen und sammeln.
Die GPT-Modelle von OpenAI beispielsweise verfügen über Hunderte, ja sogar Billionen von Parametern, werden mit riesigen Datenmengen trainiert und kosten Milliarden von Dollar. Im Vergleich dazu haben wir basierend auf unserer Forschung, unseren Fähigkeiten und Ressourcen einen völlig anderen Weg gewählt: Wir haben ein vietnamesisches Sprachmodell mit einer Architektur von nur wenigen Milliarden Parametern entwickelt, das mit einem 600 GB großen vietnamesischen Datensatz trainiert wurde, den wir selbst erstellt und optimiert haben. Es bietet jedoch vergleichbare Fähigkeiten zur Verarbeitung vietnamesischer Texte. Die Ergebnisse zeigen, dass unsere selbstentwickelte Architektur sich selbst optimieren kann, die Trainingszeit des Sprachmodells verkürzt, die Kosten senkt und gleichzeitig die Modellqualität sicherstellt.
Welche Herausforderungen sind Ihnen und Ihrem Team bei der Forschung und Entwicklung von Produkten im Bereich der künstlichen Intelligenz begegnet?
Die erste Herausforderung ist zweifellos der Zeitfaktor. Die Welle der künstlichen Intelligenz rast rasant heran und befindet sich in einer Phase explosionsartiger Entwicklung. Weltweit haben führende Technologieunternehmen in kürzester Zeit hochentwickelte Produkte auf den Markt gebracht, die ständig aktualisiert und verbessert werden. Wenn wir zu langsam sind und Produkte nicht rechtzeitig einführen, werden wir unweigerlich ins Hintertreffen geraten.
Wenn wir andererseits Produkte entwickeln wollen, die anwendbar sind und praktische soziale Probleme lösen können, müssen wir auch die herausragenden, besonderen und einzigartigen Merkmale des Produkts ermitteln und weiterentwickeln.
Präsentation am Vietnam Artificial Intelligence Day (AI4VN 2023)
Tatsächlich haben viele Einzelpersonen und Organisationen in Vietnam und weltweit durch Datenlecks große Verluste erlitten. Wie beurteilen Sie das Thema Datensicherheit?
Man kann sagen, dass jede Anwendung heutzutage auf Daten basiert. Bei der Arbeit mit Daten müssen wir einerseits das Ziel verfolgen, mithilfe von Daten die beste Technologie für das Leben zu entwickeln, und andererseits die Datensicherheit für Einzelpersonen und Organisationen gewährleisten.
Der menschliche Faktor ist ein entscheidendes Glied im Prozess der Datensicherheitsgewährleistung. Dazu gehören Entwickler, Produktanwender und Endnutzer. Für Entwickler muss das Bewusstsein für Datensicherheit von Beginn der Datenerfassung und -verarbeitung an vorhanden sein.
Oftmals ist uns die Bedeutung von Datensicherheit nicht bewusst, solange keine Probleme auftreten. Doch wenn es zu einem Datenleck kommt, kann der Schaden enorm sein. Datenlecks können durch technische Probleme oder gezielte Angriffe zum Datendiebstahl entstehen. In solchen Fällen können die Daten von Einzelpersonen oder Organisationen von Kriminellen für illegale Zwecke missbraucht werden, und Unternehmen können finanzielle Verluste durch die Behebung der entstandenen Probleme erleiden und sogar einen Imageschaden erleiden.
Dr. Dao Duc Minh und das VinBigdata-Team bei einer Veranstaltung
Nach dem Bestreben, die Technologie zum Wohle des vietnamesischen Volkes zu beherrschen, werden Schritte folgen, um sich international zu etablieren?
Jede Organisation oder jedes Unternehmen, das seine Produkte auf dem internationalen Markt anbieten möchte, muss internationale Standards einhalten. VinBigdata verfügt über Stärken in den Bereichen Lösungen und Technologie, daher ist die Vision, den Weltmarkt zu erobern, naheliegend.
Um die Lösung für viele verschiedene Produkte und Anwendungen einzusetzen, ist es selbstverständlich notwendig, die Unterstützung internationaler Einheiten mit langjähriger Erfahrung und einem tiefen Verständnis für die Bedürfnisse der Nutzer weltweit zu haben.
Danke schön!
Quelle: https://thanhnien.vn/ts-dao-duc-minh-lam-chu-du-lieu-viet-la-buoc-dau-phat-trien-va-nam-giu-cong-nghe-viet-18524052710263732.htm






Kommentar (0)