Vietnam.vn - Nền tảng quảng bá Việt Nam

„Opanowanie danych wietnamskich to pierwszy krok w rozwijaniu i opanowywaniu wietnamskiej technologii”

Báo Thanh niênBáo Thanh niên27/05/2024

[reklama_1]
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 1.

Pracowałeś dla dużej amerykańskiej organizacji zajmującej się sztuczną inteligencją. Dlaczego zdecydowałeś się wrócić do Wietnamu i dołączyć do VinBigdata?

Pracując w Stanach Zjednoczonych, mimo że brałem udział w wielu dużych projektach rządowych , osiągane przeze mnie rezultaty często ograniczały się do kilku etapów dużego procesu. Ze względu na ścisłą poufność projektów, często nie wiedziałem nawet, jak wykorzystywane są opracowane przeze mnie rozwiązania.

W 2017 roku, kiedy wróciłem do Wietnamu, system znajdował się w fazie rozwoju i istniało wiele problemów związanych z dużymi zbiorami danych i sztuczną inteligencją, które należało rozwiązać. Przyjąłem zaproszenie profesora Vu Ha Vana, aby wspólnie zrealizować cel, jakim jest opracowanie wietnamskich rozwiązań technologicznych, które będą służyć życiu Wietnamczyków. Mój powrót do Wietnamu był dla mnie o wiele bardziej wartościowy, ponieważ mogłem pracować nad problemami o większym wpływie.

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 2.

Dr Dao Duc Minh w warsztacie

Panie, jaką rolę i wpływ odgrywają, Panie, big data w strategii rozwoju sztucznej inteligencji?

Dane odgrywają ogromną i cenną rolę w szkoleniu sztucznej inteligencji. Szkolenie wysokiej jakości modelu sztucznej inteligencji często zaczyna się od trenowania dużej bazy danych. Dlatego, aby stworzyć wysokiej jakości sztuczną inteligencję, najpierw potrzebujemy dobrych danych.

Dobre dane muszą spełniać standardy pod względem ilości i skali, jakości, różnorodności i uniwersalności. Proces gromadzenia i przetwarzania tysięcy godzin danych z etapu oczyszczania danych surowych w celu uzyskania danych najwyższej jakości, które następnie trafiają do modeli sztucznej inteligencji, jest bardzo kosztowny i złożony. Natomiast analiza dużych zbiorów danych wymaga wykorzystania sztucznej inteligencji, aby zapewnić możliwość dokładnego przetwarzania danych na dużą skalę, a tym samym uzyskiwania lepszych wyników decyzyjnych lub predykcyjnych.

Przykładowo, w trakcie opracowywania produktu w postaci wirtualnego asystenta dla Wietnamczyków (ViVi) musieliśmy zebrać i przetworzyć dziesiątki tysięcy godzin wysokiej jakości danych audio, pochodzących od setek tysięcy osób z różnych regionów, w różnym wieku i o różnej płci, z treściami obejmującymi setki dziedzin...

A ostatnio, wprowadzenie ViGPT – „pierwszej wietnamskiej wersji ChatGPT dla użytkowników końcowych” – opracowanej na podstawie modelu Large Language Model, w całości należącego do VinBigdata. Model ten jest trenowany w oparciu o 600 GB udoskonalonych danych wietnamskich z wielu różnych dziedzin. Dzięki naszej wiedzy na temat danych i języka wietnamskiego, znaleźliśmy nowe podejście, aby skrócić czas wdrożenia ViGPT w ciągu zaledwie 9 miesięcy od momentu powstania ChatGPT.

To synergia pomiędzy dużymi zbiorami danych i sztuczną inteligencją.

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 3.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 4.

Jak postrzegasz łączenie badań z wartościami praktycznymi w celu służenia społeczeństwu?

- Wierzę, że badania naukowe w dziedzinie technologii odnoszą prawdziwy sukces tylko wtedy, gdy faktycznie wchodzą w życie, rozwiązują problemy społeczne i poprawiają życie ludzi.

Aby tworzyć praktyczne produkty komercyjne rozwiązujące problemy biznesowe i społeczne, musimy zawsze zwracać uwagę i zadawać sobie pytanie: jaką wartość dane wniosą do życia?

Do tej pory przeprowadziliśmy badania i opracowaliśmy szereg produktów i rozwiązań dla różnych branż i obszarów. Wśród nich znajdują się: ViGPT, VinDr – dostawca rozwiązań AI do diagnostyki obrazowej w medycynie , VinBase – platforma biosztucznej inteligencji, czy Vizone – zestaw rozwiązań do inteligentnej analizy obrazów.

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 5.

Z kluczowymi pracownikami VinBigdata na wydarzeniu Vingroup Corporation

Czwarta rewolucja przemysłowa ma silny wpływ na skalę globalną. Jakie Twoim zdaniem atuty ma Wietnam?

W porównaniu z poprzednimi rewolucjami, uważam, że Wietnam ma obecnie wiele atutów, które pozwolą mu przebić się w rewolucji przemysłowej 4.0, przyczyniając się do poprawy pozycji kraju na mapie świata. Kluczem do osiągnięcia tego celu są dane i ludzie.

Wietnam liczy obecnie prawie 100 milionów mieszkańców, z czego znaczna część młodych ludzi korzysta z telefonów i komputerów osobistych. Ponadto mamy renomowanych ekspertów w dziedzinie sztucznej inteligencji i wykwalifikowaną młodą kadrę w dziedzinie technologii informatycznych, a także bardzo dobre podstawy matematyczne.

Jakie są zatem ograniczenia?

Pierwszym oczywistym ograniczeniem jest to, że pomimo dużej populacji, nadal mamy trudności z zarządzaniem danymi, a w szczególności ze standaryzacją i synchronizacją danych w placówkach, firmach i jednostkach administracyjnych.

Ponadto musimy stawić czoła innym ograniczeniom, takim jak ograniczone zasoby inwestycyjne, zwłaszcza w zakresie inwestycji w infrastrukturę obliczeniową o wysokiej wydajności.

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 6.

Twoim zdaniem, jak ważną rolę odgrywa opanowanie wietnamskich danych w procesie tworzenia i opanowywania technologii służącej życiu Wietnamczyków?

Obecnie na świecie istnieje wiele wiodących produktów AI, zazwyczaj aplikacji opartych na rozbudowanych modelach językowych, takich jak ChatGPT firmy OpenAI czy Bard firmy Google. Jednak język wietnamski nie jest główną grupą językową w rozwoju tych produktów.

W związku z tym jakość treści w języku wietnamskim zwracanych użytkownikom jest w mniejszym lub większym stopniu obniżona i istnieje duże prawdopodobieństwo występowania błędów, a co bardziej niebezpieczne, błędów w podstawowej wiedzy.

Jako Wietnamczycy, mamy przewagę w postaci dostępu do własnych źródeł danych. Tylko my potrafimy zrozumieć specyfikę danych wietnamskich, potrzeby i cechy Wietnamczyków. Dlatego też, opanowanie wietnamskich danych jest kluczem do opanowania kluczowych technologii, które będą służyć Wietnamczykom.

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 7.

Szkolenia wewnętrzne dla członków VinBigdata

Jak uzyskać dostęp do konkretnych źródeł danych, zwłaszcza że większość Wietnamczyków korzysta obecnie z zagranicznych serwisów społecznościowych?

W rzeczywistości największym źródłem danych o ludziach (nie tylko Wietnamczykach) jest obecnie internet i sieci społecznościowe. Nadal jednak możemy uzyskiwać dostęp do danych i gromadzić je z różnych źródeł, w oparciu o zrozumienie cech danych wietnamskich, w zależności od charakterystyki danego projektu.

Na przykład modele GPT OpenAI mają setki, a nawet biliony parametrów, są trenowane na ogromnych ilościach danych i kosztują miliardy dolarów. W porównaniu z nimi, obraliśmy zupełnie inną ścieżkę, biorąc pod uwagę nasze badania, możliwości i zasoby: stworzyliśmy model języka wietnamskiego z architekturą liczącą zaledwie kilka miliardów parametrów, trenowany na 600-gigabajtowym zbiorze danych wietnamskich, który sami zebraliśmy i udoskonaliliśmy, ale z równoważnymi możliwościami przetwarzania języka wietnamskiego. Wyniki pokazują, że nasza samodzielnie opracowana architektura może się samooptymalizować, skracać czas trenowania modelu językowego, obniżać koszty, a jednocześnie zapewniać jakość modelu.

Jakie wyzwania napotkałeś Ty i Twój zespół w trakcie badania i rozwoju produktów wykorzystujących sztuczną inteligencję?

Pierwszym wyzwaniem jest z pewnością czas. Fala technologii sztucznej inteligencji nadchodzi bardzo szybko i przeżywa okres eksplozji. Wiodące firmy technologiczne na świecie szybko wprowadzają na rynek wysoce kompletne produkty, stale aktualizowane i ulepszane. Jeśli będziemy powolni i nie wprowadzimy produktów na czas, z pewnością zostaniemy w tyle.

Z drugiej strony, jeśli chcemy tworzyć produkty, które znajdą zastosowanie w praktyce i rozwiążą praktyczne problemy społeczne, musimy także wziąć pod uwagę znalezienie i rozwinięcie wyjątkowych, szczególnych i unikalnych cech produktu.

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 8.

Prezentacja na Wietnamskim Dniu Sztucznej Inteligencji (AI4VN 2023)

W rzeczywistości wiele osób i organizacji w Wietnamie i na całym świecie poniosło ogromne straty w wyniku wycieku danych. Jak postrzega Pan kwestię bezpieczeństwa danych?

Można powiedzieć, że każde dzisiejsze zastosowanie pochodzi z danych. Pracując z danymi, z jednej strony musimy dążyć do wykorzystania danych do stworzenia najlepszej technologii dla życia, a z drugiej strony musimy zapewnić bezpieczeństwo danych osobom i organizacjom.

Czynnik ludzki jest niezwykle ważnym ogniwem w procesie zapewniania bezpieczeństwa danych. Należą do nich programiści, użytkownicy produktów i użytkownicy. Świadomość bezpieczeństwa danych musi być obecna u programistów od samego początku gromadzenia i przetwarzania danych.

Często, gdy nie występuje żaden problem, nie zdajemy sobie sprawy z wagi bezpieczeństwa danych. Jednak w przypadku wycieku danych, szkody mogą być ogromne. Wycieki danych mogą być spowodowane problemami technicznymi lub celowymi atakami mającymi na celu kradzież danych. W przypadku wycieku danych, dane osób fizycznych lub organizacji mogą zostać wykorzystane przez cyberprzestępców do nielegalnych celów, a firmy mogą ponieść straty finansowe w związku z naprawą problemów, a nawet zaszkodzić swojej marce.

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 9.

Dr Dao Duc Minh i zespół VinBigdata na wydarzeniu

Czy po dążeniu do opanowania technologii, która miałaby służyć narodowi wietnamskiemu, nastąpią kroki w kierunku rozszerzenia jej na cały świat?

Każda organizacja lub firma, która chce wprowadzić swoje produkty na rynek międzynarodowy, musi przestrzegać międzynarodowych standardów. VinBigdata ma mocne strony w zakresie rozwiązań i technologii, więc wizja podboju świata jest naturalna.

Oczywiście, aby wdrożyć wiele różnych produktów i aplikacji, konieczne jest wsparcie międzynarodowych jednostek z wieloletnim doświadczeniem i zrozumieniem użytkowników na całym świecie.

Dziękuję!



Source: https://thanhnien.vn/ts-dao-duc-minh-lam-chu-du-lieu-viet-la-buoc-dau-phat-trien-va-nam-giu-cong-nghe-viet-18524052710263732.htm

Komentarz (0)

No data
No data

W tym samym temacie

W tej samej kategorii

Wietnam wygrywa konkurs muzyczny Intervision 2025
Korek na Mu Cang Chai do wieczora, turyści gromadzą się, by polować na dojrzały ryż w sezonie
Spokojny, złoty sezon Hoang Su Phi w wysokich górach Tay Con Linh
Wieś w Da Nang w pierwszej pięćdziesiątce najpiękniejszych wiosek na świecie w 2025 roku

Od tego samego autora

Dziedzictwo

Postać

Biznes

No videos available

Aktualności

System polityczny

Lokalny

Produkt