Vietnam.vn - Nền tảng quảng bá Việt Nam

'การเชี่ยวชาญข้อมูลของเวียดนามถือเป็นก้าวแรกในการพัฒนาและเชี่ยวชาญเทคโนโลยีของเวียดนาม'

Báo Thanh niênBáo Thanh niên27/05/2024


TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 1.

หลังจากที่ได้ทำงานให้กับองค์กรปัญญาประดิษฐ์ขนาดใหญ่แห่งหนึ่งในสหรัฐอเมริกา ทำไมคุณจึงตัดสินใจกลับบ้านเกิดเพื่อเข้าร่วม VinBigdata?

ในขณะที่ทำงานในสหรัฐอเมริกา แม้ว่าฉันจะมีส่วนร่วมในโครงการขนาดใหญ่ ของรัฐบาล หลายโครงการ แต่ผลลัพธ์ที่ฉันสร้างขึ้นมักจะเป็นเพียงขั้นตอนเล็กๆ น้อยๆ ในกระบวนการขนาดใหญ่ หลายครั้ง เนื่องจากโครงการต่างๆ ถูกเก็บเป็นความลับอย่างเคร่งครัด ฉันจึงไม่รู้ด้วยซ้ำว่าโซลูชันที่ฉันพัฒนาขึ้นนั้นถูกนำไปใช้อย่างไร

ในปี 2017 ฉันกลับไปเวียดนามในช่วงที่เวียดนามยังอยู่ในช่วงพัฒนา และมีปัญหาต่างๆ มากมายที่เกี่ยวข้องกับข้อมูลขนาดใหญ่และปัญญาประดิษฐ์ที่ต้องได้รับการแก้ไข ฉันยอมรับคำเชิญของศาสตราจารย์ Vu Ha Van เพื่อร่วมกันบรรลุเป้าหมายในการพัฒนาโซลูชันเทคโนโลยีของเวียดนามเพื่อรองรับชีวิตของชาวเวียดนาม ฉันพบว่าการกลับมาเวียดนามมีความหมายมากขึ้น เนื่องจากฉันจะสามารถทำงานในปัญหาที่มีผลกระทบมากขึ้นได้

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 2.

ดร. เดา ดึ๊ก มินห์ ในการประชุมเชิงปฏิบัติการ

ในกลยุทธ์การพัฒนาปัญญาประดิษฐ์ Big Data มีบทบาทและอิทธิพลอย่างไรครับ?

ข้อมูลมีบทบาทสำคัญอย่างมากในการฝึกปัญญาประดิษฐ์ การฝึกโมเดลปัญญาประดิษฐ์คุณภาพสูงมักเริ่มต้นด้วยการฝึกฐานข้อมูลขนาดใหญ่ ดังนั้น หากต้องการปัญญาประดิษฐ์ที่มีคุณภาพ เราต้องมีข้อมูลที่ดีเสียก่อน

ข้อมูลที่ดีต้องมีทั้งปริมาณ ขนาด คุณภาพ ความหลากหลาย และความเป็นสากล กระบวนการรวบรวมและประมวลผลข้อมูลหลายพันชั่วโมงตั้งแต่ขั้นตอนการทำความสะอาดข้อมูลดิบเพื่อสร้างข้อมูลที่มีคุณภาพสูงสุดเพื่อป้อนเข้าสู่โมเดลปัญญาประดิษฐ์นั้นมีค่าใช้จ่ายสูงและซับซ้อน ในทางตรงกันข้าม ในการวิเคราะห์ข้อมูลขนาดใหญ่ เราจำเป็นต้องใช้ปัญญาประดิษฐ์เพื่อให้แน่ใจว่าสามารถประมวลผลข้อมูลได้อย่างแม่นยำในระดับใหญ่ จึงสร้างผลลัพธ์ที่ชัดเจนหรือทำนายผลได้ดีขึ้น

ตัวอย่างเช่น ในกระบวนการพัฒนาผลิตภัณฑ์ผู้ช่วยเสมือนสำหรับชาวเวียดนาม (ViVi) เราต้องรวบรวมและประมวลผลข้อมูลเสียงคุณภาพสูงจำนวนหลายหมื่นชั่วโมง จากเสียงหลายแสนเสียงจากภูมิภาคต่างๆ อายุและเพศที่หลากหลาย โดยมีเนื้อหาที่ครอบคลุมหลายร้อยสาขา...

หรือล่าสุดคือการเปิดตัว ViGPT - "ChatGPT เวอร์ชันภาษาเวียดนามเวอร์ชันแรกสำหรับผู้ใช้ปลายทาง" ซึ่งพัฒนาจาก Large Language Model ที่ VinBigdata เป็นเจ้าของทั้งหมด โดยโมเดลนี้ได้รับการฝึกอบรมจากข้อมูลภาษาเวียดนามที่ผ่านการปรับแต่งแล้วจำนวน 600 GB จากหลากหลายสาขา ด้วยความเข้าใจของเราเกี่ยวกับข้อมูลและภาษาเวียดนาม เราจึงพบแนวทางใหม่ในการย่นระยะเวลาการเปิดตัว ViGPT ให้สั้นลงภายในเวลาเพียง 9 เดือนหลังจาก ChatGPT ถือกำเนิดขึ้น

นี่คือเสียงสะท้อนระหว่างข้อมูลขนาดใหญ่และปัญญาประดิษฐ์

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 3.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 4.

คุณมีความคิดเห็นอย่างไรเกี่ยวกับการเชื่อมโยงงานวิจัยกับมูลค่าเชิงปฏิบัติเพื่อให้บริการชุมชน?

- ฉันเชื่อว่าการวิจัยเทคโนโลยีจะประสบความสำเร็จอย่างแท้จริงได้ก็ต่อเมื่อมันนำมาใช้ในชีวิตจริง แก้ไขปัญหาด้านสังคม และปรับปรุงคุณภาพชีวิตของผู้คน

ในการสร้างผลิตภัณฑ์เชิงพาณิชย์ที่ใช้งานได้จริงซึ่งช่วยแก้ไขปัญหาทางธุรกิจและสังคม เราจะต้องใส่ใจและถามคำถามเสมอว่าข้อมูลจะสร้างมูลค่าอะไรให้กับชีวิต

จนถึงขณะนี้ เราได้วิจัยและพัฒนาผลิตภัณฑ์และโซลูชันต่างๆ มากมายสำหรับหลายอุตสาหกรรมและหลายสาขา โดยทั่วไปแล้วจะเป็น ViGPT, VinDr ที่ให้บริการโซลูชัน AI ในการวินิจฉัยด้วยภาพทางการ แพทย์ , VinBase ซึ่งเป็นแพลตฟอร์มปัญญาประดิษฐ์ทางชีวภาพ หรือ Vizone ซึ่งเป็นชุดโซลูชันการวิเคราะห์ภาพอัจฉริยะ

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 5.

พร้อมด้วยบุคลากรสำคัญของ VinBigdata ในงานของ Vingroup Corporation

การปฏิวัติอุตสาหกรรมครั้งที่ 4 เกิดขึ้นอย่างเข้มแข็งในระดับโลก คุณคิดว่าเวียดนามมีข้อได้เปรียบอะไรบ้าง?

หากเปรียบเทียบกับการปฏิวัติครั้งก่อนๆ ฉันเชื่อว่าเวียดนามมีข้อได้เปรียบหลายประการในการก้าวข้ามการปฏิวัติอุตสาหกรรม 4.0 ครั้งนี้ ซึ่งจะช่วยปรับปรุงตำแหน่งของประเทศบนแผนที่โลกได้ กุญแจสำคัญสองประการในการบรรลุเป้าหมายนี้คือข้อมูลและผู้คน

ปัจจุบันเวียดนามมีประชากรเกือบ 100 ล้านคน โดยคนหนุ่มสาวจำนวนมากใช้โทรศัพท์และคอมพิวเตอร์ส่วนบุคคล นอกจากนี้ เรายังมีผู้เชี่ยวชาญด้านปัญญาประดิษฐ์ที่มีชื่อเสียงและบุคลากรรุ่นใหม่ที่มีคุณภาพในด้านเทคโนโลยีสารสนเทศ และมีพื้นฐานทางคณิตศาสตร์ที่ดีมาก

แล้วมีข้อจำกัดอะไรบ้าง?

ข้อจำกัดที่เห็นได้ชัดประการแรกก็คือ แม้ว่าจะมีประชากรจำนวนมาก เราก็ยังคงประสบปัญหาในการควบคุมข้อมูล โดยเฉพาะการทำให้ข้อมูลเป็นมาตรฐานและซิงโครไนซ์ข้อมูลในสถานที่ หน่วยธุรกิจ และฝ่ายบริหาร

นอกจากนี้ เรายังเผชิญกับข้อจำกัดอื่นๆ เช่น ทรัพยากรการลงทุนที่จำกัด โดยเฉพาะการลงทุนในโครงสร้างพื้นฐานการประมวลผลประสิทธิภาพสูง

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 6.

ในความคิดของคุณ บทบาทของความเชี่ยวชาญข้อมูลของเวียดนามมีความสำคัญเพียงใดในการเดินทางสู่การสร้างและเชี่ยวชาญเทคโนโลยีเพื่อรองรับชีวิตของประชาชนชาวเวียดนาม?

ปัจจุบันมีผลิตภัณฑ์ปัญญาประดิษฐ์ชั้นนำมากมายจากทั่วโลก โดยทั่วไปแล้วผลิตภัณฑ์แอปพลิเคชันปัญญาประดิษฐ์เชิงสร้างสรรค์ที่ใช้โมเดลภาษาขนาดใหญ่ เช่น ChatGPT จาก OpenAI หรือ Bard จาก Google อย่างไรก็ตาม ภาษาเวียดนามไม่ใช่กลุ่มภาษาหลักสำหรับการพัฒนาผลิตภัณฑ์เหล่านี้

ดังนั้นคุณภาพของเนื้อหาเฉพาะภาษาเวียดนามที่ส่งคืนให้ผู้ใช้จึงได้รับผลกระทบมากหรือน้อยและมีความเสี่ยงต่อข้อผิดพลาดสูง และที่อันตรายกว่านั้นคือข้อผิดพลาดในความรู้พื้นฐาน

ในฐานะชาวเวียดนาม เรามีความได้เปรียบตรงที่สามารถเข้าถึงแหล่งข้อมูลของตนเองได้ เราเท่านั้นที่มีความสามารถในการเข้าใจลักษณะเฉพาะของข้อมูลเวียดนาม ความต้องการและลักษณะเฉพาะของชาวเวียดนาม ดังนั้น การเชี่ยวชาญข้อมูลของเวียดนามจึงเป็นกุญแจสำคัญในการเชี่ยวชาญเทคโนโลยีหลัก ซึ่งเป็นเทคโนโลยีที่จะให้บริการแก่ชาวเวียดนาม

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 7.

การฝึกอบรมภายในสำหรับสมาชิก VinBigdata

จะเข้าถึงแหล่งข้อมูลเฉพาะเจาะจงได้อย่างไร โดยเฉพาะอย่างยิ่งเมื่อคนเวียดนามส่วนใหญ่ในปัจจุบันใช้เว็บไซต์เครือข่ายโซเชียลจากต่างประเทศ?

ความเป็นจริงก็คือ แหล่งข้อมูลด้านมนุษย์ที่ใหญ่ที่สุดในปัจจุบัน (ไม่ใช่แค่ชาวเวียดนามเท่านั้น) อยู่บนอินเทอร์เน็ตและเครือข่ายโซเชียล อย่างไรก็ตาม เราสามารถเข้าถึงและรวบรวมข้อมูลจากแหล่งต่างๆ ได้โดยอาศัยความเข้าใจเกี่ยวกับลักษณะเฉพาะของข้อมูลชาวเวียดนาม ซึ่งขึ้นอยู่กับลักษณะเฉพาะที่แต่ละโครงการกำหนดไว้

ตัวอย่างเช่น โมเดล GPT ของ OpenAI มีพารามิเตอร์หลายร้อยหรือหลายล้านล้านตัว ได้รับการฝึกจากข้อมูลจำนวนมหาศาล และมีค่าใช้จ่ายหลายพันล้านดอลลาร์ เมื่อเปรียบเทียบกับโมเดลเหล่านี้ เราเลือกเส้นทางที่แตกต่างอย่างสิ้นเชิงโดยอิงจากการวิจัย ความสามารถ และทรัพยากรของเรา: การสร้างแบบจำลองภาษาเวียดนามที่มีสถาปัตยกรรมที่มีพารามิเตอร์เพียงไม่กี่พันล้านตัว ฝึกจากชุดข้อมูลภาษาเวียดนามขนาด 600 GB ที่เรารวบรวมและปรับแต่งเอง แต่มีขีดความสามารถที่เทียบเท่าในแง่ของการประมวลผลภาษาเวียดนาม ผลลัพธ์แสดงให้เห็นว่าสถาปัตยกรรมที่เราพัฒนาขึ้นเองสามารถปรับให้เหมาะสมด้วยตัวเอง ลดระยะเวลาการฝึกโมเดลภาษา ลดต้นทุน และยังคงรับประกันคุณภาพของโมเดลได้

คุณและทีมของคุณเผชิญกับความท้าทายอะไรบ้างในกระบวนการวิจัยและพัฒนาผลิตภัณฑ์ปัญญาประดิษฐ์?

ความท้าทายประการแรกคือเวลาอย่างแน่นอน คลื่นเทคโนโลยีปัญญาประดิษฐ์กำลังมาอย่างรวดเร็วและอยู่ในช่วงของการเติบโตอย่างรวดเร็ว บริษัทเทคโนโลยีชั้นนำทั่วโลกเปิดตัวผลิตภัณฑ์ที่สมบูรณ์แบบพร้อมอัปเดตและปรับปรุงอย่างต่อเนื่อง หากเราช้าและไม่เปิดตัวผลิตภัณฑ์ทันเวลา เราจะล้าหลังอย่างแน่นอน

ในทางกลับกัน หากเราต้องการสร้างผลิตภัณฑ์ที่สามารถนำไปประยุกต์ใช้และแก้ไขปัญหาสังคมในทางปฏิบัติได้ เราจะต้องพิจารณาการค้นหาและพัฒนาคุณสมบัติที่โดดเด่น พิเศษ และไม่เหมือนใครของผลิตภัณฑ์ด้วย

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 8.

การนำเสนอที่ Vietnam Artificial Intelligence Day (AI4VN 2023)

ในความเป็นจริง บุคคลและองค์กรจำนวนมากในเวียดนามและทั่วโลกต้องประสบกับความสูญเสียครั้งใหญ่จากการรั่วไหลของข้อมูล คุณมองปัญหาความปลอดภัยของข้อมูลอย่างไร

อาจกล่าวได้ว่าทุกวันนี้แอปพลิเคชันต่างๆ ล้วนมาจากข้อมูล เมื่อต้องทำงานกับข้อมูล เราต้องมั่นใจว่าเป้าหมายของการใช้ข้อมูลนั้นจะสร้างเทคโนโลยีที่ดีที่สุดสำหรับชีวิต และในอีกด้านหนึ่ง เราต้องมั่นใจว่าข้อมูลมีความปลอดภัยสำหรับบุคคลและองค์กร

ปัจจัยด้านมนุษย์ถือเป็นปัจจัยสำคัญอย่างยิ่งในกระบวนการรับรองความปลอดภัยของข้อมูล ซึ่งรวมถึงนักพัฒนา ผู้ใช้ผลิตภัณฑ์ และผู้ใช้ สำหรับนักพัฒนา จำเป็นต้องตระหนักรู้ถึงความปลอดภัยของข้อมูลตั้งแต่เริ่มต้นการรวบรวมและประมวลผลข้อมูล

บ่อยครั้ง เมื่อไม่มีปัญหาเกิดขึ้น เรากลับไม่ตระหนักถึงความสำคัญของการรักษาความปลอดภัยข้อมูล แต่หากเกิดการรั่วไหลของข้อมูล ความเสียหายอาจมหาศาล การรั่วไหลของข้อมูลอาจเกิดขึ้นเนื่องจากปัญหาทางเทคนิคหรือการโจมตีโดยเจตนาเพื่อขโมยข้อมูล เมื่อเกิดการรั่วไหลของข้อมูล บุคคลหรือองค์กรอาจนำข้อมูลของตนไปใช้งานโดยผู้ไม่หวังดีเพื่อจุดประสงค์ที่ผิดกฎหมาย และธุรกิจอาจสูญเสียทางการเงินจากการแก้ไขปัญหาที่เกี่ยวข้อง ซึ่งอาจรวมถึงความเสียหายต่อแบรนด์ด้วย

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 9.

ดร. Dao Duc Minh และทีมงาน VinBigdata ในงานสัมมนา

หลังจากที่มีความมุ่งมั่นในการเชี่ยวชาญเทคโนโลยีเพื่อให้บริการประชาชนชาวเวียดนามแล้ว จะมีขั้นตอนใดที่จะก้าวไปสู่ระดับโลกหรือไม่

องค์กรหรือธุรกิจใดๆ ที่ต้องการนำผลิตภัณฑ์ออกสู่ตลาดต่างประเทศจะต้องปฏิบัติตามมาตรฐานสากล VinBigdata มีจุดแข็งในด้านโซลูชันและเทคโนโลยี ดังนั้นการกำหนดวิสัยทัศน์ในการพิชิตโลกจึงเป็นเรื่องธรรมดา

แน่นอนว่าการที่จะนำไปใช้กับผลิตภัณฑ์และแอปพลิเคชันต่างๆ มากมายนั้น จำเป็นต้องมีการสนับสนุนจากหน่วยงานระดับนานาชาติที่มีประสบการณ์หลายปีและมีความเข้าใจผู้ใช้ทั่วโลก

ขอบคุณ!



ที่มา: https://thanhnien.vn/ts-dao-duc-minh-lam-chu-du-lieu-viet-la-buoc-dau-phat-trien-va-nam-giu-cong-nghe-viet-18524052710263732.htm

การแสดงความคิดเห็น (0)

No data
No data

หัวข้อเดียวกัน

หมวดหมู่เดียวกัน

ถ้ำโค้งอันสง่างามในตูหลาน
ที่ราบสูงห่างจากฮานอย 300 กม. เต็มไปด้วยทะเลเมฆ น้ำตก และนักท่องเที่ยวที่พลุกพล่าน
ขาหมูตุ๋นเนื้อหมาปลอม เมนูเด็ดของชาวเหนือ
ยามเช้าอันเงียบสงบบนผืนแผ่นดินรูปตัว S

ผู้เขียนเดียวกัน

มรดก

รูป

ธุรกิจ

No videos available

ข่าว

ระบบการเมือง

ท้องถิ่น

ผลิตภัณฑ์