Vietnam.vn - Nền tảng quảng bá Việt Nam

ดร. เดา ดึ๊ก มินห์: 'การเชี่ยวชาญข้อมูลเวียดนามเป็นก้าวแรกในการพัฒนาและเชี่ยวชาญเทคโนโลยีเวียดนาม'

Báo Thanh niênBáo Thanh niên27/05/2024

รูปภาพ หลังจากทำงานให้กับองค์กรปัญญาประดิษฐ์ขนาดใหญ่ในสหรัฐอเมริกา ทำไมคุณถึงตัดสินใจกลับมาเวียดนามเพื่อร่วมงานกับ VinBigdata? ระหว่างที่ทำงานในสหรัฐอเมริกา แม้ว่าผมจะได้มีส่วนร่วมในโครงการขนาดใหญ่ ของรัฐบาล หลายโครงการ แต่ผลลัพธ์ที่ได้มักจะเป็นเพียงขั้นตอนเล็กๆ น้อยๆ ในกระบวนการประมวลผลขนาดใหญ่ หลายครั้ง เนื่องจากขั้นตอนการรักษาความลับที่เข้มงวดมากของโครงการ ผมจึงไม่รู้ด้วยซ้ำว่าโซลูชันที่ผมพัฒนาขึ้นนั้นถูกนำไปใช้อย่างไร ในปี 2560 ผมกลับไปเวียดนามในช่วงที่เวียดนามกำลังอยู่ในช่วงพัฒนา และมีปัญหามากมายเกี่ยวกับข้อมูลขนาดใหญ่และปัญญาประดิษฐ์ที่ต้องได้รับการแก้ไข ผมตอบรับคำเชิญของศาสตราจารย์หวู่ ห่า วัน ให้ร่วมกันบรรลุเป้าหมายในการพัฒนาโซลูชันเทคโนโลยีของเวียดนามเพื่อช่วยเหลือชีวิตความเป็นอยู่ของชาวเวียดนาม ผมรู้สึกว่าการกลับมาเวียดนามครั้งนี้มีความหมายมากขึ้น เพราะผมจะได้ทำงานเกี่ยวกับปัญหาต่างๆ ที่มีอิทธิพลมากขึ้น
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 2.

ดร. เดา ดึ๊ก มินห์ ในการประชุมเชิงปฏิบัติการ

เอ็นวีซีซี

ในกลยุทธ์การพัฒนาปัญญาประดิษฐ์ บิ๊กดาต้ามีบทบาทและอิทธิพลอย่างไรครับ? ข้อมูลมีบทบาทสำคัญและมีคุณค่าอย่างยิ่งในการฝึกอบรมปัญญาประดิษฐ์ การฝึกอบรมแบบจำลองปัญญาประดิษฐ์ที่มีคุณภาพสูงมักเริ่มต้นด้วยการฝึกอบรมฐานข้อมูลขนาดใหญ่ ดังนั้น เพื่อให้ได้ปัญญาประดิษฐ์ที่มีคุณภาพ เราจำเป็นต้องมีข้อมูลที่ดีก่อน ข้อมูลที่ดีต้องเป็นไปตามมาตรฐานทั้งในด้านปริมาณและขนาด คุณภาพ ความหลากหลาย และความเป็นสากล กระบวนการรวบรวมและประมวลผลข้อมูลหลายพันชั่วโมงจากขั้นตอนการล้างข้อมูลดิบเพื่อสร้างข้อมูลคุณภาพสูงสุดเพื่อป้อนเข้าสู่แบบจำลองปัญญาประดิษฐ์นั้นมีค่าใช้จ่ายสูงและซับซ้อน ในทางกลับกัน ในการวิเคราะห์บิ๊กดาต้า เราจำเป็นต้องใช้ปัญญาประดิษฐ์เพื่อให้มั่นใจว่าสามารถประมวลผลข้อมูลได้อย่างแม่นยำในวงกว้าง ซึ่งจะทำให้ได้ผลลัพธ์ที่ชัดเจนและคาดการณ์ได้แม่นยำยิ่งขึ้น ยกตัวอย่างเช่น ในกระบวนการพัฒนาผลิตภัณฑ์ผู้ช่วยเสมือนสำหรับชาวเวียดนาม (ViVi) เราต้องรวบรวมและประมวลผลข้อมูลเสียงคุณภาพสูงหลายหมื่นชั่วโมง จากเสียงหลายแสนเสียงจากหลากหลายภูมิภาค หลากหลายวัยและเพศ โดยมีเนื้อหาครอบคลุมหลายร้อยสาขา... หรือล่าสุดคือการเปิดตัว ViGPT - "ChatGPT เวอร์ชันภาษาเวียดนามแรกสำหรับผู้ใช้ปลายทาง" ซึ่งพัฒนาจาก Big Language Model ที่ VinBigdata เป็นเจ้าของทั้งหมด โมเดลนี้ได้รับการฝึกฝนจากข้อมูลภาษาเวียดนามที่ผ่านการปรับแต่งแล้วขนาด 600 GB จากหลากหลายสาขา ด้วยความเข้าใจในข้อมูลและภาษาเวียดนามของเรา เราจึงค้นพบวิธีการใหม่ที่ช่วยลดระยะเวลาการเปิดตัว ViGPT ให้สั้นลงภายในเวลาเพียง 9 เดือนหลังจากที่ ChatGPT ถือกำเนิดขึ้น นี่คือการสั่นพ้องระหว่างข้อมูลขนาดใหญ่และปัญญาประดิษฐ์
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 3.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 4.
คุณมีความคิดเห็นอย่างไรเกี่ยวกับการเชื่อมโยงงานวิจัยกับคุณค่าเชิงปฏิบัติเพื่อประโยชน์ต่อชุมชน? - ผมเชื่อว่าการวิจัยเทคโนโลยีจะประสบความสำเร็จอย่างแท้จริงได้ก็ต่อเมื่อได้นำไปใช้ในชีวิตจริง แก้ไขปัญหาสังคม และพัฒนาคุณภาพชีวิตของผู้คน เพื่อสร้างผลิตภัณฑ์เชิงพาณิชย์ที่ใช้งานได้จริงและแก้ไขปัญหาทางธุรกิจและสังคม เราต้องใส่ใจและตั้งคำถามอยู่เสมอว่า ข้อมูลจะสร้างคุณค่าอะไรให้กับชีวิต? จนถึงปัจจุบัน เราได้ทำการวิจัยผลิตภัณฑ์และโซลูชันที่หลากหลายในหลากหลายสาขาและวิชาชีพ ซึ่งโดยทั่วไปคือ ViGPT, VinDr ซึ่งเป็นโซลูชัน AI สำหรับการวินิจฉัยภาพทางการ แพทย์ , VinBase ซึ่งเป็นแพลตฟอร์มสำหรับปัญญาประดิษฐ์ หรือ Vizone ซึ่งเป็นชุดโซลูชันการวิเคราะห์ภาพอัจฉริยะ
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 5.

พร้อมด้วยบุคลากรสำคัญของ VinBigdata ในงานของ Vingroup Corporation

เอ็นวีซีซี

การปฏิวัติอุตสาหกรรมครั้งที่ 4 กำลังเกิดขึ้นอย่างเข้มข้นในระดับโลก คุณคิดว่าเวียดนามมีข้อได้เปรียบอะไรบ้าง? เมื่อเทียบกับการปฏิวัติครั้งก่อนๆ ผมคิดว่าเวียดนามมีข้อได้เปรียบมากมายในการก้าวข้ามผ่านการปฏิวัติอุตสาหกรรม 4.0 ซึ่งจะช่วยยกระดับตำแหน่งของประเทศบนแผนที่ โลก กุญแจสำคัญสองประการในการบรรลุเป้าหมายนี้คือข้อมูลและประชากร ปัจจุบันเวียดนามมีประชากรเกือบ 100 ล้านคน ซึ่งในจำนวนนี้เป็นคนหนุ่มสาวที่ใช้โทรศัพท์และคอมพิวเตอร์ส่วนบุคคลเป็นจำนวนมาก นอกจากนี้ เรายังมีผู้เชี่ยวชาญด้านปัญญาประดิษฐ์ที่มีชื่อเสียง บุคลากรรุ่นใหม่ที่มีคุณภาพสูงด้านเทคโนโลยีสารสนเทศ และมีพื้นฐานทางคณิตศาสตร์ที่ดีมาก แล้ว ข้อจำกัดคืออะไร? ข้อจำกัดประการแรกที่เห็นได้คือ แม้จะมีประชากรจำนวนมาก แต่เรายังคงประสบปัญหาในการจัดการข้อมูล โดยเฉพาะการสร้างมาตรฐานและการซิงโครไนซ์ข้อมูล ณ สถานที่ปฏิบัติงาน ธุรกิจ และหน่วยงานบริหาร นอกจากนี้ เรายังเผชิญกับข้อจำกัดอื่นๆ เช่น ทรัพยากรการลงทุนที่จำกัด โดยเฉพาะการลงทุนในโครงสร้างพื้นฐานการประมวลผลประสิทธิภาพสูง
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 6.
ในความคิดเห็นของคุณ การเรียนรู้ข้อมูลภาษาเวียดนามมีความสำคัญเพียงใดต่อเส้นทางการสร้างและการเรียนรู้เทคโนโลยีเพื่อตอบโจทย์ชีวิตความเป็นอยู่ของชาวเวียดนาม ปัจจุบันมีผลิตภัณฑ์ปัญญาประดิษฐ์ชั้นนำระดับโลกมากมาย ซึ่งโดยทั่วไปแล้วจะเป็นผลิตภัณฑ์แอปพลิเคชัน AI ที่สร้างขึ้นจากแบบจำลองภาษาขนาดใหญ่ เช่น ChatGPT ของ OpenAI หรือ Bard ของ Google อย่างไรก็ตาม ภาษาเวียดนามไม่ใช่กลุ่มภาษาหลักในการพัฒนาผลิตภัณฑ์เหล่านี้ ดังนั้น คุณภาพของเนื้อหาเฉพาะภาษาเวียดนามที่ส่งถึงผู้ใช้จึงได้รับผลกระทบไม่มากก็น้อย และมีความเสี่ยงสูงที่จะเกิดข้อผิดพลาด และที่อันตรายกว่านั้นคือข้อผิดพลาดในความรู้พื้นฐาน ในฐานะชาวเวียดนาม เรามีข้อได้เปรียบในการเข้าถึงแหล่งข้อมูลของเราเอง มีเพียงเราเท่านั้นที่สามารถเข้าใจลักษณะของข้อมูล ความต้องการ และลักษณะนิสัยของชาวเวียดนาม ดังนั้น การเรียนรู้ข้อมูลภาษาเวียดนามจึงเป็นกุญแจสำคัญในการทำความเข้าใจเทคโนโลยีหลัก ซึ่งเป็นเทคโนโลยีที่จะตอบโจทย์ชาวเวียดนาม
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 7.

การฝึกอบรมภายในสำหรับสมาชิก VinBigdata

เอ็นวีซีซี

จะเข้าถึงแหล่งข้อมูลเฉพาะเจาะจงได้อย่างไร โดยเฉพาะอย่างยิ่งเมื่อชาวเวียดนามส่วนใหญ่ในปัจจุบันใช้เว็บไซต์เครือข่ายสังคมออนไลน์จากต่างประเทศ อันที่จริง แหล่งข้อมูลมนุษย์ที่ใหญ่ที่สุดในปัจจุบัน (ไม่ใช่แค่ชาวเวียดนามเท่านั้น) อยู่บนอินเทอร์เน็ตและเครือข่ายสังคมออนไลน์ อย่างไรก็ตาม เรายังคงสามารถเข้าถึงและรวบรวมข้อมูลจากแหล่งต่างๆ ได้ โดยอาศัยความเข้าใจในคุณลักษณะของข้อมูลชาวเวียดนาม ซึ่งขึ้นอยู่กับคุณลักษณะที่แต่ละโครงการกำหนดไว้ ยกตัวอย่างเช่น แบบจำลอง GPT ของ OpenAI มีพารามิเตอร์มากถึงหลายร้อยหรือหลายล้านล้านพารามิเตอร์ ซึ่งได้รับการฝึกฝนจากข้อมูลจำนวนมหาศาลและมีค่าใช้จ่ายหลายพันล้านดอลลาร์ เมื่อเปรียบเทียบกับแบบจำลองเหล่านี้ เราได้เลือกแนวทางที่แตกต่างอย่างสิ้นเชิงโดยพิจารณาจากการวิจัย ความสามารถ และทรัพยากรของเรา นั่นคือ การสร้างแบบจำลองภาษาเวียดนามที่มีสถาปัตยกรรมพารามิเตอร์เพียงไม่กี่พันล้านพารามิเตอร์ ฝึกฝนจากชุดข้อมูลภาษาเวียดนามขนาด 600 GB ที่เรารวบรวมและปรับแต่งเอง แต่มีความสามารถเทียบเท่าในแง่ของการประมวลผลภาษาเวียดนาม ผลลัพธ์แสดงให้เห็นว่าสถาปัตยกรรมที่เราพัฒนาขึ้นเองสามารถปรับให้เหมาะสมได้เอง ลดระยะเวลาในการฝึกแบบจำลองภาษา ลดต้นทุน และยังคงรักษาคุณภาพของแบบจำลองไว้ ได้ อะไรคือความท้าทายที่คุณและทีมของคุณเผชิญในกระบวนการวิจัยและพัฒนาผลิตภัณฑ์ปัญญาประดิษฐ์ ความท้าทายแรกคือเรื่องเวลาอย่างแน่นอน กระแสเทคโนโลยีปัญญาประดิษฐ์กำลังมาอย่างรวดเร็วและอยู่ในช่วงเฟื่องฟู บริษัทเทคโนโลยีชั้นนำทั่วโลกต่างเปิดตัวผลิตภัณฑ์ที่สมบูรณ์แบบพร้อมการอัปเดตและพัฒนาอย่างต่อเนื่อง หากเราล่าช้าและไม่เปิดตัวผลิตภัณฑ์ทันเวลา เราก็จะล้าหลังอย่างแน่นอน ในทางกลับกัน หากเราต้องการสร้างผลิตภัณฑ์ที่สามารถนำไปประยุกต์ใช้และแก้ไขปัญหาสังคมในทางปฏิบัติได้ เราต้องพิจารณาค้นหาและพัฒนาคุณสมบัติที่โดดเด่น พิเศษ และเป็นเอกลักษณ์ของผลิตภัณฑ์ด้วย
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 8.

การนำเสนอที่งาน Vietnam Artificial Intelligence Day (AI4VN 2023)

เอ็นวีซีซี

ในความเป็นจริง บุคคลและองค์กรจำนวนมากทั้งในเวียดนามและทั่วโลกต่างได้รับความเสียหายอย่างมากจากการรั่วไหลของข้อมูล คุณมองประเด็นเรื่องความปลอดภัยของข้อมูลอย่างไร? กล่าวได้ว่าแอปพลิเคชันใดๆ ในปัจจุบันล้วนมาจากข้อมูล ในการทำงานกับข้อมูล ในด้านหนึ่ง เราต้องมั่นใจว่าเป้าหมายของการนำข้อมูลมาใช้เพื่อสร้างเทคโนโลยีที่ดีที่สุดสำหรับชีวิต และในอีกด้านหนึ่ง เราต้องสร้างความมั่นใจด้านความปลอดภัยของข้อมูลสำหรับบุคคลและองค์กร ปัจจัยด้านมนุษย์เป็นปัจจัยสำคัญอย่างยิ่งในกระบวนการสร้างความมั่นใจด้านความปลอดภัยของข้อมูล ซึ่งรวมถึงนักพัฒนา ผู้ใช้ผลิตภัณฑ์ และผู้ใช้ สำหรับนักพัฒนา จำเป็นต้องตระหนักถึงความปลอดภัยของข้อมูลตั้งแต่เริ่มต้นการรวบรวมและประมวลผลข้อมูล บ่อยครั้งที่เมื่อไม่มีปัญหาเกิดขึ้น เรากลับไม่ได้ตระหนักถึงความสำคัญของความปลอดภัยของข้อมูล แต่หากเกิดการรั่วไหลของข้อมูล ความเสียหายอาจมหาศาล การละเมิดข้อมูลอาจเกิดขึ้นเนื่องจากปัญหาทางเทคนิคหรือการโจมตีโดยเจตนาเพื่อขโมยข้อมูล เมื่อข้อมูลถูกละเมิด บุคคลหรือองค์กรอาจถูกนำไปใช้เพื่อวัตถุประสงค์ที่ผิดกฎหมายโดยผู้ไม่หวังดี ในขณะที่ธุรกิจอาจได้รับความสูญเสียทางการเงินจากการแก้ไขปัญหาที่เกี่ยวข้อง และอาจถึงขั้นสร้างความเสียหายต่อแบรนด์
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 9.

ดร. เดา ดึ๊ก มินห์ และทีมงาน VinBigdata ในงานกิจกรรม

เอ็นวีซีซี

หลังจากความมุ่งมั่นในการเชี่ยวชาญเทคโนโลยีเพื่อให้บริการชาวเวียดนามแล้ว ย่อมต้องมีก้าวสำคัญสู่ระดับโลกอย่างแน่นอน องค์กรหรือบริษัทใดๆ ที่ต้องการนำผลิตภัณฑ์ออกสู่ตลาดต่างประเทศต้องปฏิบัติตามมาตรฐานสากล VinBigdata มีจุดแข็งด้านโซลูชันและเทคโนโลยี ดังนั้นการกำหนดวิสัยทัศน์ที่จะครองโลกจึงเป็นเรื่องธรรมชาติ แน่นอนว่าการจะนำไปปรับใช้กับผลิตภัณฑ์และแอปพลิเคชันที่หลากหลายนั้น จำเป็นต้องมีความร่วมมือจากหน่วยงานระหว่างประเทศที่มีประสบการณ์ยาวนานหลายปีและความเข้าใจในผู้ใช้ทั่วโลก ขอบคุณ!

Thanhnien.vn

ที่มา: https://thanhnien.vn/ts-dao-duc-minh-lam-chu-du-lieu-viet-la-buoc-dau-phat-trien-va-nam-giu-cong-nghe-viet-18524052710263732.htm

การแสดงความคิดเห็น (0)

No data
No data

หัวข้อเดียวกัน

หมวดหมู่เดียวกัน

การแสดงซ้ำเทศกาลไหว้พระจันทร์ของราชวงศ์หลี่ที่ป้อมปราการหลวงทังลอง
นักท่องเที่ยวชาวตะวันตกชอบซื้อของเล่นช่วงเทศกาลไหว้พระจันทร์บนถนนหางหม่าเพื่อมอบให้กับลูกหลานของพวกเขา
ถนนหางหม่าเต็มไปด้วยสีสันของเทศกาลไหว้พระจันทร์ คนหนุ่มสาวต่างตื่นเต้นกับการเช็คอินแบบไม่หยุดหย่อน
ข้อความทางประวัติศาสตร์: แม่พิมพ์ไม้เจดีย์วิญเงียม - มรดกสารคดีของมนุษยชาติ

ผู้เขียนเดียวกัน

มรดก

;

รูป

;

ธุรกิจ

;

No videos available

เหตุการณ์ปัจจุบัน

;

ระบบการเมือง

;

ท้องถิ่น

;

ผลิตภัณฑ์

;