ข้อความข้างต้นได้รับการแบ่งปันโดยคุณ Ha Jung Woo หัวหน้าแผนกนวัตกรรมคลาวด์ของบริษัท Naver (เกาหลี) ในงาน Vietnam Artificial Intelligence Day (AI4VN) 2023 ซึ่งจัดขึ้นที่นครโฮจิมินห์ เมื่อวันที่ 22 กันยายน
Generative AI คือรูปแบบหนึ่งของปัญญาประดิษฐ์ที่สามารถสร้างเนื้อหาและแนวคิดใหม่ๆ ในรูปแบบต่างๆ เช่น ข้อความ รูปภาพ วิดีโอ เพลง จากนั้น AI สามารถสร้างเพลง ยาเสพติด ภาพยนตร์ เกม และอื่นๆ ได้ด้วยการใช้โมเดลภาษาขนาดใหญ่ (LLM)
จากการประเมินล่าสุดของ McKinsey พบว่า ปัญญาประดิษฐ์เชิงสร้างสรรค์ (generative AI) อาจมีส่วนช่วยสร้างมูลค่าทาง เศรษฐกิจ โลกได้ถึง 4.4 ล้านล้านดอลลาร์สหรัฐ การศึกษานี้อ้างอิงจากการประยุกต์ใช้ปัญญาประดิษฐ์เชิงสร้างสรรค์ (generative AI) จำนวน 60,000 รายการในอุตสาหกรรมต่างๆ
ตามที่คุณฮา จุงวู กล่าวไว้ โมเดลภาษาหลักสำหรับการพัฒนา AI เชิงสร้างสรรค์ในปัจจุบันใช้ภาษาอังกฤษ ดังนั้นเมื่อโมเดลนี้ทำงานบนภาษาอื่น มันจะไม่สมบูรณ์และมีข้อผิดพลาด และเนื่องจากเป็นภาษาอังกฤษ เมื่อใช้งานจึงสร้างอคติที่ไม่จำเป็น โดยเฉพาะอคติทางวัฒนธรรม
ดังนั้น เขาจึงเชื่อว่าการเชี่ยวชาญด้านข้อมูลและเทคโนโลยีเป็นปัจจัยสำคัญที่หลายประเทศพิจารณาในอนาคต เพื่อเอาชนะความเสี่ยงจากการพึ่งพาประเทศอื่น ยกตัวอย่างเช่น ในเกาหลี Naver ได้สร้างโมเดลภาษาเกาหลีขนาดใหญ่เพื่อรองรับการใช้งานแอปพลิเคชัน AI ของภาครัฐ และธุรกิจภายในประเทศ
ดร. Dao Duc Minh กรรมการผู้จัดการของ VinBigdata ซึ่งมีมุมมองเดียวกัน ยังเชื่อว่าชาวเวียดนามสามารถสร้างผลิตภัณฑ์ AI ที่ผลิตในประเทศได้ เพื่อช่วยให้มั่นใจถึงความปลอดภัย ความแม่นยำของข้อมูล และให้บริการรัฐบาลและสังคมได้ดีที่สุด...
ตามที่คุณ Dao Duc Minh กล่าว เมื่อ chatGPT เปิดตัวในช่วงปลายปี 2022 ได้สร้างคลื่นการแข่งขันใต้ดินระหว่างประเทศและองค์กรขนาดใหญ่ในการวิจัยและเปิดตัวโมเดล AI เชิงกำเนิดและโมเดลภาษาขนาดใหญ่
โดยเฉพาะในสหรัฐอเมริกา นอกจากเครื่องมือ chatGPT ของ OpenAI แล้ว ยังมีโมเดล AI เชิงสร้างสรรค์อื่นๆ อีก เช่น Bard ของ Google และ Titan ของ Amazon ในประเทศจีน มี Earnie Bot ของ Baidu, SenseChat ของ Sense Time และ Hunyan ของ Tencent ส่วนในเกาหลี มี HyperClova X ของ Naver...
คุณเดา ดึ๊ก มินห์ กล่าวว่าการพัฒนาโมเดลภาษาขนาดใหญ่เพื่อประยุกต์ใช้กับ AI เชิงสร้างสรรค์นั้นไม่ใช่เรื่องง่ายและมีค่าใช้จ่ายสูง หากนำ AI เชิงสร้างสรรค์ไปประยุกต์ใช้บนแพลตฟอร์มโมเดลภาษาขนาดใหญ่ที่มีอยู่ทั่วโลก เวียดนามมีความเสี่ยงที่จะเผชิญกับความเสี่ยงมากมาย ยกตัวอย่างเช่น โมเดลภาษาต่างประเทศขนาดใหญ่ ข้อมูลของเวียดนามมีสัดส่วนน้อยมาก โดยส่วนใหญ่เป็นภาษาอังกฤษ ดังนั้นจึงเป็นการยากที่จะรับรองความถูกต้อง ความปลอดภัยของข้อมูล และความเหมาะสมกับความต้องการทางธุรกิจ...
ยกตัวอย่างเช่น แบบจำลองภาษาต่างประเทศขนาดใหญ่มีพารามิเตอร์หลายแสนล้านตัว การรันแบบจำลองในโลกแห่งความเป็นจริงจำเป็นต้องใช้โครงสร้างพื้นฐานการคำนวณขนาดใหญ่ แต่คุณภาพยังไม่สมดุล เนื่องจากแบบจำลอง AI อาจให้คำตอบที่ผิดพลาดได้ โดยเฉพาะอย่างยิ่งในความรู้ทางประวัติศาสตร์ วัฒนธรรม และประเด็นเฉพาะของแต่ละประเทศ
ด้วยเหตุนี้ VinBigdata จึงตัดสินใจสร้างแบบจำลองภาษาเวียดนามขนาดใหญ่ โดยมีเป้าหมายเพื่อรับประกันความปลอดภัยของข้อมูล เพิ่มความแม่นยำ ลดต้นทุน และปรับตัวให้เข้ากับสถานการณ์ภายในประเทศ ทีมผู้เชี่ยวชาญได้สร้างแบบจำลองที่มีพารามิเตอร์น้อยกว่า chatGPT หลายร้อยเท่า แต่สร้างขึ้นจากข้อมูลประชากรชาวเวียดนาม
แบบจำลองนี้สามารถตอบคำถามเฉพาะพื้นที่ได้อย่างแม่นยำ โดยเฉพาะอย่างยิ่ง เมื่อถูกถามเกี่ยวกับกฎหมายที่มีการละเมิดที่แตกต่างกันสองกรณี แบบจำลอง chatGPT ก็มีคำตอบและเนื้อหาทั่วไปเหมือนกัน ขณะเดียวกัน แบบจำลอง AI ที่ใช้ข้อมูลของเวียดนามสามารถตอบคำถามได้อย่างแม่นยำโดยอิงจากกฎหมาย คำสั่งศาล ค่าปรับ แหล่งข้อมูล และอื่นๆ ที่เฉพาะเจาะจงมาก
เพื่อพิสูจน์ความแม่นยำนี้ ดร. Dao Duc Minh ได้ยกตัวอย่างเมื่อถามเกี่ยวกับงานเรื่อง "The Beggar's Wife" ในวรรณกรรมเวียดนามใน chatGPT และโมเดลภาษาเวียดนามที่พัฒนาโดย VinBigdata ผลลัพธ์ของโมเดลของ VinBigdata แม่นยำอย่างสมบูรณ์ ในขณะที่คำตอบของ ChatGPT ยังไม่ชัดเจน
ตัวแทนของ VinBigdata ยังกล่าวอีกว่า การเชี่ยวชาญ AI ที่สร้างในประเทศเป็นสิ่งสำคัญ เนื่องจากสามารถช่วยให้รัฐบาลเชี่ยวชาญเนื้อหา หลีกเลี่ยงข้อมูลที่ผิดพลาด รับรองความปลอดภัยของข้อมูลระดับชาติ และนำเทคโนโลยีของเวียดนามไปสู่โลกได้
แหล่งที่มา
การแสดงความคิดเห็น (0)