ประเทศต่างๆ ควรพัฒนา AI ที่สร้างด้วยภาษาของตนเอง

ข้อความข้างต้นได้รับการแชร์โดยคุณ Ha Jung Woo หัวหน้าแผนกนวัตกรรมคลาวด์ของบริษัท Naver (เกาหลี) ในงาน Vietnam Artificial Intelligence Festival (AI4VN) 2023 ซึ่งจัดขึ้นที่นครโฮจิมินห์ เมื่อวันที่ 22 กันยายน

คุณฮา จุงวู หัวหน้าแผนกนวัตกรรมคลาวด์ บริษัท Naver (เกาหลี)

Generative AI คือรูปแบบหนึ่งของปัญญาประดิษฐ์ที่สามารถสร้างเนื้อหาและแนวคิดใหม่ๆ ในรูปแบบต่างๆ เช่น ข้อความ รูปภาพ วิดีโอ เพลง จากนั้น AI สามารถสร้างเพลง ยาเสพติด ภาพยนตร์ เกม และอื่นๆ ได้ด้วยการใช้โมเดลภาษาขนาดใหญ่ (LLM)

จากการประเมินล่าสุดของ McKinsey พบว่า ปัญญาประดิษฐ์เชิงสร้างสรรค์ (generative AI) อาจมีส่วนช่วยสร้างมูลค่าทาง เศรษฐกิจ โลกได้ถึง 4.4 ล้านล้านดอลลาร์สหรัฐ การศึกษานี้อ้างอิงจากการประยุกต์ใช้ปัญญาประดิษฐ์เชิงสร้างสรรค์ (generative AI) จำนวน 60,000 รายการในอุตสาหกรรมต่างๆ

ตามที่คุณฮา จุงวู กล่าวไว้ โมเดลภาษาหลักสำหรับการพัฒนา AI เชิงสร้างสรรค์ในปัจจุบันล้วนใช้ภาษาอังกฤษ ดังนั้นเมื่อโมเดลนี้ทำงานบนภาษาอื่น มันจะไม่สมบูรณ์และมีข้อผิดพลาด และเนื่องจากเป็นภาษาอังกฤษ เมื่อนำไปใช้จึงสร้างอคติที่ไม่จำเป็น โดยเฉพาะอคติทางวัฒนธรรม

ด้วยเหตุนี้ เขาจึงเชื่อว่าการเชี่ยวชาญด้านข้อมูลและเทคโนโลยีเป็นปัจจัยสำคัญที่หลายประเทศพิจารณาในอนาคต เพื่อเอาชนะความเสี่ยงจากการพึ่งพาประเทศอื่น ยกตัวอย่างเช่น ในเกาหลี Naver ได้สร้างโมเดลภาษาเกาหลีขนาดใหญ่เพื่อให้บริการแก่ รัฐบาล และธุรกิจในประเทศเมื่อนำแอปพลิเคชัน AI มาใช้

ดร. Dao Duc Minh กรรมการผู้จัดการของ VinBigdata ซึ่งมีมุมมองเดียวกัน ยังเชื่อว่าชาวเวียดนามสามารถสร้างผลิตภัณฑ์ AI ที่ผลิตในประเทศได้ เพื่อช่วยให้มั่นใจถึงความปลอดภัย ความแม่นยำของข้อมูล และให้บริการรัฐบาลและสังคมได้ดีที่สุด...

ดร. เดา ดึ๊ก มินห์ ผู้อำนวยการทั่วไปของ VinBigdata

ตามที่คุณ Dao Duc Minh กล่าว เมื่อ chatGPT เปิดตัวในช่วงปลายปี 2022 ได้สร้างคลื่นการแข่งขันใต้ดินระหว่างประเทศและองค์กรขนาดใหญ่ในการวิจัยและเปิดตัวโมเดล AI เชิงกำเนิดและโมเดลภาษาขนาดใหญ่

โดยเฉพาะในสหรัฐอเมริกา นอกจากเครื่องมือ chatGPT ของ OpenAI แล้ว ยังมีโมเดล AI เชิงสร้างสรรค์อื่นๆ อีก เช่น Bard ของ Google, Titan ของ Amazon ในประเทศจีน มี Earnie Bot ของ Baidu, SenseChat ของ Sense Time และ Hunyan ของ Tencent ส่วนในเกาหลี มี HyperClova X ของ Naver...

คุณเดา ดึ๊ก มินห์ กล่าวว่าการพัฒนาโมเดลภาษาขนาดใหญ่เพื่อประยุกต์ใช้กับ AI เชิงสร้างสรรค์นั้นไม่ใช่เรื่องง่ายและมีค่าใช้จ่ายสูง หากนำ AI เชิงสร้างสรรค์ไปประยุกต์ใช้บนแพลตฟอร์มโมเดลภาษาขนาดใหญ่ที่มีอยู่ทั่วโลก เวียดนามมีความเสี่ยงที่จะเผชิญกับความเสี่ยงมากมาย ยกตัวอย่างเช่น โมเดลภาษาต่างประเทศขนาดใหญ่ ข้อมูลของเวียดนามมีสัดส่วนน้อยมาก โดยส่วนใหญ่เป็นภาษาอังกฤษ ดังนั้นจึงเป็นการยากที่จะรับรองความถูกต้อง ความปลอดภัยของข้อมูล และความเหมาะสมกับความต้องการทางธุรกิจ...

ยกตัวอย่างเช่น แบบจำลองภาษาต่างประเทศขนาดใหญ่มีพารามิเตอร์หลายแสนล้านตัว การรันแบบจำลองในโลกแห่งความเป็นจริงจำเป็นต้องใช้โครงสร้างพื้นฐานการประมวลผลขนาดใหญ่ แต่คุณภาพยังไม่สมดุล เนื่องจากแบบจำลอง AI อาจให้คำตอบที่ผิดพลาดได้ โดยเฉพาะอย่างยิ่งในความรู้ทางประวัติศาสตร์ วัฒนธรรม และประเด็นเฉพาะของแต่ละประเทศ

ด้วยเหตุนี้ VinBigdata จึงตัดสินใจสร้างแบบจำลองภาษาเวียดนามขนาดใหญ่ โดยมีเป้าหมายเพื่อรับประกันความปลอดภัยของข้อมูล เพิ่มความแม่นยำ ลดต้นทุน และปรับตัวให้เข้ากับสถานการณ์ภายในประเทศ ทีมผู้เชี่ยวชาญได้สร้างแบบจำลองที่มีพารามิเตอร์น้อยกว่า chatGPT หลายร้อยเท่า แต่สร้างขึ้นจากข้อมูลประชากรชาวเวียดนาม

แบบจำลองนี้สามารถตอบคำถามเฉพาะพื้นที่ได้อย่างแม่นยำ โดยเฉพาะอย่างยิ่ง เมื่อถูกถามเกี่ยวกับกฎหมายที่มีการละเมิดที่แตกต่างกันสองกรณี แบบจำลอง chatGPT ก็มีคำตอบและเนื้อหาทั่วไปเหมือนกัน ขณะเดียวกัน แบบจำลอง AI ที่ใช้ข้อมูลของเวียดนามสามารถตอบคำถามได้อย่างแม่นยำโดยอิงจากกฎหมาย คำสั่งศาล ค่าปรับ แหล่งข้อมูล และอื่นๆ ที่เฉพาะเจาะจงมาก

เพื่อพิสูจน์ความแม่นยำนี้ ดร. เดา ดึ๊ก มินห์ ได้ยกตัวอย่างเมื่อถามเกี่ยวกับงานเรื่อง “ภรรยาขอทาน” ในวรรณกรรมเวียดนามใน chatGPT และแบบจำลองภาษาเวียดนามที่พัฒนาโดย VinBigdata โดยผลลัพธ์ของแบบจำลองของ VinBigdata ตอบได้อย่างถูกต้องอย่างสมบูรณ์ ในขณะที่ ChatGPT ตอบไม่ชัดเจน

ตัวแทนของ VinBigdata ยังกล่าวอีกว่า การเชี่ยวชาญ AI ที่สร้างในประเทศเป็นสิ่งสำคัญ เนื่องจากสามารถช่วยให้รัฐบาลเชี่ยวชาญเนื้อหา หลีกเลี่ยงข้อมูลที่ผิดพลาด รับรองความปลอดภัยของข้อมูลระดับชาติ และนำเทคโนโลยีของเวียดนามไปสู่โลกได้

ประเทศต่างๆ พร้อมร่วมมือกับเวียดนามพัฒนาเทคโนโลยี AI ผู้แทนสถานกงสุลกล่าวว่า ประเทศต่างๆ พร้อมร่วมมือกับเวียดนามพัฒนาเทคโนโลยีปัญญาประดิษฐ์ (AI) และเน้นย้ำถึงความจำเป็นในการพัฒนา AI อย่างมีความรับผิดชอบ

แหล่งที่มา