การระเบิดของปัญญาประดิษฐ์เชิงสร้างสรรค์ (Generative AI) ได้เปลี่ยนภูมิทัศน์เทคโนโลยีระดับโลกไปอย่างสิ้นเชิง
นับตั้งแต่ OpenAI เปิดตัว ChatGPT ในช่วงปลายปี 2022 ก็มีโมเดล LLM ที่คล้ายกันปรากฏขึ้นอย่างต่อเนื่อง โดยนำไปใช้ในหลายสาขา เช่น การดูแลสุขภาพ การศึกษา การเงิน กฎหมาย... การแข่งขันได้เข้มข้นมากขึ้น ไม่เพียงแต่ในระดับองค์กรเท่านั้น แต่ยังรวมถึงระดับประเทศในแง่ของความสามารถในการฝึกอบรม โครงสร้างพื้นฐานการประมวลผล และข้อมูลอีกด้วย
บริษัทขนาดใหญ่อย่าง OpenAI, Google, Meta หรือ Microsoft ที่มีศักยภาพทางการเงินและสภาพแวดล้อมการทำงานที่เอื้ออำนวย ต่าง "ลงทุน" หลายพันล้านดอลลาร์อย่างรวดเร็วเพื่อเป็นเจ้าของ GPU ระดับไฮเอนด์หลายพันตัว เช่น Nvidia H100 ซึ่งเป็นปัจจัยหลักในการฝึกอบรมโมเดล LLM ราคาหุ้นของ Nvidia พุ่งสูงขึ้นในช่วงเวลาดังกล่าว สะท้อนให้เห็นถึงความต้องการโครงสร้างพื้นฐานของ โลก
ในขณะเดียวกัน บริษัทเทคโนโลยีในประเทศกำลังพัฒนา นอกจากปัญหาต้นทุนแล้ว ยังต้องเผชิญกับข้อจำกัดในการนำเข้าและส่งออกอุปกรณ์ชิป AI จากสหรัฐอเมริกา ส่งผลให้ขาดแคลนอุปกรณ์ฝึกอบรมและ "ทำงานช้า" กว่าบริษัทเทคโนโลยียักษ์ใหญ่ ด้วยเป้าหมายภายในประเทศ ซาโลก็ไม่มีข้อยกเว้น
ในแง่ของข้อมูล ปัญหาการเรียนรู้ของเครื่องก่อนหน้านี้จำเป็นต้องใช้ข้อมูลการฝึกจำนวนมาก แต่สำหรับโมเดลภาษาขนาดใหญ่ นี่เป็นปริมาณข้อมูลมหาศาล เพื่อให้ได้โมเดลที่ดีเพียงพอ ระบบ LLM จำเป็นต้องใช้โทเค็นข้อความอินพุตหลายสิบหรือหลายแสนล้านรายการ ในขณะเดียวกัน ในแง่ของความนิยม ภาษาเวียดนามยังไม่ "ทัดเทียม" กับภาษาอังกฤษและภาษาจีน สิ่งนี้ยิ่งทวีความยากลำบากสำหรับนักพัฒนา LLM ชาวเวียดนาม
ในปี 2023 โมเดลภาษาขนาดใหญ่ (LLM) เช่น GPT-3.5, GPT-4 ได้เข้ามาสร้างความฮือฮาในโลกเทคโนโลยี และองค์กรต่างๆ ของเวียดนามหลายแห่งก็เลือกใช้โมเดลที่ปรับแต่งอย่างดีจากต่างประเทศเพื่อใช้ทางลัดและก้าวหน้าในกระบวนการฝึกอบรม LLM
ซาโลเลือกเส้นทางที่แตกต่างออกไป ซึ่งยากลำบากกว่า แต่มีความเป็นอิสระมากกว่า นั่นคือการฝึกฝนโมเดลด้วยตนเองตั้งแต่เริ่มต้น (โมเดลจากศูนย์) เส้นทางที่ต้องสร้างทุกอย่างตั้งแต่เริ่มต้น ตั้งแต่ข้อมูล สถาปัตยกรรมโมเดล ไปจนถึงกระบวนการฝึกฝนทั้งหมด การตัดสินใจครั้งนี้ไม่ใช่การแข่งขันกับยักษ์ใหญ่ แต่คือการทำให้ความปรารถนาของชาวเวียดนามเป็นจริง นั่นคือการฝึกฝนโมเดล LLM ในภาษาแม่ของพวกเขาให้เชี่ยวชาญ
“เราคาดการณ์ถึงความยากลำบากไว้ล่วงหน้าแล้ว แต่ก็ยังตัดสินใจเข้าร่วมการแข่งขันตั้งแต่เนิ่นๆ เราไม่ได้แข่งขันโดยตรงกับ “เจ้าใหญ่” แต่เลือกตลาดเฉพาะกลุ่มที่เราสามารถทำได้ดีกว่า ความปรารถนาของเราคือการสร้างโมเดลที่ชาวเวียดนามควบคุมได้อย่างสมบูรณ์ ตั้งแต่ข้อมูลไปจนถึงอัลกอริทึม” ดร.เหงียน เติง เซิน ผู้อำนวย การฝ่ายวิทยาศาสตร์ ของ Zalo AI กล่าว
แม้จะเผชิญกับอุปสรรคมากมายในสามปัจจัยหลัก ได้แก่ โครงสร้างพื้นฐาน ข้อมูล และระดับการฝึกอบรม วิศวกรชาวเวียดนามก็ยังคงพยายามหาทางออกเชิงรุกเพื่อเอาชนะความยากลำบาก นี่แสดงให้เห็นถึงจิตวิญญาณและความมุ่งมั่นของชาวเวียดนามท่ามกลางสถานการณ์ที่ยากลำบาก โดยเฉพาะอย่างยิ่งในกรณีนี้คือการเอาชนะความท้าทายในกระบวนการพัฒนาหลักสูตรปริญญาโทสาขาบริหารธุรกิจ (LLM) ให้กับชาวเวียดนาม
เพื่อฝึกอบรม LLM วิศวกรจำเป็นต้องมีโครงสร้างพื้นฐานที่เหมาะสม แต่ในขณะนั้น GPU อย่าง H100 ของ Nvidia แทบจะเป็น "ของหายากระดับโลก" ขณะเดียวกัน บริษัทใหญ่ๆ ก็ได้สั่งซื้อล่วงหน้าเป็นเวลาหนึ่งปีและจ่ายเงินหลายล้านดอลลาร์เพื่อเป็นเจ้าของมัน ในเวียดนาม Zalo ก็พยายามซื้อเซิร์ฟเวอร์ DGX H100 จำนวน 8 เครื่อง แต่ก็ไม่ง่ายนัก เพราะต้องรอการส่งมอบจากผู้ผลิตแต่ละชุด
ในกรณีที่ไม่มี GPU ของ Nvidia วิศวกรชาวเวียดนามจำเป็นต้องใช้ GPU ของผู้บริโภคอย่างยืดหยุ่นเพื่อทดลองโค้ดแต่ละบรรทัดและรันโมเดลขนาดเล็กแต่ละโมเดล แทนที่จะรอ วิศวกรได้เตรียมความพร้อมเชิงรุกเพื่อที่เมื่อมีอุปกรณ์ที่ทันสมัย ทุกอย่างก็จะพร้อม
ในแง่ของข้อมูล แทนที่จะพึ่งพาทรัพยากรที่มีอยู่ Zalo ลงทุนสร้างคลังข้อมูลคุณภาพสูงโดยเฉพาะสำหรับภาษาเวียดนาม เพื่อชดเชยการขาดแคลนอย่างรุนแรงเมื่อเทียบกับภาษาอังกฤษและภาษาจีน
ด้วยกลยุทธ์การพัฒนาที่ยืดหยุ่น Zalo จึงประสบความสำเร็จในการลดระยะเวลาการพัฒนาโมเดลภาษาขนาดใหญ่จากที่คาดการณ์ไว้ 18 เดือน เหลือเพียง 6 เดือน ปลายปี 2566 โมเดลภาษาเวียดนามขนาดใหญ่ของ Zalo ได้เปิดตัวอย่างเป็นทางการในงานที่รวบรวมชุมชนเทคโนโลยีและ AI ชั้นนำของเวียดนาม นั่นคือ Zalo AI Summit โมเดล LLM ของ Zalo ได้เปิดตัวครั้งแรกผ่านการแข่งขัน Kahoot ที่ Tinhte.vn จัดขึ้น และแซงหน้า GPT 3.5 อย่างน่าประหลาดใจ เป็นรองเพียง GPT4 ซึ่งเป็นโมเดล LLM ที่แข็งแกร่งที่สุดในโลกในขณะนั้น
โมเดลของ Zalo พัฒนาบนแพลตฟอร์มประเมินผล VMLU (Vietnamese Multitask Language Understanding Benchmark Suite for Large Language Models) มีประสิทธิภาพสูงกว่า GPT-3.5 ของ OpenAI ถึง 1.5 เท่า ภายในสิ้นปี 2024 โมเดลนี้จะแซงหน้าบริษัทใหญ่ๆ อย่าง GPT-4 (OpenAI), Gemma-2-9B (Google) หรือ Phi-3-small (Microsoft) โดยตามหลัง LLaMA-3-70B ของ Meta ในแง่ของความสามารถในการประมวลผลภาษาเวียดนามในการจัดอันดับของ VMLU
Zalo ไม่เพียงแต่หยุดอยู่แค่การวิจัยเท่านั้น แต่ยังค่อยๆ นำเทคโนโลยีจากห้องปฏิบัติการมาสู่ชีวิตจริงโดยนำผลิตภัณฑ์แอปพลิเคชันจาก LLM ออกสู่เชิงพาณิชย์และเผยแพร่สู่สาธารณะ
ต้นปี 2568 Kiki Info ผู้ช่วยถาม-ตอบทั่วไป ซึ่งดำเนินการในฐานะบัญชีอย่างเป็นทางการบนแพลตฟอร์ม Zalo ดึงดูดผู้ใช้ได้มากกว่า 1 ล้านคนภายในเวลาไม่ถึง 2 เดือน อีกหนึ่งแอปพลิเคชันอย่าง Thiep AI ก็มียอดสร้างและส่งการ์ดถึง 15 ล้านใบภายในเวลาเพียง 2 เดือน
การเดินทางของซาโลไม่ได้เป็นเพียงบริษัทที่ต้องการพัฒนาเทคโนโลยีเท่านั้น แต่ยังเป็นส่วนหนึ่งของภาพรวมที่ใหญ่ขึ้น ซึ่งเวียดนามกำลังส่งเสริมนวัตกรรมอย่างแข็งขัน ด้วยนโยบายจากมติ 57-NQ/TW ว่าด้วยการพัฒนาวิทยาศาสตร์และเทคโนโลยีและการเปลี่ยนผ่านสู่ดิจิทัลระดับชาติ โดยเฉพาะอย่างยิ่งด้านปัญญาประดิษฐ์ (AI)
การเกิดขึ้นและการพัฒนาอย่างรวดเร็วของ LLM ภาษาเวียดนามจาก Zalo ไม่เพียงแต่เป็นก้าวสำคัญทางเทคโนโลยีสำหรับธุรกิจเท่านั้น แต่ยังเป็นเครื่องพิสูจน์ถึงความสามารถโดยธรรมชาติและความพากเพียรของทีมงานเทคโนโลยีชาวเวียดนามอีกด้วย
ด้วยเทคนิค "จากศูนย์" หรือการฝึกอบรมโมเดลตั้งแต่เริ่มต้น ซาโลเลือกเส้นทางที่ยาวไกล แต่กลับช่วยให้เวียดนามเชี่ยวชาญ AI ได้อย่างแท้จริง ไม่เพียงแต่ในแง่ของผลลัพธ์เท่านั้น แต่ยังรวมถึงกระบวนการทั้งหมด ตั้งแต่สถาปัตยกรรมโมเดล ข้อมูล อัลกอริทึม ไปจนถึงผลิตภัณฑ์แอปพลิเคชัน ความสำเร็จของซาโลยังช่วยให้เวียดนามกลายเป็นหนึ่งในไม่กี่ประเทศในเอเชียตะวันออกเฉียงใต้ที่มีโมเดล LLM ในประเทศ ซึ่งถือเป็นก้าวสำคัญเชิงกลยุทธ์ในบริบทของการแข่งขันด้านเทคโนโลยีระดับโลกที่ดุเดือดยิ่งขึ้น
ในการเดินทางอันยาวไกลข้างหน้า Zalo จะไม่หยุดอยู่แค่โมเดลเดียวหรือผลิตภัณฑ์เพียงไม่กี่ตัวเท่านั้น แต่จะพัฒนาโมเดลนี้ต่อไปเพื่อตอบโจทย์ความต้องการของผู้ใช้และสร้างแพลตฟอร์ม AI ของเวียดนามที่มีคุณภาพในการแข่งขัน “เส้นทางการพัฒนา AI ของ Zalo ยังคงอีกยาวไกล เราจะพัฒนาโมเดลนี้ต่อไปทั้งในด้านกว้างและเชิงลึก พร้อมกับส่งเสริมการใช้งานจริง เป้าหมายสูงสุดคือการสร้างสรรค์ผลิตภัณฑ์ AI ที่มีคุณภาพเพื่อตอบโจทย์ความต้องการของชาวเวียดนามอย่างแท้จริง” คุณ Son กล่าวเสริม
ความสำเร็จในการพัฒนาหลักสูตรนิติศาสตรมหาบัณฑิต (LLM) สาขาภาษาเวียดนามของ Zalo ไม่เพียงแต่เป็นความก้าวหน้าครั้งสำคัญสำหรับธุรกิจเท่านั้น แต่ยังเปิดโอกาสสู่อนาคตอันสดใสสำหรับปัญญาประดิษฐ์ของเวียดนามอีกด้วย ความมุ่งมั่นและความมุ่งมั่นของชาวเวียดนามได้นำพาเราไปสู่ผลลัพธ์อันทรงคุณค่า อนาคตของปัญญาประดิษฐ์ของเวียดนามจะไม่เพียงแต่มี "Zalo" เท่านั้น แต่ยังจะมีวิศวกรผู้กล้าหาญรุ่นใหม่ที่จะสืบสาน สืบทอด และพิชิตโลกแห่งเทคโนโลยีอีกด้วย
ที่มา: https://znews.vn/zalo-va-hanh-trinh-lam-chu-llm-tieng-viet-post1561765.html






การแสดงความคิดเห็น (0)