Pho GPT ย่อมาจาก Pho - Generative Pre-trained Transformer เป็นโครงการโมเดลภาษาขนาดใหญ่ที่มุ่งเน้นไปที่ภาษาเวียดนาม โดยดำเนินการโดยทีมวิศวกร VinAI ซึ่งเป็นสมาชิกของ Vingroup Corporation
“ตามทัน” เทคโนโลยีโลก
Pho GPT ใช้โค้ดโอเพ่นซอร์สแทนซอฟต์แวร์ที่เป็นกรรมสิทธิ์ เช่น ChatGPT ของ OpenAI ซึ่งหมายความว่าซอร์สโค้ดของ Pho GPT เป็นสาธารณะและผู้ใช้สามารถมีส่วนร่วมพัฒนา Pho GPT ได้ผ่านแอปพลิเคชันที่กำหนดเอง
ตามการแนะนำของ VinAI Pho GPT มีพารามิเตอร์ 7.5 พันล้านตัว ซึ่งสร้างขึ้นบนแพลตฟอร์มการถอดรหัส Transformer โมเดลนี้ได้รับการฝึกฝนตั้งแต่เริ่มต้นโดยใช้เทคนิคที่ล้ำสมัย เช่น Flash Attention และการประมาณความยาวบริบท AliBi
เทคนิคเหล่านี้ไม่เพียงช่วยให้ Pho GPT เข้าใจบริบทได้อย่างลึกซึ้งยิ่งขึ้น แต่ยังเพิ่มความสามารถของแอพพลิเคชั่นในการสนทนาและโต้ตอบอย่างเป็นธรรมชาติระหว่างการใช้งานอีกด้วย สิ่งนี้ทำให้โมเดลนี้เป็นเครื่องมือที่มีความหลากหลายและทำงานได้หลายอย่างพร้อมกัน สามารถตอบสนองความต้องการภาษาของผู้ใช้ที่หลากหลายได้
นายบุย ไห่ ฮุง ผู้อำนวยการทั่วไปของ VinAI |
นาย Bui Hai Hung กรรมการผู้จัดการทั่วไปของ VinAI แบ่งปันเกี่ยวกับความสำคัญของการกำเนิด Pho GPT ว่าเป้าหมายของโครงการคือการพัฒนารูปแบบที่คล้ายกับ ChatGPT สำหรับภาษาเวียดนามและวัฒนธรรมเวียดนาม Pho GPT มีความสามารถในการทำความเข้าใจและเขียนข้อความเวียดนามได้ในลักษณะที่เหนือกว่าเทคโนโลยีภาษารุ่นก่อนหน้า นอกจากนี้ โมเดลดังกล่าวยังได้รับการฝึกฝนตั้งแต่เริ่มต้นด้วยชุดข้อมูลของเวียดนาม ซึ่งเป็นอิสระจากโมเดลอื่นๆ ในโลก ช่วยให้มั่นใจได้ว่าจะเชี่ยวชาญเทคโนโลยีหลักขั้นสูงสำหรับเวียดนาม
เป็นที่น่าสังเกตว่า ในขณะที่โลกกำลังฮือฮาเกี่ยวกับการกำเนิดของ Chat GPT หนึ่งปีต่อมา Pho GPT ก็ปรากฏตัวในเวียดนามด้วย นายบุ้ย ไห่ หุ่ง กล่าวว่า VinAI เป็นผู้บุกเบิกในเอเชียตะวันออกเฉียงใต้ที่เปิดตัวโมเดลภาษาขนาดใหญ่ด้วยโค้ดโอเพนซอร์ส ไม่กี่สัปดาห์ต่อมา ผลิตภัณฑ์ที่คล้ายกันก็ได้เปิดตัวในสิงคโปร์
การยกระดับ AI ของเวียดนาม
ผลการเปรียบเทียบระหว่าง Pho GPT-7B5-Instruct เวอร์ชันกับ ChatGPT ซอร์สปิด (GPT-3.5-turbo) และโมเดลโอเพนซอร์สอื่นๆ แสดงให้เห็นว่า Pho GPT อยู่ในอันดับที่สอง ตามหลัง ChatGPT ในหมวดหมู่การประเมินส่วนใหญ่
Pho GPT มีความแตกต่างมากมายเมื่อเทียบกับโมเดลภาษาอื่น โดยเฉพาะ ChatGPT ออกแบบมาเพื่อทำความเข้าใจและเขียนภาษาเวียดนามได้อย่างเป็นธรรมชาติ สะท้อนบริบท ไวยากรณ์ คำศัพท์ และการแสดงออกของชาวเวียดนาม สามารถโต้ตอบกับผู้ใช้ในหัวข้อที่เกี่ยวข้องกับวัฒนธรรมเวียดนาม ประวัติศาสตร์ ภูมิศาสตร์ สังคม ความบันเทิง กีฬา …
นอกจากนี้ Pho GPT ยังเป็นโอเพ่นซอร์สและมีความยืดหยุ่น ผู้ใช้สามารถพัฒนาแอปพลิเคชันที่กำหนดเองและไม่ซ้ำใครโดยเฉพาะแอปพลิเคชันที่ต้องการความปลอดภัยสูงโดยไม่ต้องพึ่งพาแหล่งซอฟต์แวร์ที่เป็นกรรมสิทธิ์
ในเวลาเดียวกันความสำคัญของ Pho GPT ก็คือประสิทธิภาพสูงและการประหยัดต้นทุนด้วยการฝึกอบรมโดยใช้เทคนิคเพิ่มประสิทธิภาพล่าสุด ช่วยลดขนาดและเพิ่มความเร็วของแอปพลิเคชัน GPT ยังสามารถทำงานบนแพลตฟอร์มการประมวลผลขนาดเล็กได้ ช่วยลดต้นทุนและประหยัดทรัพยากร
Pho GPT ได้รับการฝึกฝนด้วยคลังข้อมูลของเวียดนามขนาดสูงสุดถึง 41GB ซึ่งรวมถึงข้อความ Wikipedia ขนาด 1GB และตัวแปรขนาด 40GB ที่ลบข้อมูลที่ซ้ำกันออกจากชุดข้อมูลข่าว ได้รับการฝึกฝนโดยใช้ไลบรารี llm-foundry ของ Mosaicml llm ทำให้ Pho GPT สามารถสร้างข้อความบางส่วนตามคำขอของผู้ใช้ เช่น บทความ บทกวี เพลง เรียงความ สุนทรพจน์ บทนำ... นอกจากนี้ Pho GPT ยังสามารถสร้างเนื้อหาที่สร้างสรรค์และตลกขบขัน เช่น เรื่องสั้น ความเห็น สุภาษิต ข้อความ ทวีต มีม... ในเวลาเดียวกัน ยังโต้ตอบกับผู้ใช้ในหัวข้อต่างๆ เช่น เหตุการณ์ปัจจุบัน การศึกษา สุขภาพ การท่องเที่ยว อาหาร กีฬา ความบันเทิง... นอกจากนี้ Pho GPT ยังสามารถตอบคำถามของผู้ใช้ ให้ข้อมูล คำแนะนำ การสนับสนุน และตอบคำถาม...
นอกจากนี้ Pho GPT ยังสามารถแปลข้อความหรือประเภทข้อความที่หลากหลาย เช่น เอกสารทางการ เอกสารเชิงพาณิชย์ เอกสารวิชาการ เอกสารวรรณกรรม... จากภาษาเวียดนามเป็นภาษาอื่นและในทางกลับกัน
คุณสมบัติที่โดดเด่นอีกประการหนึ่งก็คือ Pho GPT วิเคราะห์และประมวลผลข้อความ เช่น การสรุป การจัดหมวดหมู่ การติดฉลาก การสกัดข้อมูล การตรวจจับอารมณ์ การตรวจจับข้อผิดพลาด การปรับปรุงรูปแบบการเขียน ฯลฯ
ในอนาคต ทีมพัฒนา Pho GPT กล่าวว่าพวกเขาจะปรับปรุงโมเดลนี้ต่อไปและขยายโครงการไปยังภาษาอื่นๆ โดยเฉพาะในภูมิภาคเอเชียตะวันออกเฉียงใต้
“การถือกำเนิดของ Pho GPT ถือเป็นครั้งแรกที่เวียดนามมีโอกาส “ตามทัน” โลกในด้านเทคโนโลยีขั้นสูงนี้ และเป็นเจ้าของโมเดลภาษาขนาดใหญ่ที่มีโค้ดโอเพนซอร์สสำหรับชาวเวียดนามโดยเฉพาะ ซึ่งปรับให้เหมาะสมสำหรับภาษาเวียดนาม และไม่ขึ้นอยู่กับโลก นี่คือความภาคภูมิใจของ Vin AI โดยเฉพาะและชาวเวียดนามโดยทั่วไป” ตัวแทนของ VinAI กล่าวเสริม
นาย Tran Duy Dong รัฐมนตรีช่วยว่าการกระทรวงการวางแผนและการลงทุนได้แสดงความคิดเห็นเกี่ยวกับศักยภาพและโอกาสในการพัฒนาของ Pho GPT ในอนาคต โดยเน้นย้ำว่า “AI จะเป็นหนึ่งในสาขาที่เวียดนามมีศักยภาพในการพัฒนาอย่างแข็งแกร่งและจะตามทันระดับโลกในไม่ช้า กระทรวงจะสนับสนุนและอยู่เคียงข้างชุมชน AI โดยเฉพาะชุมชนวิทยาศาสตร์และเทคโนโลยีโดยทั่วไป เพื่อพัฒนาระบบนิเวศนวัตกรรมที่ครอบคลุมและมีพลวัต ซึ่งจะช่วยสนับสนุนการพัฒนาโดยรวมของประเทศ”
แหล่งที่มา
การแสดงความคิดเห็น (0)