VinBigdata ประกาศความสำเร็จในการสร้างแบบจำลองภาษาเวียดนามขนาดใหญ่เมื่อวันที่ 21 สิงหาคม ซึ่งสร้างรากฐานสำหรับการเชี่ยวชาญเทคโนโลยี AI เชิงสร้างสรรค์
แบบจำลองภาษาขนาดใหญ่ (LLM) คือแบบจำลองที่ฝึกฝนโดยใช้เทคนิคการเรียนรู้เชิงลึกกับชุดข้อมูลข้อความหรือรูปภาพขนาดใหญ่ แบบจำลองเหล่านี้มีความสามารถในการทำความเข้าใจความรู้ สร้างข้อความ และดำเนินการประมวลผลภาษาธรรมชาติที่หลากหลาย แบบจำลองเหล่านี้ถือเป็นกุญแจสำคัญในการพัฒนาเทคโนโลยี Generative AI ซึ่งสามารถสร้างเนื้อหาและแนวคิดใหม่ๆ ในรูปแบบต่างๆ (ข้อความ รูปภาพ เสียง ฯลฯ)
ด้วยการสร้างแบบจำลองภาษาเวียดนามขนาดใหญ่ที่ประสบความสำเร็จ VinBigdata จะบูรณาการเทคโนโลยีเพื่อทำให้ VinBase (แพลตฟอร์มปัญญาประดิษฐ์แบบหลายความรู้ที่ครอบคลุม) กลายเป็นแพลตฟอร์ม AI เชิงสร้างสรรค์ในเวียดนาม ในขณะเดียวกันก็มอบโซลูชันการพัฒนาที่ใช้เทคโนโลยีนี้ เช่น แชทบอท AI เชิงสร้างสรรค์ คอลบอท หรือผู้ช่วยเสมือน ViVi รุ่นใหม่... เทคโนโลยีนี้ช่วยเพิ่มความเป็นธรรมชาติของการสื่อสารของเครื่องจักร ในขณะที่ช่วยให้ผู้ใช้ค้นหาและสังเคราะห์ข้อมูลได้เร็วและง่ายขึ้นกว่าเดิม
ศาสตราจารย์ หวู่ ฮา วัน ผู้อำนวยการฝ่าย วิทยาศาสตร์ บริษัท VinBigdata ภาพ: VinBigdata
ศาสตราจารย์หวู่ ฮา วัน ผู้อำนวยการฝ่ายวิทยาศาสตร์ของบริษัท VinBigdata กล่าวว่า ในโลกนี้มีบริษัทขนาดใหญ่หลายแห่งที่ประสบความสำเร็จในการวิจัยและเปิดตัวผลิตภัณฑ์ที่ใช้โมเดลภาษาขนาดใหญ่ เช่น OpenAI ที่ใช้ ChatGPT หรือ Google ที่ใช้ Bard ส่วนในเวียดนาม Vingroup ได้ลงทุน กับ VinBigdata เพื่อสร้างโมเดลภาษาเวียดนามขนาดใหญ่ คุณแวนกล่าวว่า โมเดลนี้มุ่งเน้นไปที่การแก้ปัญหาหลักสามประการ ได้แก่ การปรับปรุงความแม่นยำ การลดต้นทุนโครงสร้างพื้นฐาน และการสร้างความมั่นใจด้านความปลอดภัย
“แทนที่จะต้องใช้พารามิเตอร์ราว 175 พันล้านตัวเช่น ChatGPT นั้น VinBigdata สามารถสร้างโมเดลภาษาขนาดใหญ่ที่มีพารามิเตอร์หลายพันล้านตัวได้ แต่ยังคงมีความสามารถในการสร้างเอกสารที่มีความถูกต้องสูง โดยเน้นที่ข้อมูลและความรู้ภาษาเวียดนาม” หัวหน้าหน่วยงานกล่าว
การเรียนรู้เทคโนโลยี การพัฒนาตนเองตั้งแต่ก้าวแรก และการสร้างแบบจำลองภาษาเวียดนามขนาดใหญ่ ถือเป็นก้าวสำคัญที่จะช่วยให้ VinBigdata นำเทคโนโลยี AI เชิงสร้างสรรค์ (generative AI) เข้าสู่ระบบนิเวศของผลิตภัณฑ์และบริการในตลาด ปัจจุบัน บริษัทฯ ได้นำเทคโนโลยีใหม่มาประยุกต์ใช้กับกลุ่มผลิตภัณฑ์ VinBase KB (VinBase Knowledge Base Portal) เป็นครั้งแรก ผลิตภัณฑ์นี้มีความสามารถในการดึงข้อมูลและสร้างคำตอบโดยอัตโนมัติจากข้อมูลที่รวบรวมจากชุดข้อมูลขนาดใหญ่ในระบบความรู้
ตัวแทนของ VinBigdata เปิดเผยในงานประกาศเปิดตัว Generative AI ภาพ: VinBigdata
คาดว่าในเดือนธันวาคมปีนี้ สมาชิก Vingroup จะเปิดตัวผลิตภัณฑ์หลักสองรายการ ได้แก่ VinBase2.0 และแอปพลิเคชัน ViGPT VinBase 2.0 เป็นแพลตฟอร์ม AI ที่สร้างมุมมองที่หลากหลายด้วยโซลูชันที่ให้บริการแก่ธุรกิจและหน่วยงาน รัฐบาล ขณะเดียวกัน แอปพลิเคชัน ViGPT ได้รับการแนะนำโดยบริษัทในฐานะ "ChatGPT เวอร์ชันเวียดนาม" ซึ่งเปิดให้ชุมชนเข้าถึงและทดสอบได้ ViGPT ช่วยให้ผู้ใช้สอบถามและตอบคำถามเกี่ยวกับข้อมูลเฉพาะเกี่ยวกับเวียดนาม (กฎระเบียบ เอกสารทางกฎหมาย) หรือข้อมูลท้องถิ่น (ประวัติศาสตร์ วรรณกรรม แหล่งท่องเที่ยว และอาหารพื้นเมือง)
บริษัท VinBigdata Joint Stock Company มีระบบฐานข้อมูลขนาดใหญ่ถึง 3,500 เทราไบต์ ระบบนี้เก็บข้อมูลเสียง รูปภาพ และข้อมูลหลายแสนชั่วโมง ซึ่งได้รับการทำความสะอาด ประมวลผล จัดประเภท และนำไปใช้ในการฝึกอบรม AI ควบคู่ไปกับโครงสร้างพื้นฐานด้านการวิจัยและพัฒนา โครงสร้างพื้นฐานนี้ประกอบด้วยคลัสเตอร์เซิร์ฟเวอร์ NvidiaDGX A100 หลายสิบคลัสเตอร์ นอกจากนี้ บริษัทยังมีทีมอาจารย์ นักวิทยาศาสตร์ และผู้เชี่ยวชาญด้านเทคโนโลยีชาวเวียดนามจากทั่วโลกอีกด้วย
ฮ่วยฟอง
ลิงค์ที่มา
การแสดงความคิดเห็น (0)