VinBigdata ประกาศความสำเร็จในการพัฒนารูปแบบภาษาขนาดใหญ่ของภาษาเวียดนามเมื่อวันที่ 21 สิงหาคม ซึ่งเป็นการวางรากฐานสำหรับการพัฒนาเทคโนโลยี AI เชิงสร้างสรรค์ต่อไป
แบบจำลองภาษาขนาดใหญ่ (Large Language Models หรือ LLMs) คือแบบจำลองที่ได้รับการฝึกฝนโดยใช้เทคนิคการเรียนรู้เชิงลึกบนชุดข้อมูลขนาดใหญ่ของข้อความหรือรูปภาพ แบบจำลองเหล่านี้มีความสามารถในการทำความเข้าใจความรู้ สร้างข้อความได้ด้วยตนเอง และดำเนินการประมวลผลภาษาธรรมชาติได้หลากหลายรูปแบบ ถือเป็นกุญแจสำคัญในการพัฒนาเทคโนโลยี AI เชิงสร้างสรรค์ (Generative AI) ซึ่งสามารถสร้างเนื้อหาและแนวคิดใหม่ๆ ในรูปแบบต่างๆ (ข้อความ รูปภาพ เสียง ฯลฯ)
ด้วยความสำเร็จในการพัฒนารูปแบบภาษาเวียดนามขนาดใหญ่ VinBigdata จะผสานรวมเทคโนโลยีเพื่อสร้าง VinBase (แพลตฟอร์มปัญญาประดิษฐ์แบบหลายการรับรู้ที่ครอบคลุม) ให้เป็นแพลตฟอร์มสร้าง AI ชั้นนำในเวียดนาม พร้อมทั้งนำเสนอโซลูชันที่พัฒนาขึ้นบนเทคโนโลยีนี้ เช่น แชทบอท AI แบบสร้างสรรค์ คอลบอท และผู้ช่วยเสมือน ViVi รุ่นใหม่... เทคโนโลยีนี้ช่วยเพิ่มความเป็นธรรมชาติในการสื่อสารของเครื่องจักร และช่วยให้ผู้ใช้ค้นหาและสังเคราะห์ข้อมูลได้รวดเร็วและง่ายดายกว่าเดิม
ศาสตราจารย์ วู ฮา แวน - ผู้อำนวยการ ฝ่ายวิทยาศาสตร์ บริษัท วินบิ๊กดาต้า ภาพ: วินบิ๊กดาต้า
ศาสตราจารย์วู ฮา วัน ผู้อำนวยการฝ่ายวิทยาศาสตร์ของ VinBigdata กล่าวว่า บริษัทขนาดใหญ่หลายแห่งทั่วโลกประสบความสำเร็จในการวิจัยและเปิดตัวผลิตภัณฑ์ที่ใช้โมเดลภาษาขนาดใหญ่ เช่น OpenAI กับ ChatGPT และ Google กับ Bard ในเวียดนาม VinBigdata กำลังได้รับการพัฒนา โดย Vingroup เพื่อสร้างโมเดลภาษาขนาดใหญ่ของเวียดนาม ตามที่ศาสตราจารย์วันกล่าว โมเดลนี้มุ่งเน้นการแก้ปัญหาหลักสามประการ ได้แก่ การเพิ่มความแม่นยำ การลดต้นทุนโครงสร้างพื้นฐาน และการรับรองความปลอดภัย
"แทนที่จะต้องใช้พารามิเตอร์ประมาณ 175 พันล้านตัวเหมือนกับ ChatGPT นั้น VinBigdata สามารถสร้างแบบจำลองภาษาขนาดใหญ่ด้วยพารามิเตอร์เพียงไม่กี่พันล้านตัว ในขณะที่ยังคงสามารถสร้างข้อความที่มีความสมจริงสูง โดยมุ่งเน้นที่ข้อมูลและความรู้ภาษาเวียดนาม" หัวหน้าหน่วยงานกล่าว
การเรียนรู้เทคโนโลยี การพัฒนาตั้งแต่เริ่มต้น และการสร้างแบบจำลองภาษาเวียดนามขนาดใหญ่ ถือเป็นขั้นตอนสำคัญสำหรับ VinBigdata ในการบูรณาการเทคโนโลยีการสร้าง AI เข้ากับระบบนิเวศของผลิตภัณฑ์และบริการในตลาด ปัจจุบัน บริษัทกำลังเริ่มนำเทคโนโลยีใหม่นี้ไปใช้กับผลิตภัณฑ์ VinBase KB (VinBase Knowledge Base Portal) ซึ่งผลิตภัณฑ์นี้สามารถดึงข้อมูลและสร้างคำตอบโดยอัตโนมัติจากข้อมูลที่รวบรวมได้จากชุดข้อมูลขนาดใหญ่ภายในฐานความรู้
ตัวแทนจาก VinBigdata ได้เปิดเผยข้อมูลนี้ในงานเปิดตัวปัญญาประดิษฐ์รุ่นใหม่ ภาพ: VinBigdata
คาดว่า Vingroup จะเปิดตัวผลิตภัณฑ์หลักสองกลุ่มในเดือนธันวาคมนี้ ได้แก่ VinBase 2.0 และแอปพลิเคชัน ViGPT VinBase 2.0 เป็นแพลตฟอร์ม AI ที่สร้างการตอบสนองแบบหลายมิติพร้อมโซลูชันสำหรับธุรกิจและหน่วยงาน ภาครัฐ ส่วนแอปพลิเคชัน ViGPT ซึ่งบริษัทแนะนำว่าเป็น "ChatGPT เวอร์ชันภาษาเวียดนาม" จะเปิดให้ชุมชนเข้าใช้งานและทดสอบ ด้วย ViGPT ผู้ใช้สามารถถามและตอบคำถามเกี่ยวกับข้อมูลเฉพาะของเวียดนาม (ข้อบังคับ เอกสารทางกฎหมาย) หรือข้อมูลท้องถิ่น (ประวัติศาสตร์ วรรณกรรม สถานที่ท่องเที่ยว อาหารท้องถิ่น) ได้
บริษัท วินบิ๊กดาต้า จำกัด (มหาชน) มีระบบฐานข้อมูลขนาดใหญ่ถึง 3,500 เทราไบต์ ระบบนี้บรรจุข้อมูลเสียง รูปภาพ และข้อมูลอื่นๆ นับแสนชั่วโมง ซึ่งได้รับการทำความสะอาด ประมวลผล จัดประเภท และนำไปใช้ในการฝึกอบรม AI และโครงสร้างพื้นฐานด้านการวิจัยและพัฒนา โครงสร้างพื้นฐานนี้ประกอบด้วยคลัสเตอร์เซิร์ฟเวอร์ Nvidia DGX A100 หลายสิบเครื่อง นอกจากนี้ บริษัทฯ ยังมีทีมงานที่ประกอบด้วยศาสตราจารย์ นักวิทยาศาสตร์ และผู้เชี่ยวชาญด้านเทคโนโลยีชาวเวียดนามจากทั่วโลก
ฮว่าอี ฟอง
[โฆษณา_2]
ลิงก์แหล่งที่มา






การแสดงความคิดเห็น (0)