Trang chủNewsKhoa học - Công nghệPhở GPT ghi tên Việt Nam lên bản đồ công nghệ thế...

Phở GPT ghi tên Việt Nam lên bản đồ công nghệ thế giới


Phở GPT được viết tắt của Phở – Generative Pre-trained Transformer, là dự án mô hình ngôn ngữ lớn dành riêng cho tiếng Việt, do đội ngũ kỹ sư VinAI – thành viên của Tập đoàn Vingroup – thực hiện.

“Bắt kịp” nhịp công nghệ thế giới

Phở GPT sử dụng mã nguồn mở (Open-source) thay vì là phần mềm sở hữu riêng như ChatGPT của OpenAI. Nghĩa là mã nguồn của Phở GPT công khai, có sẵn và người sử dụng có thể đóng góp cho sự phát triển của Phở GPT thông qua những ứng dụng tuỳ chỉnh.

Theo giới thiệu của VinAI, Phở GPT có 7,5 tỷ tham số, được xây dựng trên nền tảng giải mã Transformer. Mô hình này được huấn luyện từ đầu, sử dụng những kỹ thuật tiên tiến nhất hiện có như cơ chế tập trung chớp nhoáng (Flash Attention) và ngoại suy độ dài ngữ cảnh AliBi.

Những kỹ thuật này không chỉ giúp Phở GPT hiểu sâu hơn về ngữ cảnh, mà còn làm tăng khả năng đối thoại, tương tác tự nhiên của ứng dụng trong quá trình sử dụng. Điều này giúp mô hình trở thành công cụ đa nhiệm và linh hoạt, có khả năng đáp ứng đa dạng nhu cầu ngôn ngữ của người sử dụng.

ông Bùi Hải Hưng, Tổng Giám đốc VinAI.

ông Bùi Hải Hưng, Tổng Giám đốc VinAI.

Chia sẻ về ý nghĩa của việc Phở GPT ra đời, ông Bùi Hải Hưng, Tổng Giám đốc VinAI, cho biết, mục tiêu của dự án là phát triển những mô hình tương tự ChatGPT cho tiếng Việt và văn hóa người Việt. Phở GPT có khả năng hiểu, viết văn phong tiếng Việt một cách vượt bậc so với các công nghệ về ngôn ngữ thế hệ trước. Mô hình cũng được huấn luyện từ đầu với tập dữ liệu tiếng Việt, không phụ thuộc bất cứ mô hình nào khác của thế giới, đảm bảo việc làm chủ công nghệ lõi tiên tiến cho Việt Nam.

Đáng nói, ngay khi thế giới đang xôn xao về sự ra đời của Chat GPT, một năm sau đó, Phở GPT đã xuất hiện tại Việt Nam. Theo chia sẻ của ông Bùi Hải Hưng, VinAI là đơn vị tiên phong tại Đông Nam Á cho ra mắt mô hình ngôn ngữ lớn với mã nguồn mở. Sau đó vài tuần, sản phẩm tương tự mới được ra mắt tại Singapore.

Nâng tầm AI Việt

Kết quả so sánh phiên bản Phở GPT-7B5-Instruct với ChatGPT mã nguồn đóng (GPT-3.5-turbo) và các mô hình mã nguồn mở khác cho thấy, Phở GPT đứng thứ hai, chỉ sau ChatGPT trong hầu hết mục đánh giá.

Phở GPT có nhiều điểm khác biệt so với những mô hình ngôn ngữ khác, đặc biệt là ChatGPT. Nó được thiết kế để hiểu và viết văn phong tiếng Việt một cách tự nhiên, phản ánh đúng ngữ cảnh, ngữ pháp, từ vựng, cách diễn đạt của người Việt. Nó có thể tương tác với người dùng theo chủ đề liên quan đến văn hoá, lịch sử, địa lý, xã hội, giải trí, thể thao… của Việt Nam.

Thêm nữa, Phở GPT sở hữu mã nguồn mở và linh hoạt. Người dùng có thể phát triển ứng dụng tùy chỉnh và độc đáo, đặc biệt là ứng dụng đòi hỏi sự bảo mật cao mà không phụ thuộc nguồn từ các phần mềm sở hữu riêng.

Đồng thời, điểm ưu tiên của Phở GPT còn là hiệu suất cao và tiết kiệm chi phí với việc được huấn luyện bằng kỹ thuật tối ưu hóa mới nhất, giúp giảm kích thước và tăng tốc độ của ứng dụng. Phở GPT cũng có thể chạy trên nền tảng tính toán nhỏ hơn, giúp giảm chi phí, tiết kiệm tài nguyên.

Được đào tạo với kho dữ liệu tiếng Việt có dung lượng lên đến 41GB, trong đó, 1GB văn bản Wikipedia và một biến thể 40GB đã loại bỏ phần trùng lặp từ tập dữ liệu tin tức, được huấn luyện cách sử dụng thư viện llm-foundry của Mosaicml llm, Phở GPT có thể sinh ra các đoạn văn bản theo yêu cầu của người dùng, như bài viết, thơ, bài hát, luận, bài phát biểu, giới thiệu… Phở GPT cũng có thể tạo ra nội dung sáng tạo, hài hước, như truyện ngắn, lời bình, châm ngôn, lời nhắn, tweet, meme… Đồng thời, nó còn đối thoại với người dùng theo chủ đề khác nhau như thời sự, giáo dục, sức khỏe, du lịch, ẩm thực, thể thao, giải trí… Bên cạnh đó, Phở GPT cũng có thể trả lời câu hỏi của người dùng, cung cấp thông tin, tư vấn, hỗ trợ, giải đáp thắc mắc…

Thêm nữa, Phở GPT có thể dịch các đoạn văn bản hoặc loại văn bản có tính chất khác nhau như văn bản chính thức, thương mại, học thuật, văn học… từ tiếng Việt sang ngôn ngữ khác và ngược lại.

Một tính năng nổi bật nữa đó là Phở GPT phân tích, xử lý các đoạn văn bản, như tóm tắt, phân loại, gán nhãn, trích xuất thông tin, phát hiện cảm xúc, phát hiện sai sót, cải thiện văn phong…

Trong tương lai, đội ngũ phát triển Phở GPT cho biết, họ tiếp tục cải tiến mô hình và mở rộng dự án cho ngôn ngữ khác, đặc biệt là trong khu vực Đông Nam Á.

“Việc Phở GPT ra đời đánh dấu lần đầu tiên Việt Nam có cơ hội “bắt kịp” thế giới trong mảng công nghệ tiến bộ này và sở hữu mô hình ngôn ngữ lớn với mã nguồn mở dành riêng cho người Việt, tối ưu với ngôn ngữ tiếng Việt, độc lập với thế giới. Đây chính là niềm tự hào của Vin AI nói riêng và người Việt nói chung”, đại diện VinAI nói thêm.

Nhận định về tiềm năng và cơ hội phát triển của Phở GPT thời gian tới, ông Trần Duy Đông, Thứ trưởng Bộ Kế hoạch và Đầu tư, nhấn mạnh: “AI sẽ là một trong những lĩnh vực mà Việt Nam có nhiều tiềm năng để phát triển mạnh mẽ và sớm bắt kịp trình độ thế giới. Bộ sẽ luôn ủng hộ, đồng hành cùng cộng đồng AI nói riêng, cộng đồng khoa học công nghệ nói chung, để phát triển một hệ sinh thái đổi mới sáng tạo toàn diện, năng động, đóng góp cho sự phát triển chung của đất nước”.





Nguồn

Cùng chủ đề

VINAI GIỚI THIỆU CÔNG NGHỆ THÔNG MINH INTERIORSENSE VÀ SURROUNDSENSE TẠI TRIỂN LÃM CAEV 2024

Ngày 12/03/2024 - Công ty VinAI công bố tham dự Triển lãm công nghệ CAEV từ ngày 14/03 đến ngày 15/03 tại Bengaluru, Ấn Độ. Trong khuôn khổ triển lãm, VinAI sẽ giới thiệu InteriorSense và SurroundSense - hai giải pháp công nghệ tiên tiến dành cho các phương tiện thông minh thế hệ mới. Gian hàng của VinAI sẽ tọa lạc tại vị trí số HB 102-103 trong khuôn viên Trung tâm Xúc tiến Thương mại Karnataka. Khách tham...

UNESCO: Các công cụ AI định kiến với nữ giới

Nhiều công cụ trí tuệ nhân tạo (AI) phổ biến nhất trên thế giới được vận hành dựa trên những chương trình có định kiến với phụ nữ, do các công ty OpenAI và Meta phát triển. Đây là kết quả nghiên cứu mới được Tổ chức Giáo dục, Khoa học và Văn hóa của Liên hợp quốc (UNESCO) công bố ngày 7-3. Những công ty lớn nhất tham gia cuộc đua phát triển AI hiện...

AI có đúng có sai, các trường có nên cấm xài?

Tiến sĩ Greeni Maheshwari - giảng viên cấp cao Đại học RMIT - nêu như vậy trong bài báo "Các yếu tố ảnh hưởng đến ý định chấp nhận và sử dụng ChatGPT của sinh viên trong giáo dục đại học: Nghiên cứu trong bối cảnh Việt Nam", công bố tháng 12-2023 trên Springer.Nghiên cứu phân tích dữ liệu thu thập từ...

Cưới vợ nhờ dùng ChatGPT lọc 5.239 hồ sơ hẹn hò trên Tinder

Sau khi chia tay mối tình kéo dài 2 năm vào năm 2021, anh Aleksandr Zhadan (24 tuổi) tìm đến ứng dụng hẹn hò Tinder. Cơ chế hoạt động của Tinder khá đơn giản: người dùng xem qua hồ sơ cá nhân của đối tượng tiềm năng, sau đó quẹt qua bên phải để thể hiện sự yêu thích hoặc trái để...

Nổi bật

Mới nhất

Cùng tác giả

Lão nông phát hiện “báu vật” trăm tỷ trong vườn nhà, chuyên gia ngăn đừng bán

Lão nông ở Trung Quốc phát hiện 3 cây gỗ Kim Tơ Nam Mộc quý hơn 1.000 năm tuổi trong vườn nhà và thương gia đã ra giá hơn 900 tỷ đồng để mua chúng, nhưng bị các chuyên gia ngăn lại. Cây gỗ Kim Tơ Nam Mộc là "báu vật", một...

Apple phát hành iOS 17.4.1 cho iPhone, có nên cập nhật?

iOS 17.4.1 có gì mới? Apple đã phát hành phiên bản iOS 17.4 với nhiều tính năng mới bao gồm hỗ trợ cửa hàng ứng dụng thay thế ở các nước Liên minh châu Âu. Bên cạnh đó, bản cập nhật cũng bao gồm bản ghi chép trong Apple Podcasts, cải thiện Bảo vệ Thiết bị Bị Đánh Cắp và Siri, emoji mới,... Đáng chú ý, sự thay đổi này được thực hiện để tuân thủ Đạo luật Thị...

Keychorn trình làng bàn phím K5 Max mới với nhiều tính năng hấp dẫn

Keychron K5 Max có kích thước chuẩn 100%, phù hợp với người dùng đã quen gõ bàn phím truyền thống. Sản phẩm hỗ trợ các phương thức kết nối đa dạng như: Bluetooth, USB-C và 2.4GHz. Bàn phím sử dụng switch Jiadalong Low Switch 2.0, với hai tùy chọn linear hoặc tactile. Điểm nổi bật của K5 Max nằm ở khả năng tương thích với phần mềm QMK/VIA. Công cụ mã nguồn mở này cho phép người dùng tùy...

Bài đọc nhiều

Tại sao AirPods hay bị hỏng hoặc chai pin một bên tai?

Người dùng tai nghe nhà Táo chắc hẳn đều trải qua tình huống dở khóc dở cười vì Airpods hết pin hoặc chai pin mỗi bên không đều. Việc đang sử dụng tai nghe nhưng một bên thì vẫn hoạt động bình thường, một bên thì lại hết sạch pin khiến người dùng không thể có được trải nghiệm trọn vẹn. Tại sao Airpods hết pin mỗi bên không đều nhauKhông chỉ riêng tai nghe Airpods mà các dòng...

Trung Quốc cấm chip Intel và AMD trong cơ quan nhà nước

Cùng với đó, các hệ điều hành nước ngoài bao gồm Windows của Microsoft cũng bị đưa vào danh sách xem xét thay thế bằng các lựa chọn có nguồn gốc nội địa.Cuối tháng 12 năm ngoái, Bộ Công nghiệp Trung Quốc ban hành ba danh sách riêng biệt dành cho CPU, hệ điều hành và cơ sở dữ liệu tập trung được đánh giá là “an toàn và đáng tin cậy”, có hiệu lực trong vòng ba...

Có nên dán kính chống nhìn trộm cho iPhone?

Kính cường lực chống nhìn trộm không còn quá xa lạ với người dùng điện thoại thông minh hiện nay. Kính cường lực chống nhìn trộm là miếng dán cường lực dành cho màn hình điện thoại. Nó có tác dụng hạn chế tầm nhìn của người xung quanh trong phạm vi góc nhìn nghiêng 90 độ. Điều này sẽ bảo vệ được quyền riêng tư trên của bạn, tránh người khác lén đọc tin nhắn, xem thông...

Cùng chuyên mục

Trung Quốc cấm chip Intel và AMD trong cơ quan nhà nước

Cùng với đó, các hệ điều hành nước ngoài bao gồm Windows của Microsoft cũng bị đưa vào danh sách xem xét thay thế bằng các lựa chọn có nguồn gốc nội địa.Cuối tháng 12 năm ngoái, Bộ Công nghiệp Trung Quốc ban hành ba danh sách riêng biệt dành cho CPU, hệ điều hành và cơ sở dữ liệu tập trung được đánh giá là “an toàn và đáng tin cậy”, có hiệu lực trong vòng ba...

Có nên dán kính chống nhìn trộm cho iPhone?

Kính cường lực chống nhìn trộm không còn quá xa lạ với người dùng điện thoại thông minh hiện nay. Kính cường lực chống nhìn trộm là miếng dán cường lực dành cho màn hình điện thoại. Nó có tác dụng hạn chế tầm nhìn của người xung quanh trong phạm vi góc nhìn nghiêng 90 độ. Điều này sẽ bảo vệ được quyền riêng tư trên của bạn, tránh người khác lén đọc tin nhắn, xem thông...

Tại sao AirPods hay bị hỏng hoặc chai pin một bên tai?

Người dùng tai nghe nhà Táo chắc hẳn đều trải qua tình huống dở khóc dở cười vì Airpods hết pin hoặc chai pin mỗi bên không đều. Việc đang sử dụng tai nghe nhưng một bên thì vẫn hoạt động bình thường, một bên thì lại hết sạch pin khiến người dùng không thể có được trải nghiệm trọn vẹn. Tại sao Airpods hết pin mỗi bên không đều nhauKhông chỉ riêng tai nghe Airpods mà các dòng...

Lão nông phát hiện “báu vật” trăm tỷ trong vườn nhà, chuyên gia ngăn đừng bán

Lão nông ở Trung Quốc phát hiện 3 cây gỗ Kim Tơ Nam Mộc quý hơn 1.000 năm tuổi trong vườn nhà và thương gia đã ra giá hơn 900 tỷ đồng để mua chúng, nhưng bị các chuyên gia ngăn lại. Cây gỗ Kim Tơ Nam Mộc là "báu vật", một...

Apple, Google đối mặt với cuộc điều tra tuân thủ đạo luật mới của EU

Tờ Bloomberg gần đây đưa tin rằng, Apple và Google chuẩn bị trải qua một cuộc điều tra toàn diện của Liên minh Châu Âu (EU) để xác định việc liệu họ có tuân thủ Đạo luật Thị trường Kỹ thuật số mới hay không. Cuộc điều tra có thể dẫn tới những khoản phạt đáng kể cho cả hai công ty công nghệ lớn này.Phía Ủy ban Châu Âu dự kiến ​​sẽ công bố cuộc điều tra...

Mới nhất

Ngoạn mục lễ diễu hành trên đầm Thị Nại của các tay đua mô tô nước thế giới

Chiều 24/3, ông Lâm Hải Giang, Phó Chủ tịch UBND tỉnh Bình Định cùng 55 tay đua mô tô nước giương cao lá cờ tổ quốc diễu hành trên đầm Thị Nại. NGUYỄN GIA - DŨNG NHÂN - TRÀ LYvtcnews.vnNguồn

Nigeria giải cứu thành công 300 học sinh bị những tên cướp bắt cóc

Ông Uba Sani cho biết: “Những học sinh bị bắt cóc ở trường Kuriga đã được thả ra mà không hề hấn gì”. Ông cũng cảm ơn Tổng thống Nigeria...

Việt Nam vào chung kết billiard đồng đội thế giới

ĐứcTrần Quyết Chiến và Bao Phương Vinh viết tiếp lịch sử cho billiards Việt Nam, khi thắng Mỹ tại bán kết giải carom 3 băng đồng đội thế giới. Trong trận bán kết với Mỹ hôm nay 24/3, Quyết Chiến đấu với Raymon Groot, còn Phương Vinh gặp Hugo Patino. Cả hai cơ thủ Mỹ đều nằm ngoài Top...

Nhận diện: Bác bỏ các luận điệu xuyên tạc ổn định chính trị ở Việt Nam

Đất nước chúng ta vừa trải qua một tuần có những sự thay đổi to lớn trong bộ máy chính trị. Và việc xử lý cán bộ vi phạm, khuyết điểm vừa qua một lần nữa cho thấy quyết tâm làm trong sạch bộ máy lãnh đạo của Đảng. Nói đi đôi với làm, Đảng đang thực sự cho...

Mới nhất