OpenAI cho biết, họ đã phát hành hai mô hình ngôn ngữ trọng lượng mở vượt trội về khả năng suy luận nâng cao và được tối ưu hóa để chạy trên máy tính xách tay với mức hiệu suất tương tự như các mô hình suy luận độc quyền 4o-mini của họ.
Các tham số hoặc trọng số được đào tạo của mô hình ngôn ngữ trọng số mở có thể truy cập công khai, được các nhà phát triển sử dụng để phân tích và tinh chỉnh mô hình cho các tác vụ cụ thể mà không cần dữ liệu đào tạo gốc.
"Một trong những điểm độc đáo của các mô hình mở là mọi người có thể chạy chúng cục bộ. Mọi người có thể chạy chúng sau tường lửa của riêng mình, trên cơ sở hạ tầng của riêng họ", Greg Brockman, đồng sáng lập OpenAI, phát biểu trong một cuộc họp báo.

Phiên bản 120B và 20B gpt-oss có thể vận hành nội tại trên laptop.
Các mô hình ngôn ngữ trọng lượng mở khác với các mô hình nguồn mở, cung cấp quyền truy cập vào toàn bộ mã nguồn, dữ liệu đào tạo và phương pháp luận.
Riêng Amazon đã công bố các mô hình trọng số mở của OpenAI hiện đã có mặt trên thị trường AI tạo sinh Bedrock của Amazon Web Services. Đây là lần đầu tiên một mô hình OpenAI được cung cấp trên Bedrock, Atul Deo, giám đốc sản phẩm của Bedrock, cho biết.
"OpenAI đã và đang phát triển những mô hình tuyệt vời, và chúng tôi tin rằng những mô hình này sẽ là những lựa chọn nguồn mở tuyệt vời, hoặc những lựa chọn mô hình mở cho khách hàng", Deo phát biểu trong một cuộc phỏng vấn. Ông từ chối thảo luận về bất kỳ thỏa thuận hợp đồng nào giữa AWS và OpenAI.
Amazon tuần trước sau khi công ty báo cáo tốc độ tăng trưởng chậm lại của đơn vị AWS, đặc biệt là khi so sánh với các đối thủ cạnh tranh.

Mô hình gpt-oss-20b được bán trên sàn thương mại điện tử Sage Maker.
Bối cảnh của các mô hình AI mã nguồn mở và trọng lượng mở đã gây ra nhiều tranh cãi trong năm nay. Trong một thời gian, các mô hình Llama của META được coi là tốt nhất, nhưng điều đó đã thay đổi vào đầu năm nay khi DeepSeek của Trung Quốc phát hành một mô hình lý luận mạnh mẽ và hiệu quả về chi phí, trong khi Meta chật vật để phát triển Llama 4.
Hai mô hình OpenAI mới là những mô hình mở đầu tiên mà OpenAI phát hành kể từ GPT-2, được phát hành vào năm 2019.
Công ty cho biết mô hình lớn hơn của OpenAI, gpt-oss-120b, có thể chạy trên một GPU duy nhất và mô hình thứ hai, gpt-oss-20b, đủ nhỏ để chạy trực tiếp trên máy tính cá nhân.
OpenAI cho biết các mô hình này có hiệu suất tương tự như các mô hình suy luận độc quyền của họ có tên là o3-mini và o4-mini, và đặc biệt vượt trội trong việc lập trình, toán thi đấu và các truy vấn liên quan đến sức khỏe.
Các mô hình được đào tạo trên một tập dữ liệu chỉ có văn bản, ngoài kiến thức chung, còn tập trung vào kiến thức khoa học, toán học và lập trình. OpenAI không công bố điểm chuẩn so sánh các mô hình open-weight với các mô hình của đối thủ cạnh tranh như mô hình DeepSeek-R1.
OpenAI được Microsoft hỗ trợ, hiện tại được đánh giá cao với mức giá 300 tỷ đô la, hiện đang huy động tới 40 tỷ đô la trong vòng tài trợ mới do Softbank Group dẫn đầu.
Nguồn: https://khoahocdoisong.vn/openai-phat-hanh-phien-ban-open-weight-co-the-chay-tren-laptop-post2149044060.html
Bình luận (0)