Vietnam.vn - Nền tảng quảng bá Việt Nam

DeepSeek bị soán ngôi

Mô hình AI mang tên Qwen3 của Alibaba đã vượt qua R1 trong các bài kiểm tra LiveBench đánh giá khả năng mô hình mã nguồn mở bao gồm lập trình, toán học và phân tích dữ liệu.

ZNewsZNews06/05/2025

Qwen3, công nghệ mới ra mắt từ Alibaba. Ảnh: SCMP.

Theo các bài kiểm tra tiêu chuẩn mới nhất của giới AI, mô hình trí tuệ nhân tạo Qwen3 mới được phát hành của Alibaba đã vượt qua R1 của DeepSeek để trở thành mô hình nguồn mở được xếp hạng cao nhất thế giới.

Cụ thể, dữ liệu từ LiveBench, một nền tảng độc lập chấm điểm các mô hình ngôn ngữ lớn (LLM), công nghệ nền tảng cho các dịch vụ AI tạo sinh như ChatGPT, cho thấy Qwen3 đã vượt qua R1 trong các bài kiểm tra.

Bài đánh giá khả năng của các mô hình AI mã nguồn mở bao gồm lập trình, toán học, phân tích dữ liệu và hướng dẫn ngôn ngữ.

Loạt mô hình AI mang tên Qwen3 được Alibaba phát hành vào ngày 28/4 vừa qua. Công ty tuyên bố chatbot này có thể sánh ngang, thậm chí vượt trội các mô hình tốt nhất hiện nay từ OpenAI hay Google trong một số trường hợp.

Với kích thước lên đến 235 tỷ tham số, Qwen3 có hiệu suất làm việc ngang bằng với DeepSeek-V2 và OpenAI GPT-4, lần lượt sở hữu khoảng 236 tỷ và 175 tỷ tham số. Người dùng sẽ sớm có thể tải xuống bằng giấy phép mở trên nền tảng phát triển AI Hugging Face và Github một khi loạt mô hình này được phát hành.

Công ty cho biết bộ sưu tập Qwen3 bao gồm những mô hình lai, nghĩa là chúng có thể linh hoạt thời gian để suy luận giải quyết vấn đề phức tạp hoặc nhanh chóng phản hồi yêu cầu đơn giản. Trong đó, khả năng suy luận giúp mô hình tự kiểm tra tính chính xác của thông tin, nhưng nhận lại độ trễ cao.

Thiết kế này giúp người dùng dễ dàng phân bố ngân sách phù hợp cho từng tác vụ cụ thể. Ngoài ra, mô hình này cũng học hỏi từ nhiều từ đối thủ trên thế giới.

Sử dụng kiến trúc "mixture of experts" (MoE) giống DeepSeek, Qwen3 có thể tối ưu hiệu suất tính toán nhưng chỉ dùng phần nhỏ chi phí huấn luyện. Đây là phương pháp chia nhỏ tác vụ thành nhiều phần việc riêng biệt và chỉ đề xuất một lượng dữ liệu chuyên sâu vừa đủ để thực hiện.

Theo đội ngũ phát triển, Qwen3 hỗ trợ tới 119 ngôn ngữ và được huấn luyện trên một tập dữ liệu gần 36.000 tỷ token, tương đương 27.000 tỷ từ. Dữ liệu đào tạo được lấy từ nhiều nguồn như sách giáo khoa, bộ câu hỏi - đáp án, đoạn mã lập trình, hay do AI tự tạo ra,...

Dù đứng đầu bảng xếp hạng mã nguồn mở, bài kiểm tra mở rộng của LiveBench cho thấy Qwen3 vẫn xếp sau các mô hình AI nguồn đóng hàng đầu thế giới. Nổi bật nhất trong số này lần lượt là o3 của OpenAI, Gemini Pro 2.5 của Google và Claude 3.7 của Anthropic.

Hiện tại, mô hình cao cấp nhất của OpenAI do Microsoft hỗ trợ, o3-mini high là cái tên đứng đầu bảng xếp hạng tổng thể các mô hình AI trên thế giới.

Nguồn: https://znews.vn/deepseek-bi-soan-ngoi-post1551500.html


Bình luận (0)

Hãy bình luận để chia sẻ cảm nhận của bạn nhé!

Cùng chuyên mục

NSND Xuân Bắc làm "chủ hôn" cho 80 cặp đôi cưới chung ở phố đi bộ Hồ Gươm
Nhà thờ Đức Bà TP HCM rực rỡ ánh sáng đón Giáng sinh 2025
Thiếu nữ Hà Nội "lên đồ" xinh lung linh cho mùa Giáng sinh
Bừng sáng sau bão lũ, làng hoa cúc Tết tại Gia Lai mong đừng cúp điện để cứu cây

Cùng tác giả

Di sản

Nhân vật

Doanh nghiệp

Quán cà phê Hà Nội gây sốt với khung cảnh Noel như trời Âu

Thời sự

Hệ thống Chính trị

Địa phương

Sản phẩm

Footer Banner Agribank
Footer Banner LPBank
Footer Banner MBBank
Footer Banner VNVC
Footer Banner Agribank
Footer Banner LPBank
Footer Banner MBBank
Footer Banner VNVC
Footer Banner Agribank
Footer Banner LPBank
Footer Banner MBBank
Footer Banner VNVC
Footer Banner Agribank
Footer Banner LPBank
Footer Banner MBBank
Footer Banner VNVC