Meta cho biết họ sẽ bắt đầu tung ra Llama 3 trong vài tuần tới, trong khi OpenAI do Microsoft hậu thuẫn nói rằng phiên bản GPT-5 sẽ “sớm ra mắt”.
“Chúng tôi đang nỗ lực tìm cách khiến những mô hình này không chỉ biết nói chuyện mà còn thực sự lý luận, lập kế hoạch và có trí nhớ”, Joelle Pineau, Phó chủ tịch nghiên cứu AI tại Meta cho biết.
Giám đốc điều hành của OpenAI, Brad Lightcap, nói với FT trong một cuộc phỏng vấn rằng thế hệ GPT tiếp theo sẽ cho thấy sự tiến bộ trong việc giải quyết “các vấn đề khó” như lý luận. “Chúng ta sẽ bắt đầu thấy AI có thể đảm nhận những nhiệm vụ phức tạp hơn theo cách phức tạp hơn”.
Lightcap cho biết thêm, mặc dù các hệ thống AI ngày nay “thực hiện các nhiệm vụ nhỏ, một lần rất tốt”, nhưng khả năng của chúng vẫn mới chỉ được khai thác “khá hẹp”.
Các bản nâng cấp của Meta và OpenAI là một phần trong làn sóng các mô hình ngôn ngữ lớn mới đang được các công ty bao gồm Google, Anthropic và Cohere phát hành trong năm nay.
Lập luận và lập kế hoạch là những bước quan trọng hướng tới cái mà các nhà nghiên cứu AI gọi là “trí thông minh nhân tạo tổng hợp” – nhận thức ở cấp độ con người, cho phép chatbot và trợ lý ảo hoàn thành chuỗi nhiệm vụ liên quan và dự đoán kết quả của hành động.
Yann LeCun, trưởng nhóm nghiên cứu AI của Meta cho hay, các hệ thống AI hiện tại tạo ra kết quả bằng việc chắp nối từ này đến từ khác mà không thực sự “suy nghĩ và lập kế hoạch”. Chúng gặp khó khăn khi giải quyết những câu hỏi phức tạp hoặc ghi nhớ thông tin trong thời gian dài, từ đó dẫn đến “những sai lầm ngu ngốc”.
Meta có kế hoạch nhúng mô hình AI mới vào WhatsApp và kính thông minh Ray-Ban. Họ đang chuẩn bị phát hành Llama 3 với nhiều phiên bản kích cỡ, dành cho các ứng dụng và thiết bị khác nhau trong những tháng tới.
Chris Cox, Giám đốc sản phẩm của Meta, chia sẻ ví dụ về khả năng của Llama 3 khi tích hợp lên kính thông minh, chẳng hạn như hướng dẫn người đeo sửa chữa máy pha cafe.