Pada tanggal 12 September, OpenAI meluncurkan serangkaian model kecerdasan buatan (AI) baru yang mampu menghabiskan lebih banyak waktu berpikir untuk memberikan respons yang lebih akurat dan bermanfaat bagi pengguna.
Model baru, yang dikenal sebagai OpenAI o1-Preview, dirancang untuk menangani tugas-tugas kompleks dan masalah yang lebih sulit dalam sains , pengkodean, dan matematika — area di mana model sebelumnya sering dikritik karena gagal memberikan jawaban yang konsisten.
OpenAI o1-Preview dilatih untuk menyempurnakan proses berpikirnya, menguji berbagai pendekatan, dan mendeteksi kesalahan sebelum memberikan jawaban akhir.
Sam Altman, CEO OpenAI, menyebut model-model baru ini “mampu melakukan penalaran yang kompleks,” meskipun model-model ini mungkin masih memiliki kekurangan dan keterbatasan.
Oleh karena itu, OpenAI masih berupaya meningkatkan kemampuan model AI untuk mengatasi masalah "ilusi" - sebuah fenomena ketika chatbot menciptakan konten yang meyakinkan tetapi tidak akurat.
Peneliti OpenAI Jerry Tworek mengatakan model baru ini akan lebih kecil kemungkinannya untuk menimbulkan masalah “ilusi”, namun tetap saja belum sepenuhnya menyelesaikan masalah tersebut.
Model OpenAI o1-Preview diketahui telah berhasil memecahkan tugas-tugas sulit dalam bidang fisika, kimia, dan biologi pada tingkat PhD.
Khususnya di bidang matematika dan pengodean, OpenAI o1-Preview ini mencapai tingkat akurasi hingga 83% saat menyelesaikan soal-soal ujian masuk Olimpiade Matematika Internasional. Angka ini jauh lebih tinggi daripada tingkat akurasi 13% pada model GPT-4o sebelumnya.
Menurut OpenAI, kemampuan penalaran baru ini dapat membantu peneliti perawatan kesehatan membuat anotasi pada data pengurutan sel, sementara alat tersebut dapat membantu fisikawan mengembangkan rumus yang rumit.
OpenAI juga mengatakan model AI baru telah lulus uji jailbreak yang ketat dan tahan terhadap upaya menerobos penghalang keamanan.
Langkah-langkah keamanan juga telah ditingkatkan, termasuk perjanjian baru-baru ini dengan Institut Keamanan AI AS dan Inggris, yang telah diberikan akses awal ke model-model ini untuk pengujian dan evaluasi.
[iklan_2]
Sumber: https://laodong.vn/cong-nghe/openai-ra-mat-sieu-ai-moi-voi-kha-nang-lap-luan-1393825.ldo
Komentar (0)