AI baharu DeepSeek terus mencetuskan keghairahan dalam dunia teknologi dengan prestasinya yang luar biasa. Foto: SCMP . |
DeepSeek secara rasminya memperkenalkan DeepSeek V3-0324, versi terkini dalam keluarga bahasa pemodelan berskala besar (LLM) V3.
Seperti model sebelumnya, model ini dikeluarkan secara percuma dan sumber terbuka melalui platform Hugging Face, dengan kemajuan yang ketara berbanding versi sebelumnya, terutamanya dalam bidang penaakulan dan pengaturcaraan.
Secara khususnya, menurut OpenRouter, DeepSeek V3-0324 dibina menggunakan Mixture of Experts (MoE), kaedah pembelajaran mesin yang sangat popular dalam beberapa model AI Cina dan mempunyai 685 bilion parameter.
Menurut ulasan awal, model ini menunjukkan prestasi yang mengagumkan merentasi pelbagai tugasan. Sementara itu, satu catatan Reddit menunjukkan bahawa DeepSeek V3-0324 telah berjaya mengejar model Sonnet 3.7 Google dalam ujian penjanaan kod.
Sumber juga menunjukkan bahawa DeepSeek V3-0324 mampu menghasilkan coretan kod yang panjang tanpa ralat. Laman web analitik AI Vidhya telah menguji model ini dan menyatakan keupayaannya untuk menghasilkan 700 baris kod dengan lancar.
Pada X, aplikasi DeepSeek V3-0324 juga telah membuat kejutan besar. Bagi membuktikannya, pengguna Deepanshu Sharma telah menyiarkan video yang menunjukkan bahawa model AI ini boleh menjana laman web lengkap dengan lebih 800 baris kod dengan lancar.
DeepSeek menjadi syarikat AI Cina yang paling banyak diperkatakan pada Disember 2024 apabila ia melancarkan DeepSeek-V3. Model ini mencapai prestasi yang setanding dengan GPT-4o tetapi hanya menggunakan sebahagian kecil daripada sumber pengkomputeran.
Tidak lama kemudian, DeepSeek mengeluarkan model penaakulan DeepSeek-R1. Menurut TechCrunch , R1 mengatasi prestasi OpenAI o1 pada penanda aras seperti AIME, MATH-500 dan SWE-bench Verified.
Pada masa yang sama, angka $5.6 juta untuk latihan akhir model DeepSeek juga mengejutkan, berbanding ratusan juta dolar yang dibelanjakan oleh syarikat-syarikat terkemuka Amerika untuk melatih model mereka.
Sumber: https://znews.vn/at-chu-bai-moi-cua-deepseek-lo-dien-post1540831.html






Komen (0)