DeepSeek lebih fokus pada penelitian dan pengembangan model-model baru, daripada sering muncul di media. Foto: SCMP . |
Bekerja sama dengan para peneliti dari Universitas Tsinghua, DeepSeek telah memperkenalkan metode baru untuk meningkatkan kemampuan inferensi model bahasa besar (LLM). Metode ini, yang dipublikasikan dalam sebuah makalah penelitian pada malam tanggal 4 April, membantu LLM menghasilkan hasil yang lebih baik dan lebih cepat untuk kueri umum.
Teknik ini menggabungkan dua metode yang sebelumnya sukses dari DeepSeek. Salah satunya adalah pemodelan imbalan generatif (GRM), yang memungkinkan model AI untuk mengevaluasi diri sendiri dan memperbaiki responsnya berdasarkan hasil sebelumnya, dan yang lainnya adalah penyetelan kritik berdasarkan prinsip sendiri.
Kedua metode tersebut bergantung pada aspek "pembelajaran mandiri" dari AI, mengurangi ketergantungan pada umpan balik atau panduan langsung dari manusia, tetapi dengan tujuan memberikan hasil yang lebih mendekati harapan manusia.
Menurut para peneliti, meskipun merupakan metode baru, DeepSeek-GRM mencapai hasil yang luar biasa dan mampu bersaing dengan model AI paling terkenal dan efektif yang tersedia saat ini. DeepSeek berencana untuk merilis model GRM sebagai perangkat lunak sumber terbuka, tetapi belum ada jangka waktu spesifik yang diberikan.
Setelah memberikan dampak global dengan model platform V3 dan model inferensi R1-nya, DeepSeek menerbitkan makalah akademis ini di arsip ilmiah daring arXiv, yang memicu rasa ingin tahu tentang langkah selanjutnya perusahaan tersebut.
Reuters memperkirakan bahwa DeepSeek-R2, penerus R1, dapat diluncurkan pada bulan April, mengingat popularitas pendahulunya yang terus berlanjut. DeepSeek-R1 sebelumnya menyebabkan sensasi global di dunia teknologi berkat kinerjanya yang unggul relatif terhadap biaya, membuatnya mampu bersaing dengan model-model terkemuka saat ini.
DeepSeek tetap bungkam mengenai rumor tersebut. Namun, menurut sumber lokal, akun layanan pelanggan DeepSeek membantah informasi tersebut dalam obrolan grup dengan klien perusahaan.
Didirikan di Hangzhou pada tahun 2023 oleh pengusaha Liang Wenfeng, DeepSeek dengan cepat menarik perhatian global dalam beberapa bulan terakhir. Namun, alih-alih memanfaatkan ketenarannya di mata publik, perusahaan ini memfokuskan sumber dayanya pada penelitian dan pengembangan.
Sebelumnya, DeepSeek telah meningkatkan model V3-nya dengan merilis versi DeepSeek-V3-0324. Menurut pengumuman tersebut, pembaruan ini menghadirkan kemampuan penalaran yang ditingkatkan, optimasi untuk pengembangan antarmuka pengguna web front-end, dan peningkatan kemampuan menulis bahasa Mandarin.
Pada bulan Februari, perusahaan rintisan ini juga membuka akses ke lima repositori kode sumber, menegaskan komitmennya terhadap "kemajuan dengan transparansi penuh." Pada bulan yang sama, perusahaan tersebut mengumumkan studi teknis tentang "perhatian jarang asli," yang membantu meningkatkan kinerja LLM dalam menangani sejumlah besar data.
DeepSeek dipandang sebagai simbol dinamisme industri AI Tiongkok, pada saat AS berupaya mengekang perkembangan teknologi negara tersebut.
Sumber: https://znews.vn/deepseek-gay-to-mo-post1543900.html






Komentar (0)