Vietnam.vn - Nền tảng quảng bá Việt Nam

Kajian baharu mendedahkan rahsia kejayaan DeepSeek.

Menurut DeepSeek, model kecerdasan buatan R1 tidak dilatih menggunakan data daripada model OpenAI, walaupun ia mengakui bahawa model asas dilatih pada data web – yang mungkin termasuk kandungan yang dijana AI.

VietnamPlusVietnamPlus17/09/2025

Model kecerdasan buatan R1 daripada syarikat baharu China, DeepSeek – yang mencetuskan kekecohan di pasaran saham AS ketika ia dilancarkan pada Januari – telah didedahkan dalam satu kajian yang dikaji semula oleh rakan sebaya, menunjukkan bagaimana syarikat itu membangunkan LLM yang berkuasa dengan kos hanya kira-kira $300,000.

R1 direka bentuk untuk cemerlang dalam tugasan penaakulan seperti matematik dan pengaturcaraan, menjadi pesaing kos rendah kepada alat yang dibangunkan oleh syarikat teknologi Amerika.

Ini merupakan model "berat terbuka", tersedia untuk muat turun percuma dan kini merupakan model paling popular di platform Hugging Face, dengan lebih 10.9 juta muat turun.

Satu kajian terkini dalam Nature, berdasarkan manuskrip Januari, mendedahkan buat kali pertama bahawa kos latihan R1 hanya $294,000, sebagai tambahan kepada kira-kira $6 juta untuk membina model asas.

Angka ini jauh lebih rendah daripada puluhan juta dolar yang dipercayai telah dibelanjakan oleh pesaing.

DeepSeek melaporkan bahawa R1 dilatih terutamanya menggunakan cip Nvidia H800 – sejenis yang dilarang oleh AS daripada dieksport ke China sejak 2023.

Kejayaan R1 terletak pada penerapan kaedah "pembelajaran peneguhan tulen", yang bermaksud model tersebut diberikan percubaan dan kesilapan serta memberi ganjaran kepada dirinya sendiri kerana memberikan jawapan yang betul, bukannya belajar daripada contoh yang dipilih oleh manusia. Model ini juga menilai sendiri usahanya menggunakan anggaran dalaman, satu teknik yang dipanggil "pengoptimuman dasar kumpulan relatif", yang meningkatkan kecekapan.

Menurut penyelidik Huan Sun (Ohio State University), "proses semakan rakan sebaya yang ketat membantu mengesahkan nilai dan kebolehpercayaan model. Syarikat lain harus melakukan perkara yang sama."

Lewis Tunstall, seorang jurutera pembelajaran mesin di Hugging Face, percaya ini menetapkan duluan penting kerana ketelusan dalam pembangunan AI membantu menilai risiko dengan lebih tepat.

DeepSeek menegaskan bahawa R1 tidak dilatih menggunakan data daripada model OpenAI, walaupun ia mengakui bahawa model asas dilatih pada data web—yang mungkin termasuk kandungan yang dijana AI.

Pakar percaya bahawa walaupun sukar untuk disahkan secara muktamad, bukti semasa menunjukkan bahawa kaedah peningkatan tulen sudah mencukupi untuk mencapai prestasi tinggi.

Pada penanda aras ScienceAgentBench, R1 tidak menduduki tempat pertama dari segi ketepatan tetapi mencapai keseimbangan yang baik antara kecekapan dan kos. Para penyelidik kini sedang berusaha untuk menggunakan kaedah DeepSeek bagi meningkatkan keupayaan penaakulan LLM sedia ada, serta mengembangkannya ke bidang melangkaui matematik dan pengaturcaraan.

Menurut Tunstall, R1 telah "melancarkan revolusi" dalam pembangunan kecerdasan buatan.

(VNA/Vietnam+)

Sumber: https://www.vietnamplus.vn/nghien-cuu-moi-tiet-lo-bi-quyet-thanh-cong-cua-deepseek-post1062474.vnp


Komen (0)

Sila tinggalkan komen untuk berkongsi perasaan anda!

Dalam topik yang sama

Dalam kategori yang sama

Daripada pengarang yang sama

Warisan

Rajah

Perniagaan

Hal Ehwal Semasa

Sistem Politik

Tempatan

Produk

Happy Vietnam
Gembira dengan masa depan

Gembira dengan masa depan

Festival Tanah Muong

Festival Tanah Muong

Pergi ke pasar

Pergi ke pasar