GADGETS

Kos latihan DeepSeek R1 18 kali lebih murah daripada model AI lain

Amanz 20/09/2025 | 03:15 MYT

Kos sebenar melatih model DeepSeek R1 hanyalah $294,000 menggunakan 512 cip NVIDIA H800, jauh lebih rendah daripada anggaran awal dan model AI lain kerana teknik pembelajaran pengukuhan berasaskan percubaan dan kesilapan. -Foto fail/AP

AWAL tahun ini, model DeepSeek R1 tular di media sosial kerana kemampuannya yang tinggi walaupun dihasilkan oleh firma China yang tidak dikenali ramai.

Ringkasan AI

Kos sebenar melatih model DeepSeek R1 hanyalah $294,000 menggunakan 512 cip NVIDIA H800, jauh lebih rendah daripada anggaran awal dan model AI lain kerana teknik pembelajaran pengukuhan berasaskan percubaan dan kesilapan.
Model ini tidak bergantung sepenuhnya pada data yang diberikan manusia, sebaliknya memperoleh jawapan sendiri melalui percubaan, namun sukar menerangkan proses pemikiran secara terperinci.
DeepSeek R1 terlalu kompleks untuk difahami manusia biasa, berbeza dengan model seperti ChatGPT dan Gemini yang boleh menerangkan jalan kerja dengan lebih jelas.

Pada waktu tersebut muncul laporan kos melatih model ini ialah sekitar $5.58 juta (~RM 23.46) yang adalah jauh lebih murah berbanding kos model AI yang lain dan menggunakan cip lam NVIDIA. Akibatnya saham NVIDIA susut seketika.

Pagi ini kos sebenar melatih DeepSeek R1 didedahkan hanyalah $294,000 (~RM 1.24 juta) dan menggunakan 512 cip NVIDIA H800.

Rahsia didedahkan dalam kertas kajian yang diterbitkan dalam jurnal Nature. Kos melatih R1 adalah lebih rendah kerana menggunakan teknik pembelajaran pengukuhan berasaskan percubaan dan kesilapan.

Model diberikan markah sekiranya berjaya mencari jawapan sendiri dengan melakukan percubaan dan kesilapan.

Model lain menggunakan data yang diberikan manusia untuk belajar menyelesaikan masalah tertentu. Ini memerlukan masa dan kos lebih tinggi.

Sungguhpun begitu kelemahan model ini ialah ia sukar menerangkan bagaimana ia berfikir untuk mendapatkan jawapan.

Ia terlalu kompleks dan panjang untuk difahami kebanyakan manusia. Kebanyakan model AI seperti ChatGPT dan Gemini boleh menerangkan jalan kerja matematik misalnya dengan lebih ringkas. -Amanz

#ChatGPT #DeepSeek R1 #cip NVIDIA H800 #model AI