GADGETS
Kos latihan DeepSeek R1 18 kali lebih murah daripada model AI lain

Kos sebenar melatih model DeepSeek R1 hanyalah $294,000 menggunakan 512 cip NVIDIA H800, jauh lebih rendah daripada anggaran awal dan model AI lain kerana teknik pembelajaran pengukuhan berasaskan percubaan dan kesilapan. -Foto fail/AP
AWAL tahun ini, model DeepSeek R1 tular di media sosial kerana kemampuannya yang tinggi walaupun dihasilkan oleh firma China yang tidak dikenali ramai.
Ringkasan AI
- Kos sebenar melatih model DeepSeek R1 hanyalah $294,000 menggunakan 512 cip NVIDIA H800, jauh lebih rendah daripada anggaran awal dan model AI lain kerana teknik pembelajaran pengukuhan berasaskan percubaan dan kesilapan.
- Model ini tidak bergantung sepenuhnya pada data yang diberikan manusia, sebaliknya memperoleh jawapan sendiri melalui percubaan, namun sukar menerangkan proses pemikiran secara terperinci.
- DeepSeek R1 terlalu kompleks untuk difahami manusia biasa, berbeza dengan model seperti ChatGPT dan Gemini yang boleh menerangkan jalan kerja dengan lebih jelas.
Rahsia didedahkan dalam kertas kajian yang diterbitkan dalam jurnal Nature. Kos melatih R1 adalah lebih rendah kerana menggunakan teknik pembelajaran pengukuhan berasaskan percubaan dan kesilapan.
Model diberikan markah sekiranya berjaya mencari jawapan sendiri dengan melakukan percubaan dan kesilapan.
Model lain menggunakan data yang diberikan manusia untuk belajar menyelesaikan masalah tertentu. Ini memerlukan masa dan kos lebih tinggi.
Sungguhpun begitu kelemahan model ini ialah ia sukar menerangkan bagaimana ia berfikir untuk mendapatkan jawapan.
Ia terlalu kompleks dan panjang untuk difahami kebanyakan manusia. Kebanyakan model AI seperti ChatGPT dan Gemini boleh menerangkan jalan kerja matematik misalnya dengan lebih ringkas. -Amanz
Must-Watch Video
Cara lain mengikuti berita kami