DeepSeek V4 pertama kali memperkenalkan agen sandbox produksi DSec: penjadwalan satu klaster dengan ratusan ribu concurrency, menyatukan empat jenis basis heterogen

robot
Pembuatan abstrak sedang berlangsung

Menurut pemantauan Beating, laporan teknologi DeepSeek V4 pertama kali mempublikasikan infrastruktur inti yang mendukung pelatihan pasca Agen dan evaluasi massal, yaitu sandbox komputasi elastis tingkat produksi DSec (DeepSeek Elastic Compute).

Saat ini, pembelajaran penguatan model besar membutuhkan lingkungan percobaan kode yang sangat besar. Laporan mengungkapkan bahwa dalam produksi nyata, satu klaster DSec dapat menjadwalkan puluhan ribu sandbox secara bersamaan. Sistem ini ditulis dengan Rust, terhubung dengan sistem file terdistribusi buatan sendiri 3FS, dan melalui pemuatan bertingkat sesuai permintaan (on-demand loading) mengatasi hambatan kinerja dalam cold start sandbox massal.

Dalam pengalaman pengembang, DSec menggunakan satu SDK Python yang menyatukan empat basis eksekusi: panggilan fungsi, wadah, mesin virtual kecil, dan mesin virtual lengkap, cukup dengan mengubah satu parameter saat beralih. Untuk mengatasi masalah umum penyerobotan tugas di klaster komputasi, DSec memperkenalkan log jejak global: saat tugas dipulihkan, sistem akan langsung “melompati” dan memutar ulang hasil eksekusi perintah yang telah di-cache, sehingga mewujudkan pelatihan ulang cepat dan menghindari kesalahan tidak idempoten akibat eksekusi berulang.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan