Cursor merilis laporan teknis Composer2: Lingkungan RL sepenuhnya mensimulasikan skenario pengguna nyata, skor model dasar meningkat 70%

BlockBeatNews

2026-03-25 06:36:56

Menurut pemantauan 1M AI News, Cursor merilis laporan teknologi Composer 2, mengungkapkan secara lengkap rencana pelatihan. Dasar Kimi K2.5 menggunakan arsitektur MoE, dengan total parameter 1,04 triliun dan parameter aktif 32 miliar. Pelatihan dilakukan dalam dua tahap: pertama, melanjutkan pra-pelatihan pada data kode untuk memperkuat pengetahuan pengkodean, kemudian meningkatkan kemampuan pengkodean end-to-end melalui pembelajaran penguatan skala besar. Lingkungan RL sepenuhnya meniru skenario penggunaan Cursor yang nyata, termasuk pengeditan file, operasi terminal, pencarian kode, dan pemanggilan alat lainnya, memungkinkan model belajar dalam kondisi mendekati lingkungan produksi.

Laporan ini juga memaparkan metode pembangunan benchmark internal CursorBench: mengumpulkan tugas dari sesi pengkodean nyata tim pengembang, bukan dari konstruksi buatan manusia. Dasar Kimi K2.5 hanya mendapatkan skor 36,0 pada benchmark ini. Setelah dua tahap pelatihan, Composer 2 mencapai skor 61,3, meningkat 70%. Cursor menyatakan bahwa biaya inferensi mereka secara signifikan lebih rendah dibandingkan API model terdepan seperti GPT-5.4 dan Claude Opus 4.6, mencapai Pareto optimal antara akurasi dan biaya.

Lihat Asli

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Komentar

0/400

Tidak ada komentar