Tin tức Gate News, ngày 25 tháng 3, Cursor đã phát hành báo cáo kỹ thuật về Composer 2, lần đầu tiên tiết lộ toàn bộ phương án huấn luyện. Mẫu nền Kimi K2.5 sử dụng kiến trúc MoE, tổng số tham số 1.04 nghìn tỷ, tham số kích hoạt 32 tỷ. Quá trình huấn luyện gồm hai giai đoạn: đầu tiên tiếp tục huấn luyện trên dữ liệu mã để tăng cường kiến thức mã hóa, sau đó nâng cao khả năng mã hóa end-to-end thông qua học tăng cường quy mô lớn. Môi trường RL mô phỏng hoàn toàn các tình huống sử dụng Cursor thực tế, bao gồm chỉnh sửa tệp, thao tác terminal, tìm kiếm mã và các công cụ gọi lệnh, giúp mô hình học trong điều kiện gần như môi trường sản xuất. Báo cáo cũng công bố phương pháp xây dựng chuẩn mực tự phát triển CursorBench: thu thập nhiệm vụ từ các cuộc hội thoại mã thực tế của nhóm kỹ thuật, thay vì tạo thủ công. Mẫu nền Kimi K2.5 đạt điểm 36.0 trên chuẩn này, sau hai giai đoạn huấn luyện, Composer 2 đạt 61.3 điểm, tăng 70%. Cursor cho biết, chi phí suy luận của họ thấp hơn rõ rệt so với một số API của các mô hình lớn tiên tiến, đạt tối ưu Pareto giữa độ chính xác và chi phí.