Theo theo dõi của 1M AI News, Cursor đã phát hành báo cáo kỹ thuật về Composer 2, lần đầu tiên tiết lộ toàn bộ phương án huấn luyện. Nền tảng Kimi K2.5 sử dụng kiến trúc MoE, có tổng số tham số 1.04 nghìn tỷ, tham số kích hoạt 32 tỷ. Quá trình huấn luyện gồm hai giai đoạn: đầu tiên tiếp tục huấn luyện trước trên dữ liệu mã để tăng cường kiến thức mã hóa, sau đó nâng cao khả năng mã hóa end-to-end thông qua học tăng cường quy mô lớn. Môi trường RL mô phỏng hoàn toàn các tình huống sử dụng thực tế của Cursor, bao gồm chỉnh sửa tệp, thao tác terminal, tìm kiếm mã và các công cụ gọi khác, giúp mô hình học trong điều kiện gần như môi trường sản xuất.
Báo cáo cũng công bố phương pháp xây dựng chuẩn mực tự phát triển CursorBench: thu thập nhiệm vụ từ các cuộc hội thoại mã thực tế của nhóm kỹ thuật, thay vì tạo thủ công. Nền tảng Kimi K2.5 trên chuẩn này chỉ đạt 36.0 điểm, sau hai giai đoạn huấn luyện, Composer 2 đạt 61.3 điểm, tăng 70%. Cursor cho biết chi phí suy luận của họ thấp hơn đáng kể so với các mô hình tiên tiến như GPT-5.4 và Claude Opus 4.6, đạt được tối ưu Pareto giữa độ chính xác và chi phí.