Theo theo dõi của 1M AI News, công ty Fireworks AI, chuyên về hạ tầng triển khai AI, đã ra mắt bản xem trước Fireworks Training, mở rộng từ nền tảng triển khai thuần túy sang nền tảng tích hợp cho đào tạo và triển khai. Fireworks AI được thành lập bởi Lâm Thiệu, cựu kỹ sư của Meta, tham gia vào việc phát triển PyTorch, hiện được định giá 4Bỷ đô la, xử lý 15 nghìn tỷ token mỗi ngày. Nền tảng cung cấp ba cấp độ: 1. Agent đào tạo: dành cho các nhóm sản phẩm không có hạ tầng học máy, cho phép họ mô tả nhiệm vụ và tải dữ liệu để hoàn tất toàn bộ quá trình từ đào tạo đến triển khai, hiện chỉ hỗ trợ LoRA; 2. Đào tạo quản lý: nhắm vào các kỹ sư học máy, hỗ trợ SFT, DPO và huấn luyện tăng cường, bao gồm huấn luyện tham số toàn diện; 3. API đào tạo: hướng tới các nhóm nghiên cứu, cho phép tùy chỉnh hàm mất mát và vòng lặp đào tạo, hỗ trợ các thuật toán như GRPO và DAPO, với quy mô huấn luyện tham số toàn diện từ Qwen3 8B một nút đến Kimi K2.5 (nghìn tỷ tham số) trên 64 NVIDIA B200. Khách hàng của Fireworks AI trong lĩnh vực triển khai sản xuất, công cụ lập trình AI Cursor, Vercel và Genspark đã hoàn thành huấn luyện tăng cường tiên tiến trên nền tảng này. Vercel đã huấn luyện mô hình sửa lỗi tự động cho sản phẩm tạo mã v0 của mình, đạt 93% mã không lỗi, so với chỉ 62% của Sonnet 3.5, và cải thiện độ trễ từ đầu đến cuối gấp 40 lần so với mô hình đóng trước đó. Genspark đã huấn luyện lại mô hình mở rộng với 1 nghìn tỷ tham số Kimi K2 bằng học tăng cường để tạo ra một tác nhân nghiên cứu sâu, tăng 33% sử dụng công cụ và giảm chi phí 50%. Cursor đã hoàn thành huấn luyện phân tán với học tăng cường cho Composer 2 trên 3-4 cụm toàn cầu (hiện đứng đầu CursorBench), chia sẻ cùng một nhóm GPU cho huấn luyện và triển khai sản xuất. Fireworks AI nhấn mạnh điểm khác biệt công nghệ chính của mình là sự nhất quán số giữa huấn luyện và triển khai. Các mô hình MoE (Nhóm chuyên gia hỗn hợp) mỏng hơn nhiều so với các mô hình dày đặc, nơi những thay đổi nhỏ trong trạng thái ẩn có thể thay đổi tuyến đường của các chuyên gia và làm tăng hiệu ứng dây chuyền. Fireworks đã công bố các giá trị KL-divergence giữa huấn luyện và triển khai cho tất cả các mô hình được hỗ trợ, tất cả đều dưới 0.01.

Xem bản gốc
post-image
post-image
post-image
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • 1
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
KatyPatyvip
· 8giờ trước
Đến Mặt Trăng 🌕
Xem bản gốcTrả lời0
  • Ghim