Quét để tải ứng dụng Gate
qrCode
Thêm tùy chọn tải xuống
Không cần nhắc lại hôm nay

Phiên bản Grok mới nhất vừa Thả một số con số thú vị. Phiên bản 4.1 Nhanh với khả năng lý luận đạt 93.5 trên chuẩn mở rộng NYT Connections—đó là mức tăng 1.4 điểm so với 92.1 của phiên bản trước.



Điều gì đã thu hút sự chú ý? Chế độ tiêu chuẩn (không lý luận) cũng đã có sự tăng trưởng, leo lên 25,8. Không có thông báo rầm rộ, chỉ là các chỉ số hiệu suất được cập nhật một cách âm thầm.

Để cung cấp bối cảnh, những tiêu chuẩn này kiểm tra các mô hình ngôn ngữ trên các nhiệm vụ nhận dạng mẫu phức tạp. Sự cải thiện của chế độ lý luận cho thấy khả năng xử lý logic được nâng cao, trong khi việc nâng cấp mô hình cơ bản chỉ ra những cải tiến về kiến trúc tổng thể.

Các bản cập nhật phiên bản như thế này thường phản ánh các tối ưu hóa đào tạo lặp đi lặp lại hơn là thiết kế lại cơ bản. Tuy nhiên, những cải tiến nhất quán ở cả hai chế độ chỉ ra tiến bộ có ý nghĩa trong khả năng của mô hình.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • 2
  • Đăng lại
  • Retweed
Bình luận
0/400
TheShibaWhisperervip
· 11-27 09:34
Lại lén lút nâng cấp? Cách làm của Grok thật khôn ngoan, số liệu có thể xem nhưng không có tin tức gì đặc sắc🤔
Xem bản gốcTrả lời0
  • Ghim