Đội ngũ của Elon vừa Thả một thông tin gây sốc—Grok 4.1 Fast đã chiếm lấy vương miện trên τ²-Bench cho các quy trình làm việc của đại lý viễn thông, đạt 93% độ chính xác và vượt trội hơn hẳn những người khác trong quá trình này. Chúng ta đang nói đến việc vượt qua những ông lớn như các phiên bản mới nhất của Anthropic. Cuộc đua AI? Vâng, nó vừa trở nên nóng hơn rất nhiều. Những gì từng nhìn như là sự phóng đại giờ đã biến thành những con số cứng, và bây giờ câu hỏi không phải là liệu xAI có thể cạnh tranh hay không—mà là ai đang phải nỗ lực để bắt kịp. Các vòng lặp nhanh, kết quả thực, không có sự bình tĩnh.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
15 thích
Phần thưởng
15
5
Đăng lại
Retweed
Bình luận
0/400
FlashLoanPhantom
· 20giờ trước
ngl grok lần này 93% thực sự đã vả vào mặt, trước đây còn có người nói là làm màu.
Xem bản gốcTrả lời0
EthSandwichHero
· 20giờ trước
93% độ chính xác? Lần này Anthropic phải lo lắng rồi, xAI thực sự đang chơi nghiêm túc đấy.
Xem bản gốcTrả lời0
degenwhisperer
· 20giờ trước
ngl grok lần này thật sự đã đánh thức một đống người, tỷ lệ chính xác 93% không phải là đùa. Những người trước đây đã khoe khoang giờ chắc hẳn đang hoảng sợ.
Xem bản gốcTrả lời0
LightningAllInHero
· 21giờ trước
không nói dối lần này grok thực sự đến, 93% đập thẳng vào mặt, anthropic nói sao
Xem bản gốcTrả lời0
ShitcoinConnoisseur
· 21giờ trước
93% à, con số này có chút mạnh... nhưng bài kiểm tra τ²-Bench này có đáng tin không, vẫn phải xem có ai tái hiện không.
Đội ngũ của Elon vừa Thả một thông tin gây sốc—Grok 4.1 Fast đã chiếm lấy vương miện trên τ²-Bench cho các quy trình làm việc của đại lý viễn thông, đạt 93% độ chính xác và vượt trội hơn hẳn những người khác trong quá trình này. Chúng ta đang nói đến việc vượt qua những ông lớn như các phiên bản mới nhất của Anthropic. Cuộc đua AI? Vâng, nó vừa trở nên nóng hơn rất nhiều. Những gì từng nhìn như là sự phóng đại giờ đã biến thành những con số cứng, và bây giờ câu hỏi không phải là liệu xAI có thể cạnh tranh hay không—mà là ai đang phải nỗ lực để bắt kịp. Các vòng lặp nhanh, kết quả thực, không có sự bình tĩnh.