Elon'un ekibi bir bomba patlattı—Grok 4.1 Fast, telekom ajans iş akışları için τ²-Bench'te taç aldı, %93 doğruluk oranına ulaştı ve sürecin her aşamasında herkesi geride bıraktı. Anthropic'in en son yapıları gibi ağır topları geride bırakmaktan bahsediyoruz. AI yarışı mı? Evet, şimdi çok daha ateşli hale geldi. Görünen o ki, heyecan gerçek sayılara dönüştü ve şimdi soru, xAI'nin rekabet edebilir olup olmadığı değil—kimlerin yetişmeye çalıştığı. Hızlı iterasyonlar, gerçek sonuçlar, sıfır rahatlık.
View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
15 Likes
Reward
15
5
Repost
Share
Comment
0/400
FlashLoanPhantom
· 21h ago
ngl grok bu sefer %93 gerçekten yüzüme vurdu, daha önce bazıları bunun bir şişirme olduğunu söylemişti.
View OriginalReply0
EthSandwichHero
· 21h ago
%93 doğruluk oranı mı? Bu durumda Anthropic telaşlanacak, xAI gerçekten işin ciddisine bindi.
View OriginalReply0
degenwhisperer
· 21h ago
ngl grok bu sefer gerçekten bir sürü insanı uyandırdı, %93 doğruluk oranı şaka değil. Daha önce inanılmaz diyenler şimdi panik olmalı.
View OriginalReply0
LightningAllInHero
· 21h ago
ngl bu sefer grok gerçekten geldi, %93 doğrudan yüzüme çarptı, anthropic ne diyor
View OriginalReply0
ShitcoinConnoisseur
· 21h ago
%93 ah, bu rakam biraz çılgın... Ama τ²-Bench bu benchmark testinin gerçekten güvenilir olup olmadığını görmek için başkalarının bunu yeniden üretüp üretmediğine bakmamız gerekiyor.
Elon'un ekibi bir bomba patlattı—Grok 4.1 Fast, telekom ajans iş akışları için τ²-Bench'te taç aldı, %93 doğruluk oranına ulaştı ve sürecin her aşamasında herkesi geride bıraktı. Anthropic'in en son yapıları gibi ağır topları geride bırakmaktan bahsediyoruz. AI yarışı mı? Evet, şimdi çok daha ateşli hale geldi. Görünen o ki, heyecan gerçek sayılara dönüştü ve şimdi soru, xAI'nin rekabet edebilir olup olmadığı değil—kimlerin yetişmeye çalıştığı. Hızlı iterasyonlar, gerçek sonuçlar, sıfır rahatlık.