L'équipe d'Elon vient de lâcher une bombe—Grok 4.1 Fast a décroché la couronne sur τ²-Bench pour les flux de travail agents de télécommunications, atteignant 93% de précision et surpassant tout le monde dans le processus. Nous parlons de devancer des poids lourds comme les dernières versions d'Anthropic. La course à l'IA ? Oui, elle vient de devenir beaucoup plus intense. Ce qui semblait être du battage médiatique s'est transformé en chiffres concrets, et maintenant la question n'est pas de savoir si xAI peut rivaliser—c'est qui se débat pour rattraper son retard. Itérations rapides, résultats réels, zéro calme.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
15 J'aime
Récompense
15
5
Reposter
Partager
Commentaire
0/400
FlashLoanPhantom
· Il y a 13h
Ngl, grok a vraiment mis un coup de pied au cul cette fois avec 93 %, avant il y en avait qui disaient que c'était de la manipulation.
Voir l'originalRépondre0
EthSandwichHero
· Il y a 13h
93% de précision ? Anthropic doit vraiment s'inquiéter, xAI joue vraiment le jeu.
Voir l'originalRépondre0
degenwhisperer
· Il y a 13h
franchement, grok a vraiment réveillé beaucoup de gens cette fois, un taux de précision de 93% ce n'est pas une blague. Ceux qui se la pétaient avant devraient s'inquiéter maintenant.
Voir l'originalRépondre0
LightningAllInHero
· Il y a 13h
Franchement, cette fois-ci, grok est vraiment réel, 93 % directement en pleine face, que dit anthropique ?
Voir l'originalRépondre0
ShitcoinConnoisseur
· Il y a 13h
93% ah, ce chiffre est un peu fou... mais ce τ²-Bench ce Benchmark, est-ce vraiment fiable ? Il faut voir si quelqu'un l'a reproduit.
L'équipe d'Elon vient de lâcher une bombe—Grok 4.1 Fast a décroché la couronne sur τ²-Bench pour les flux de travail agents de télécommunications, atteignant 93% de précision et surpassant tout le monde dans le processus. Nous parlons de devancer des poids lourds comme les dernières versions d'Anthropic. La course à l'IA ? Oui, elle vient de devenir beaucoup plus intense. Ce qui semblait être du battage médiatique s'est transformé en chiffres concrets, et maintenant la question n'est pas de savoir si xAI peut rivaliser—c'est qui se débat pour rattraper son retard. Itérations rapides, résultats réels, zéro calme.