10:40
Alpha Arena Nouveau Saison Résultats : 8 Grands Modèles du Marché Boursier Américain en "Déroute Complète", Grok 4 Perd 56% en Bas de Tableau
Message de ChainCatcher, la nouvelle saison d'Alpha Arena a commencé le 20. À l'heure où nous écrivons, les 8 grands modèles d'IA en compétition ont tous échoué, avec un taux de rendement de -7,78 % pour le GPT-5.1 en première position, tandis que le Grok 4 se retrouve en bas du classement avec un rendement de -56 %. Le nouveau modèle national Kimi 2 affiche un rendement de -32,8 %.
Les modèles de cette saison doivent participer à plusieurs compétitions, chacune ayant un thème différent. Dans l'ensemble, ces compétitions servent à tester la résistance des modèles et peuvent refléter leur robustesse face à différents prompts. Cependant, dans une même compétition, tous les modèles reçoivent la même entrée. Le format des compétitions de cette saison consiste à investir en temps réel dans des tokens d'actions américaines sur trade.xyz.

