PANews a rapporté le 27 février que, selon Cointelegraph, le laboratoire d’IA open source Sentient a annoncé le lancement d’Arena, un environnement de test de qualité production pour évaluer les performances des agents IA dans les flux de travail au niveau des entreprises. Les divisions d’actifs numériques de Pantera Capital et Franklin Templeton ont rejoint la première cohorte de test d’Arena.
Sentient a indiqué qu’Arena n’est pas un test statique de modèle, mais teste plutôt l’agent IA sur une tâche standardisée en simulant les conditions d’entreprise avec de longs documents, des informations incomplètes et des sources contradictoires. La plateforme suit les catégories d’échecs telles que les hallucinations, les preuves manquantes, les erreurs de citation et les vulnérabilités de raisonnement afin d’aider les développeurs à diagnostiquer les problèmes. Arena prévoit de publier des indicateurs de performance comparatifs via des classements publics et de publier des rapports de test résumant les schémas de défaillance courants et les correctifs.
Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'
avertissement.
Articles similaires
Les développeurs mettent en garde contre la fourche eCash de Paul Sztorc, citant des risques pour les utilisateurs et une répartition inégale
Des acteurs de l’industrie et des développeurs ont exprimé leurs inquiétudes au sujet de la proposition eCash de Paul Sztorc, en invoquant des risques pour les utilisateurs, une distribution de jetons inégale et des tensions philosophiques au sein de l’écosystème. Ces avertissements mettent en lumière les dangers potentiels liés à la proposition envisagée
GateNewsIl y a 8m
Riot Platforms déclare 33,2 millions de dollars de revenus de centres de données au T1 2026, AMD double la capacité contractée à 50 MW
Le mineur Bitcoin Riot Platforms a déclaré 33,2 millions de dollars de revenus de centres de données au cours du T1 2026, marquant son premier trimestre générant des revenus grâce à l’hébergement d’infrastructures IA. D’après le PDG Jason Les, cette étape représente « un point d’inflexion décisif pour Riot, alors que nous avons officiellement basculé vers un a
GateNewsIl y a 38m
La Fondation Ethereum termine les objectifs clés de la mise à niveau Glamsterdam, consensus atteint sur une limite de gaz de 200 millions
D’après la Fondation Ethereum, les objectifs clés pour la mise à niveau Glamsterdam ont été substantiellement accomplis, avec un consensus obtenu sur un seuil de Gas Limit de 200 millions et un fonctionnement stable des processus externes de construction atteint. La mise à niveau vise à renforcer la sécurité tout en étendant l’écosystème d’Ethereum.
GateNewsIl y a 1h
Curve introduit un mécanisme de recouvrement des dettes douteuses permettant aux utilisateurs de quitter le protocole ou de participer à sa réparation
D’après Curve Finance, le protocole a récemment introduit un mécanisme de recouvrement des créances irrécouvrables qui permet aux utilisateurs touchés par des créances irrécouvrables dans certains marchés de prêt de choisir parmi plusieurs stratégies de recouvrement : vendre directement des positions de dette pour sortir, conserver et attendre d’éventuelles réparations, ou fournir de la liquidité t
GateNewsIl y a 3h
L’agent IA Manfred forme une société et se prépare à négocier des cryptomonnaies d’ici la fin du mois de mai
L’agent IA Manfred a déjà créé une entreprise et obtenu un portefeuille crypto ainsi que des identifiants pour recruter du personnel, effectuer des paiements et mener des activités. L’agent devrait commencer le trading de cryptomonnaies d’ici la fin de
GateNewsIl y a 3h
La proposition de prêt de secours en rsETH de Mantle entre dans un vote de gouvernance sur Aave tandis que DeFi United lève 314,57 millions de dollars
D’après l’annonce officielle de Mantle Network, la proposition de l’installation de prêt de coordination des liquidités rsETH pour Aave est entrée dans la phase de vote de gouvernance. Mantle fournira un prêt pour soutenir les efforts de Aave en matière de secours, permettant aux utilisateurs de sortir de manière ordonnée ou de régler les positions concernées. À l’heure actuelle, la DeFi
GateNewsIl y a 4h