Pantera et Franklin Templeton rejoignent Sentient Arena pour tester conjointement les performances des agents IA d'entreprise.

PANews a rapporté le 27 février que, selon Cointelegraph, le laboratoire d’IA open source Sentient a annoncé le lancement d’Arena, un environnement de test de qualité production pour évaluer les performances des agents IA dans les flux de travail au niveau des entreprises. Les divisions d’actifs numériques de Pantera Capital et Franklin Templeton ont rejoint la première cohorte de test d’Arena. Sentient a indiqué qu’Arena n’est pas un test statique de modèle, mais teste plutôt l’agent IA sur une tâche standardisée en simulant les conditions d’entreprise avec de longs documents, des informations incomplètes et des sources contradictoires. La plateforme suit les catégories d’échecs telles que les hallucinations, les preuves manquantes, les erreurs de citation et les vulnérabilités de raisonnement afin d’aider les développeurs à diagnostiquer les problèmes. Arena prévoit de publier des indicateurs de performance comparatifs via des classements publics et de publier des rapports de test résumant les schémas de défaillance courants et les correctifs.

Voir l'original
Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.

Articles similaires

Elon Musk : Macrohard est un projet conjoint de xAI et Tesla, capable de simuler le fonctionnement de toute l'entreprise.

Elon Musk a révélé que xAI, en collaboration avec Tesla, développe le projet Macrohard ou Digital Optimus, qui combine les technologies Grok et AI, capable de traiter en temps réel les opérations informatiques. Ce système simule le fonctionnement de toute l'entreprise et est surnommé « GigaHard ». Son objectif est de créer un système d'IA intelligent en temps réel, unique et à faible coût.

GateNewsIl y a 23m

Brera Stock chute face à un pivot croissant vers Solana alors qu'une société 'Solmate' cède des équipes de football

En bref Les actions de Brera Holdings (SLMT) ont chuté de plus de 19 % mercredi. La société a annoncé mardi soir son intention de se recentrer sur une entreprise d'infrastructure Solana basée aux Émirats arabes unis. L'un de ses plus grands actionnaires institutionnels, Ark Invest, a commencé à céder de petites parts de ses holdings.

DecryptIl y a 31m

Société Générale-FORGE Expands EURCV Stablecoin to Stellar Network Under MiCA Rules

Société Générale-FORGE has expanded its euro-backed stablecoin, EUR CoinVertible, to the Stellar blockchain, enhancing its multichain strategy and enabling broader access to compliant digital currencies. This growth aims to link traditional finance with blockchain technology and supports the EU's MiCA regulation.

CryptometerIoIl y a 1h

DoubleZero lance la plateforme de diffusion de données de marché en temps réel DoubleZero Edge

DoubleZero a lancé le 11 mars la plateforme de livraison de données de marché en temps réel DoubleZero Edge, offrant aux traders un service de transmission de données à haute vitesse. La plateforme utilise la technologie multicast pour garantir un environnement de compétition équitable. À partir de l'Epoch 939, les validateurs sont exonérés de 5 % des frais de récompense de bloc et peuvent gagner des revenus supplémentaires en publiant des shreds.

GateNewsIl y a 1h

Cardano introduit des jetons programmables avec la nouvelle norme CIP-0113

La Fondation Cardano a publié le CIP-0113, qui permet aux émetteurs de jetons d'intégrer une logique de conformité exécutable directement aux actifs natifs du réseau. L'objectif est de renforcer la tokenisation réglementée, car les institutions exigent des jetons capables d'appliquer des fonctionnalités telles que KYC et AML.

CryptoNewsFlashIl y a 1h
Commentaire
0/400
Aucun commentaire