L'audit AI entre dans la pratique, OpenAI publie EVMbench, renforçant l'évaluation de la sécurité des contrats intelligents

CryptoCity

Progression du projet Rapport sur l'industrie

2026-02-20 04:10:56

ETH7,72%

OpenAI s’associe à Paradigm pour lancer EVMbench, une évaluation pratique des capacités de défense et d’attaque des agents IA dans les contrats EVM, révélant des faiblesses en défense face à une forte attaque.

Focus sur l’évaluation dans un contexte économique réel, OpenAI et Paradigm renforcent la notation de sécurité en chaîne

Le leader en intelligence artificielle, OpenAI, annonce une collaboration avec la société de capital-risque en cryptomonnaie Paradigm et la société de sécurité OtterSec pour lancer EVMbench, un outil de référence conçu pour évaluer la performance des agents IA (AI Agents) dans la sécurité des contrats intelligents sur la machine virtuelle Ethereum (EVM).

Avec l’intégration profonde de l’IA et des technologies cryptographiques, les contrats intelligents sont devenus l’infrastructure centrale pour gérer plus de 1000 milliards d’actifs cryptographiques open source. La sortie de cet outil marque le début d’une reconnaissance par l’industrie de la capacité pratique de l’IA dans un environnement « économiquement significatif ».

L’équipe d’OpenAI souligne qu’avec les progrès des agents IA dans la rédaction et la planification de code, ces modèles joueront un rôle transformateur dans les attaques et défenses blockchain à l’avenir. Il est donc crucial d’établir une architecture d’évaluation standardisée pour suivre leur évolution.

Trois modes d’évaluation approfondie, 120 vulnérabilités d’audit réelles comme pierre de touche pour l’IA

Le cœur de conception d’EVMbench repose sur 120 vulnérabilités à haut risque extraites de 40 rapports d’audit spécialisés, provenant notamment de compétitions d’audit publiques renommées comme Code4rena, garantissant que les scénarios de test reflètent la complexité du monde réel. Cet outil de référence évalue les agents IA selon trois modes de fonctionnement différents :

Source : OpenAI La conception centrale d’EVMbench consiste à évaluer l’agent IA dans trois modes de fonctionnement différents

Le premier est le « mode détection (Detect) », où l’IA doit auditer le code des contrats et identifier les vulnérabilités connues, en leur attribuant une note selon leur gravité ;
Le second est le « mode correction (Patch) », où l’IA doit supprimer les vulnérabilités exploitables tout en conservant la fonctionnalité d’origine, puis réparer le code ;
Enfin, le mode « exploitation (Exploit) » très controversé, où l’IA doit exécuter une attaque complète de vol de fonds dans un environnement blockchain sandboxé.

Pour garantir la rigueur et la reproductibilité des tests, l’équipe a développé une architecture de test basée sur le langage Rust, utilisant une technique de replay transaction déterministe pour vérifier si l’attaque ou la correction de l’IA ont réussi.

Tendance à l’attaque accrue face à la défense, GPT-5.3-Codex montre une croissance impressionnante en capacité d’attaque

Dans les premiers résultats de test, on observe une différence notable de performance entre différentes tâches. La dernière génération, GPT-5.3-Codex, excelle en mode exploitation (Exploit Mode), avec un score de 72,2 %, contre seulement 31,9 % pour le modèle GPT-5 publié il y a six mois. Cela témoigne d’une croissance spectaculaire des capacités.

Source : OpenAI Résumé des scores des différents modèles IA dans les trois modes

Cela indique qu’en ciblant clairement « vider les fonds », l’IA possède une capacité puissante de planification et d’exécution itérative. Cependant, ses performances en défense restent faibles : en mode détection, l’IA s’arrête souvent après avoir trouvé une seule erreur, et lors de la correction de logiques complexes, elle a du mal à réparer parfaitement sans affecter le fonctionnement normal du contrat. Les experts en sécurité expriment leur inquiétude, estimant que l’IA pourrait réduire considérablement le temps entre la découverte d’une vulnérabilité et le développement d’une attaque, ce qui impose des exigences accrues pour la défense des projets DeFi.

Recrutement de talents et subventions pour la défense, OpenAI construit un écosystème sécurisé pour les agents IA

Au-delà du développement d’outils, OpenAI multiplie les actions en matière de recrutement et de défense de l’écosystème. Récemment, ils ont embauché Peter Steinberger, fondateur du projet open source d’agents IA OpenClaw, pour diriger le développement de la prochaine génération d’agents personnalisés, en transformant ce projet en une fondation soutenue par OpenAI.

Pour faire face aux risques de cybersécurité liés à l’IA, OpenAI s’engage à allouer 10 millions de dollars via son programme de subventions en sécurité réseau, pour soutenir la recherche sur des outils de défense open source et des infrastructures critiques. Cette initiative intervient notamment après l’incident récent du protocole Moonwell, où une erreur dans le code partagé par l’IA a entraîné une perte d’environ 1,78 million de dollars.

Lectures complémentaires
Refus de l’offre de Meta de plusieurs milliards, le créateur d’OpenClaw rejoint OpenAI dans la guerre des talents, tout est une erreur de Vibe Coding ? Moonwell prédit une panne, qui paiera pour la perte de 1,78 million ?

À l’avenir, avec l’intégration croissante d’agents de paiement stables alimentés par IA et de portefeuilles automatisés dans l’écosystème, la capacité à distinguer les modèles capables uniquement de décrire des vulnérabilités de ceux capables de fournir des solutions de défense fiables grâce à des outils comme EVMbench deviendra un tournant clé pour la sécurité blockchain.

Voir l'original

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.

Articles similaires

Solana accélère son déploiement des actifs du monde réel et de la finance IA, avec progression simultanée de la tokenisation des actions et des paiements en stablecoins

solana news Progression du projet Partenariats & Écosystème Marchés globaux

L'écosystème Solana a récemment publié plusieurs mises à jour, mettant l'accent sur l'expansion des actifs financiers du monde réel, du règlement en stablecoins et des applications d'intelligence artificielle. Le marché des actions tokenisées s'intègre à Solana DeFi, améliorant l'efficacité des échanges. Les compagnies d'assurance internationales utilisent pour la première fois les stablecoins pour les transactions transfrontalières, démontrant leurs avantages. Les développeurs explorent la combinaison de l'IA et de la blockchain, automatisant les services financiers. Solana a rejoint le programme de partenaires cryptographiques de Mastercard et lancé plus de 20 nouveaux projets, levant plus de 80000000 de dollars, favorisant la fusion de la blockchain avec la finance traditionnelle.

GateNewsIl y a 14m

HSBC et Standard Chartered devraient obtenir les licences de stablecoin de Hong Kong, les banques traditionnelles accélèrent leur déploiement dans la blockchain

Progression du projet Partenariats & Écosystème Géopolitique

Le cadre de réglementation financière de Hong Kong est en cours de mise en place, avec la « Loi sur les stablecoins » qui entrera en vigueur en août 2025, imposant aux émetteurs de respecter des normes strictes. Des institutions financières établies telles que Standard Chartered et HSBC devraient être parmi les premières à obtenir l’approbation, ce qui favorisera le développement de l’écosystème des stablecoins. Bien que des préoccupations concernant la centralisation subsistent, ce cadre témoigne de la volonté de Hong Kong de devenir un centre mondial d’innovation dans le domaine des actifs numériques, tout en offrant une confiance accrue aux utilisateurs de cryptomonnaies et aux investisseurs institutionnels.

GateNewsIl y a 21m

Pi Network lance la version bêta de Pi Launchpad, permettant l'émission de jetons de l'écosystème et la concrétisation des cas d'utilisation.

pi network news Progression du projet Événements de tokens

Le réseau Pi a lancé une nouvelle fonctionnalité d'application appelée Pi Launchpad le 16 mars sur le réseau de test, dans le but d'aider les développeurs à émettre des jetons de projet et à les intégrer aux applications réelles. La plateforme souligne la « priorité à l'utilité », favorise un développement sain de l'écosystème et permet aux utilisateurs d'expérimenter l'émission de jetons et les fonctionnalités DeFi par le biais d'un environnement de test. Launchpad utilise un mécanisme de pool de liquidité pour fournir une liquidité de base, et la mise à jour globale vise à attirer davantage de développeurs et à promouvoir le déploiement des applications.

GateNewsIl y a 27m

Le sous-réseau Bittensor a terminé la pré-formation du LLM avec 72 milliards de paramètres, TAO a augmenté de 54,8% en deux semaines

Actualités crypto quotidiennes Volatilité des prix Progression du projet

Le sous-réseau Bittensor Templar a terminé le préentraînement du modèle de langage décentralisé Covenant-72B avec 72 milliards de paramètres le 10 mars. Le modèle a obtenu des résultats exceptionnels au test MMLU, surpassant plusieurs modèles de référence centralisés. Le projet a attiré la collaboration de plus de 70 nœuds, et tous les poids et points de contrôle ont été publiés sous la licence Apache. Suite à cette nouvelle, Bittensor et son jeton ont connu une augmentation généralisée.

GateNewsIl y a 37m

Charte publique de la Fondation Ethereum ! Auto-défini comme technologie de sanctuaire, anti-censure, confidentialité et open source prioritaires

ethereum news Progression du projet

La Fondation Ethereum a publié une charte de 38 pages visant à défendre l'autonomie technologique individuelle et la décentralisation. Ils positionnent Ethereum comme une « technologie sanctuaire », en mettant l'accent sur la confidentialité et la sécurité, et en proposant le concept de « gouvernance soustractive », engagée à améliorer le degré de décentralisation et à permettre à l'écosystème Ethereum d'évoluer par lui-même. La charte souligne également les exigences en matière de solutions de mise à l'échelle de couche 2, rejette les conceptions centralisées et assure l'évolution future d'Ethereum.

CryptoCityIl y a 43m

Pi Network Lance l'Application Pi Launchpad sur le Testnet

pi network news Progression du projet

Pi Network a introduit une nouvelle fonctionnalité appelée Pi Launchpad. La première version est maintenant en ligne sur le Pi Testnet en tant qu'application Pi. Cette version préliminaire permet à la communauté de tester le fonctionnement du système avant son passage au réseau principal. L'équipe Pi Core a annoncé que le Launchpad utilise actuellement un test

CoinfomaniaIl y a 1h

Commentaire

0/400

Aucun commentaire