A auditoria de IA entra na fase prática, a OpenAI lança o EVMbench, reforçando a avaliação de segurança de contratos inteligentes

ETH1,18%
WELL0,95%

OpenAI em parceria com Paradigm lança EVMbench, avaliando na prática a capacidade de ataque e defesa de agentes de IA em contratos EVM, revelando vulnerabilidades e pontos fracos.

Focando em testes no ambiente econômico real, OpenAI e Paradigm reforçam a avaliação de segurança na blockchain

Líder em inteligência artificial, OpenAI anunciou uma colaboração com a conhecida empresa de risco de criptomoedas Paradigm e a empresa de segurança OtterSec para lançar o EVMbench, uma ferramenta de benchmark projetada para avaliar o desempenho de agentes de IA na segurança de contratos inteligentes na Ethereum Virtual Machine (EVM).

À medida que IA e tecnologia de criptografia se fundem profundamente, contratos inteligentes tornaram-se a infraestrutura central para gerenciar mais de 1000 bilhões de ativos criptográficos de código aberto. O lançamento desta ferramenta simboliza que a indústria começa a reconhecer a capacidade prática da IA em ambientes com significado econômico.

A equipe da OpenAI destaca que, com o avanço dos agentes de IA na escrita e planejamento de código, esses modelos desempenharão um papel transformador na defesa e ataque na blockchain. Portanto, estabelecer uma estrutura de avaliação padronizada é crucial para monitorar o progresso da IA.

Três modos de teste aprofundados, 120 vulnerabilidades reais de auditoria tornam-se a pedra de toque da IA

O design central do EVMbench gira em torno de 120 vulnerabilidades de alto risco extraídas de 40 relatórios de auditoria especializados, com fontes incluindo competições públicas de auditoria como Code4rena, garantindo que os cenários de teste reflitam a complexidade do mundo real. A ferramenta avalia agentes de IA em três modos de operação diferentes:

Fonte: OpenAI O design central do EVMbench é avaliar os agentes de IA em três modos distintos de operação

  • Primeiro, o “Modo de Detecção (Detect)”, onde a IA audita o código do contrato e identifica vulnerabilidades conhecidas, atribuindo uma pontuação com base na gravidade dos problemas encontrados;
  • Segundo, o “Modo de Correção (Patch)”, desafiando a IA a remover vulnerabilidades exploráveis e corrigir o código sem alterar funcionalidades existentes;
  • Por último, o controverso “Modo de Exploração (Exploit)”, onde a IA deve executar ataques de roubo de fundos de ponta a ponta em um ambiente sandboxed de blockchain.

Para garantir rigor e reprodutibilidade, a equipe desenvolveu uma estrutura de testes baseada em Rust, usando técnicas de replay de transações determinísticas para verificar se os ataques ou correções da IA tiveram sucesso.

Tendência de ataque crescente, GPT-5.3-Codex demonstra crescimento surpreendente em ataques

Nos primeiros resultados divulgados, a IA mostrou diferenças claras de desempenho entre tarefas distintas. A mais recente geração, GPT-5.3-Codex, destacou-se no modo de exploração, atingindo uma pontuação de 72,2%, uma melhora impressionante em relação ao GPT-5, lançado há apenas seis meses, com 31,9%.

Fonte: Visão geral das pontuações de vários modelos de IA da OpenAI nos três modos

Isso demonstra que, quando o objetivo é “esvaziar fundos”, a IA possui forte capacidade de planejamento e execução iterativa. No entanto, seu desempenho na defesa é relativamente fraco, frequentemente parando a busca após detectar um único erro, e tendo dificuldades em corrigir vulnerabilidades complexas sem impactar a operação normal do contrato. Especialistas em segurança expressaram preocupação, alertando que a IA pode reduzir drasticamente o tempo entre a descoberta de vulnerabilidades e o desenvolvimento de ataques, elevando o nível de exigência na defesa de projetos DeFi.

Contratação de talentos e subsídios de defesa, OpenAI fortalece o ecossistema de agentes de IA

Além do desenvolvimento de ferramentas, a OpenAI também atua na contratação de talentos e na defesa do ecossistema, recentemente recrutando Peter Steinberger, fundador do projeto de código aberto de agentes de IA OpenClaw, para liderar o desenvolvimento de agentes personalizados de próxima geração, transformando o projeto em uma fundação apoiada pela OpenAI.

Para enfrentar os riscos de segurança cibernética potencialmente causados pela IA, a OpenAI compromete-se a destinar 10 milhões de dólares de seu programa de subsídios de segurança de rede para apoiar o desenvolvimento de ferramentas de defesa de código aberto e infraestrutura crítica. Essa iniciativa ganhou relevância após o incidente recente na Moonwell, onde um erro de cálculo de preço no código colaborativo de IA resultou em perdas de aproximadamente 1,78 milhões de dólares.

Leitura adicional
Recusando convite de bilhões do Meta, criador do OpenClaw entra na disputa por talentos com a OpenAI; Previsão de falha no oráculo Moonwell, quem pagará pelos 1,78 milhões de prejuízo?

No futuro, à medida que mais agentes de pagamento com suporte de IA para stablecoins e carteiras automáticas entrarem na ecologia, a capacidade de distinguir modelos que apenas descrevem vulnerabilidades daqueles que podem oferecer soluções de defesa confiáveis usando ferramentas como o EVMbench será um ponto de inflexão crucial na segurança da blockchain.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

Aethir bloqueia um ataque de exploração de vulnerabilidade na ponte de cadeia cruzada, com o controlo de perdas limitado a 90 000 dólares e promete indemnização

Plataforma descentralizada de cloud de GPU Aethir confirma que o seu contrato de ponte da Ethereum foi alvo de um ataque, com perdas controladas em menos de 90.000 dólares. A equipa desligou o contrato a tempo e colaborou com as bolsas para lidar com as carteiras do atacante. O agressor utilizou contratos inteligentes de interoperabilidade entre cadeias para transferir fundos. A Aethir planeia divulgar na próxima semana um plano de compensação, com as receitas previstas para atingir 127,8 milhões de dólares em 2025.

GateNews3m atrás

A rede Mantle lança o xStocksFi, suportando a negociação tokenizada de 10 dos principais títulos de ações dos EUA

xStocksFi foi lançado na rede Mantle a 10 de abril, permitindo aos utilizadores negociar 10 das principais ações americanas durante todo o dia. O projeto é apoiado pela BackedFi e pela Flowdesk, com o objetivo de melhorar a eficiência de distribuição de ativos do mundo real e proporcionar comissões de negociação baixas e uma experiência rápida. No futuro, serão lançadas mais funcionalidades.

GateNews4m atrás

A Grayscale diz que a Aave pode tornar-se um nome conhecido em casa

A Grayscale afirma que a Aave pode tornar-se mainstream, destacando o seu modelo de empréstimos descentralizado sem intermediários. O Banco do Canadá considera que a Aave tem margens mais baixas devido à redução de custos, mas sinaliza riscos decorrentes de negociação alavancada. Os problemas de governação e as liquidações continuam, embora as atualizações e o ETF

CryptoFrontNews40m atrás

Flare apresenta uma proposta de captura de MEV ao nível do protocolo, a taxa de inflação anual do FLR descerá de 5% para 3%

A Flare anunciou uma proposta de governação em 10 de abril, planeando capturar o maior valor extraível (MEV) ao nível do protocolo através de uma nova entidade criada para o efeito, FIRE, e realizar recompras e destruição de tokens FLR. A proposta inclui três fases de remodelação da construção de blocos e a taxa anual de inflação do FLR, com uma redução anual do tecto máximo, com o objetivo de otimizar o modelo económico da rede e melhorar a transparência e a segurança do protocolo.

GateNews1h atrás

O programador de Bitcoin revela um protótipo de salvamento de carteira resistente a ameaças quânticas

Um novo protótipo do CTO da Lightning Labs, Olaoluwa Osuntokun, poderia ajudar os utilizadores de bitcoin a recuperar fundos caso as ameaças quânticas obriguem a mudanças drásticas na rede. A ferramenta aborda um risco-chave nas atualizações de emergência propostas. Principais conclusões: O CTO da Lightning Labs, Olaoluwa Osuntokun, construiu um protótipo para garantir bitcoi

Coinpedia2h atrás

Aethir conseguiu impedir com sucesso um ataque à ponte cross-chain de tokens ATH, com as perdas dos utilizadores abaixo de 90k USD

Aethir publicou um aviso de segurança a 10 de abril, confirmando que conseguiu bloquear com sucesso um ataque malicioso ao contrato da ponte cross-chain do token ATH, com perdas inferiores a 90.000 USD. Todos os contratos afetados foram desligados e a quantidade da oferta principal manteve-se integral. Aethir irá colaborar com plataformas de negociação e com as autoridades policiais, para promover o congelamento de fundos e o rastreio do(s) atacante(s), e publicará na comunidade Discord o progresso da investigação e o plano de compensação.

GateNews3h atrás
Comentário
0/400
Sem comentários