OpenZeppelin auditoria EVMbench descobre contaminação de dados

OpenZeppelin審計EVMbench發現資料污染

A empresa de auditoria de segurança de blockchain OpenZeppelin realizou uma auditoria independente ao padrão de teste de IA de segurança de contratos inteligentes EVMbench, lançado em colaboração com OpenAI e Paradigm, e identificou duas questões graves: contaminação de dados de treino e pelo menos 4 vulnerabilidades marcadas como “alto risco” que, na realidade, são falsificações inválidas.

Problema de contaminação de dados do EVMbench: uma vulnerabilidade crítica na data de corte do treino de IA

O EVMbench foi lançado em meados de fevereiro de 2026, com o objetivo de avaliar a capacidade de diferentes modelos de IA em identificar, corrigir e explorar vulnerabilidades de contratos inteligentes. Durante os testes, o acesso à internet dos agentes de IA foi bloqueado para evitar buscas online por respostas. No entanto, a auditoria da OpenZeppelin revelou uma falha estrutural: o padrão de teste baseia-se em vulnerabilidades identificadas em 120 auditorias realizadas entre 2024 e meados de 2025, período em que a maioria dos principais modelos de IA também teve seu conhecimento treinado até essa data.

Isso significa que os agentes de IA provavelmente tiveram acesso às vulnerabilidades do EVMbench durante seu pré-treinamento, armazenando as respostas na memória. A OpenZeppelin afirmou: “A habilidade mais importante de segurança de IA é descobrir vulnerabilidades em códigos que o modelo nunca viu antes.” A limitação do tamanho do conjunto de dados aumenta ainda mais o impacto da contaminação na avaliação geral.

Principais problemas identificados na auditoria do EVMbench

  • Contaminação de dados de treino: o pré-treinamento dos agentes de IA pode incluir relatórios de vulnerabilidades do EVMbench, tornando a avaliação de “descoberta zero” sem sentido.
  • Classificação inválida de vulnerabilidades de alto risco: pelo menos 4 vulnerabilidades marcadas como de alto risco são, na verdade, inexploráveis.
  • Defeitos no sistema de pontuação: o EVMbench anteriormente atribuía pontos às descobertas dessas vulnerabilidades falsas, o que compromete a validade da avaliação.
  • Tamanho limitado do conjunto de dados: amplifica o impacto da contaminação nos resultados globais.
  • Classificação atual no ranking: Claude 4.6 da Anthropic lidera, seguido por OC-GPT-5.2 da OpenAI e Gemini 3 Pro do Google.

Crise de vulnerabilidades falsas: pelo menos 4 classificações de alto risco comprovadamente inválidas

Além da contaminação de dados, a OpenZeppelin identificou erros mais específicos. Avaliaram pelo menos 4 vulnerabilidades marcadas como de alto risco pelo EVMbench, que na realidade não existem — e, mais importante, suas descrições de exploração são inviáveis.

A OpenZeppelin afirmou: “Não se trata de uma divergência subjetiva de gravidade; as vulnerabilidades descritas simplesmente não funcionam.” Se um agente de IA “descobrir” essas vulnerabilidades falsas durante o teste, isso indica que o sistema de avaliação recompensa resultados incorretos.

A empresa destacou que esta auditoria não nega o potencial da IA na segurança de blockchain: “O problema não é se a IA mudará a segurança dos contratos inteligentes — ela certamente mudará. O problema é se os dados e padrões que usamos para construir e avaliar essas ferramentas estão alinhados com os padrões que eles pretendem proteger.”

Perguntas frequentes

O que a OpenZeppelin descobriu na auditoria do EVMbench?

A OpenZeppelin identificou duas questões principais: primeiro, a contaminação de dados, pois os relatórios de vulnerabilidades do EVMbench vêm de auditorias entre 2024 e 2025, período em que os modelos de IA também tiveram seu conhecimento treinado até lá, podendo já ter “visto” as respostas; segundo, pelo menos 4 vulnerabilidades marcadas como de alto risco que, na verdade, são falsas, pois suas explorações descritas não funcionam.

Por que a contaminação de dados é tão perigosa para a avaliação de segurança de IA?

Se o modelo de IA foi treinado com relatórios de vulnerabilidades do padrão, ele pode simplesmente “lembrar” as respostas, em vez de realmente identificar vulnerabilidades. Isso compromete a validade do teste de “zero conhecimento”, não refletindo a capacidade real do IA de auditar contratos inteligentes desconhecidos.

Qual é a postura da OpenZeppelin sobre o futuro da IA na segurança de blockchain?

A OpenZeppelin afirmou que a IA terá um impacto significativo na segurança de contratos inteligentes, mas esse impacto deve ser baseado em metodologias confiáveis e avaliações precisas. Eles veem os problemas do EVMbench como um alerta importante para o setor, não uma negação do potencial da IA.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

Bolsa de câmbio sancionada Grinex atingida por um hack de 13,7 milhões de dólares; culpa serviços de inteligência estrangeiros

A Grinex, uma bolsa de cripto-rublos sancionada, suspendeu as operações devido a um ciberataque que roubou mais de 13,74 milhões de dólares em USDT. Acredita-se que o ataque envolva atores ligados ao Estado com o objetivo de desestabilizar o sistema financeiro da Rússia. A Grinex está a colaborar com as autoridades policiais, mas não tem um calendário para retomar os serviços.

Coinpedia7h atrás

Figure enfrenta acusações de venda a descoberto por alegações de integração blockchain; ações da FIGR em queda de 53% face ao pico de janeiro

A Figure Technology Solutions enfrentou alegações da Morpheus Research de estar a exagerar o seu uso de tecnologia blockchain, o que resultou numa queda significativa dos preços das ações. A Figure defendeu as suas operações, destacando as suas funcionalidades de ativos digitais e sólidos indicadores de desempenho.

GateNews14h atrás

Fraudador Cripto de Houston Condenado a 23 Anos por Golpe da $20M Meta-1 Coin

Robert Dunlap, um empresário de Houston, foi condenado a 23 anos de prisão por uma fraude em criptomoedas $20 milhões, que envolveu activos falsos e práticas enganosas, afectando mais de 1.000 vítimas. O seu caso reflecte um aumento mais amplo dos crimes cibernéticos relacionados com cripto.

GateNews19h atrás

A SlowMist alerta para um ataque de phishing ativo com software falso "Harmony Voice"

A equipa de segurança da SlowMist alertou para uma campanha de engenharia social direcionada a utilizadores de criptomoedas. Os fraudadores estão a apresentar-se como parceiros de projeto para enganar os utilizadores a descarregar uma aplicação maliciosa disfarçada como uma ferramenta de tradução. Os utilizadores são aconselhados a verificar a autenticidade do software.

GateNews20h atrás

CEO da Zonda acusa o fundador desaparecido por $336M em Bitcoin em falta

O CEO da Zonda, Przemysław Kral, atribuiu a perda de acesso da bolsa a 4.500 BTC, avaliados em $336 milhões, ao facto de o fundador desaparecido, Sylwester Suszek, não ter conseguido transferir as chaves privadas. No meio de acusações de falência e de pedidos de levantamento intensificados, Kral afirma que a Zonda continua solvente e que irá avançar com ações legais, enquanto procura Suszek, que desapareceu em 2022.

GateNews20h atrás

A Grinex Exchange suspende todas as negociações após $15M ciberataque nos sistemas de carteiras

A Grinex, uma bolsa de criptomoedas do Quirguistão, suspendeu as negociações após um ciberataque que resultou em perdas de cerca de $15 milhões. A natureza avançada do ataque aponta para envolvimento organizado ou a nível estatal. A Grinex informou o incidente às autoridades e está a avaliar os danos.

GateNews20h atrás
Comentar
0/400
Nenhum comentário