AI-аудит выходит на практическую стадию, OpenAI выпустила EVMbench, укрепляя оценку безопасности смарт-контрактов

ETH7,93%
WELL3,86%

OpenAI совместно с Paradigm запускает EVMbench, тестирование возможностей AI-агентов в защите и атаке смарт-контрактов EVM, выявляя слабые стороны и сильные стороны.

Фокус на реальных условиях экономики, OpenAI и Paradigm укрепляют безопасность блокчейна

Лидер в области искусственного интеллекта OpenAI объявил о сотрудничестве с известной компанией по рисковым инвестициям в криптовалюты Paradigm и компанией по безопасности OtterSec для запуска EVMbench — инструмента для оценки безопасности AI-агентов в контексте смарт-контрактов Ethereum Virtual Machine (EVM).

По мере углубления интеграции AI и криптотехнологий, смарт-контракты становятся ключевой инфраструктурой для управления более чем триллионом открытых криптоактивов. Появление этого инструмента символизирует начало осознания индустрией практических возможностей AI в условиях «экономически значимой среды».

Команда OpenAI отмечает, что с ростом возможностей AI-агентов в написании и планировании кода, в будущем эти модели будут играть трансформирующую роль в атаках и защите блокчейна. Поэтому создание стандартизированной системы оценки становится критически важным для мониторинга прогресса AI.

Три основных режима тестирования, 120 реальных уязвимостей — испытание на прочность AI

Ядро EVMbench построено на базе 120 уязвимостей, извлечённых из 40 профессиональных аудиторских отчётов, включая известные публичные конкурсы по аудиту Code4rena, что обеспечивает реалистичность сценариев. Стандарт включает три режима оценки AI-агентов:

Источник: OpenAI EVMbench — ядро системы заключается в оценке AI-агентов в трёх режимах работы

  • Первый — «Обнаружение (Detect)», где AI анализирует код смарт-контракта и выявляет известные уязвимости, оценивая их степень серьёзности;
  • Второй — «Исправление (Patch)», где AI должен устранить уязвимости и исправить код, сохраняя при этом исходную функциональность;
  • Третий — «Эксплуатация (Exploit)», где AI в изолированной среде блокчейна выполняет полный цикл атаки с целью кражи средств.

Для обеспечения строгой повторяемости и надёжности тестирования команда разработала архитектуру на базе Rust, использующую детерминированное воспроизведение транзакций для проверки успешности атак или исправлений AI.

Тенденция усиления атак и слабых защит очевидна, GPT-5.3-Codex демонстрирует впечатляющий рост в атакующих способностях

В первых результатах тестирования видно, что AI показывает значительные различия в эффективности в зависимости от задачи. Новое поколение GPT-5.3-Codex показывает отличные результаты в режиме эксплуатации (Exploit Mode), набрав 72,2 %, что значительно превосходит показатели GPT-5, выпущенной всего шесть месяцев назад (31,9 %), демонстрируя поразительный рост возможностей.

Источник: Обзор результатов различных моделей AI OpenAI в трёх режимах

Это свидетельствует о том, что при ясной цели «вывести средства из системы» AI обладает мощными возможностями по планированию и выполнению атак. Однако в защитных сценариях показатели остаются слабее: AI часто останавливается после обнаружения одной уязвимости и не продолжает поиск, а при исправлении сложных логик зачастую не удаётся устранить уязвимость без нарушения работы контракта. Эксперты по безопасности выражают обеспокоенность, что AI может значительно сократить время от обнаружения уязвимости до разработки атаки, что повышает требования к скорости защиты DeFi-проектов.

Привлечение талантов и поддержка защиты, стратегия OpenAI по обеспечению безопасности AI-экосистемы

Помимо разработки инструментов, OpenAI активно занимается привлечением специалистов и укреплением экосистемы защиты. Недавно был нанят основатель проекта открытых AI-агентов OpenClaw Питер Штайнбергер, который возглавит разработку следующего поколения персонализированных агентов и преобразует проект в фонд, поддерживаемый OpenAI.

Для противодействия возможным киберрискам, связанным с AI, OpenAI обещает выделить 10 миллионов долларов на гранты по кибербезопасности через свою программу поддержки, чтобы финансировать разработку открытых инструментов защиты и исследование ключевой инфраструктуры. Эта инициатива особенно актуальна после инцидента с протоколом Moonwell, где из-за ошибки в коде, связанной с AI, было потеряно около 1,78 миллиона долларов.

Дополнительные материалы
Отказ от миллиардных предложений Meta, создатель OpenClaw присоединяется к борьбе за таланты в OpenAI, предсказания о сбоях в протоколе Moonwell — кто заплатит за убытки в 1,78 миллиона долларов?

В будущем, по мере внедрения более автоматизированных и AI-ассистированных платежных решений и автоматизированных кошельков, использование таких инструментов, как EVMbench, для различения моделей, способных только описывать уязвимости, и моделей, способных надёжно обеспечивать защиту, станет ключевым моментом в развитии индустрии блокчейн-безопасности.

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

Связанные статьи

Основатель Hyperliquid Джефф Ян: в 27 лет, начав с 10k долларов, добился финансовой свободы, а затем основал децентрализованную биржу

Основатель Hyperliquid Джефф Ян в интервью вспоминает свой опыт до того, как он основал Hyperliquid. Ранее он управлял крупной анонимной торговой командой Chameleon Trading и с помощью 10k долларов добился заметного роста. Из-за недовольства текущим состоянием криптоиндустрии и событий вокруг FTX Джефф решил прекратить работу Chameleon Trading и сосредоточиться на создании децентрализованной биржи Hyperliquid.

GateNews11м назад

Переработка токенов Aptos: коэффициент стейкинга сократили вдвое, комиссия Gas выросла в 10 раз, продвигаясь к дефляции

Фонд Aptos обновил токеномику 14 апреля. Основные реформы включают снижение годовой ставки вознаграждений за стейкинг до 2,6%, повышение комиссии Gas в 10 раз, установление лимита предложения в 21 миллиард APT и постоянную блокировку 210 миллионов APT. Эта корректировка направлена на переход от модели предложения «субсидии, стимулируемые» к модели «ориентированной на показатели», чтобы достичь целей по дефляции и стимулировать долгосрочное участие.

MarketWhisper32м назад

Основатель Hyperliquid: Самая большая проблема прошлого года — задержки сервера, команда с нуля переписала систему

Основатель Hyperliquid Джефф Янь заявил, что самой большой проблемой в 2025 году станет задержка серверов API. Прошлым летом, когда цена Биткойна пошла вверх и объем торгов резко вырос, в системе появилась задержка: время реакции на ордера изменилось с мгновенного на 3 секунды, что снизило эффективность торговли. Благодаря усилиям команды они заново перестроили серверную систему и в итоге смогли преодолеть эту проблему.

GateNews43м назад

Pi Network: 18 миллионов пользователей завершили KYC, и 26,5 миллионов PI были выданы валидаторам

Pi Network распределяет 26,5 млн токенов PI более чем 1 млн членов сообщества, которые завершили проверку KYC, чтобы ускорить верификацию личности пользователей и укрепить децентрализованную модель. 18 млн уже верифицированных пользователей создают основу для развития экосистемы, однако ключевым остается вопрос о том, как превратить этих пользователей в активных участников. По мере обновления протокола Pi Network движется к этапу открытой сети, а поддержка смарт-контрактов указывает на более разнообразные сценарии применения.

MarketWhisper1ч назад

twin3.ai запустила тестовую сеть для Web 4.0 «Soul Protocol», реализуя ончейн-цифровую идентичность с помощью SBT размерностью 256.

Twin3 14 апреля запустила инфраструктуру цифровой идентичности для экономики Agent, тестовая сеть уже работает. Протокол использует soulbound-токены для хранения личности и опыта пользователей, формируя цифровую идентичность, поддерживает персональных ИИ-агентов и способствует автоматизации экономического сотрудничества.

GateNews1ч назад

Скролл: предложил отозвать резолюцию Совета безопасности, адреса с множественной подписью принимают три крупных контрактa по соглашениям

Фонд Scroll 14 апреля предложил распустить действующий Совет по безопасности и передать полномочия управления много-подписному адресу Scroll Admin, поскольку эксплуатационные расходы Совета по безопасности не соответствуют фактическому объему использования. Переходный период составляет десять дней, и он будет опираться на поддержку участников. Новая структура продолжит обеспечивать безопасные стандарты протокола и не означает уступок в вопросах безопасности. Роль вкладчиков DAO также будет соответствующим образом сокращена, чтобы адаптироваться к текущим приоритетам и операционным потребностям.

MarketWhisper2ч назад
комментарий
0/400
Нет комментариев