福利加碼,Gate 廣場明星帶單交易員二期招募開啟!
入駐發帖 · 瓜分 $20,000 月度獎池 & 千萬級流量扶持!
如何參與:
1️⃣ 報名成為跟單交易員:https://www.gate.com/copytrading/lead-trader-registration/futures
2️⃣ 報名活動:https://www.gate.com/questionnaire/7355
3️⃣ 入駐 Gate 廣場,持續發布交易相關原創內容
豐厚獎勵等你拿:
首帖福利:首發優質內容即得 $30 跟單体验金
雙周內容激勵:每雙周瓜分 $500U 內容獎池
排行榜獎勵:Top 10 交易員額外瓜分 $20,000 登榜獎池
流量扶持:精選帖推流、首頁推薦、周度明星交易員曝光
活動時間:2026 年 2 月 12 日 18:00 – 2 月 24 日 24:00(UTC+8)
詳情:https://www.gate.com/announcements/article/49849
OpenAI 發布了用於評估 AI 代理破解智能合約能力的基準測試 - ForkLog:加密貨幣、人工智能、奇點、未來
OpenAI 與 Paradigm 共同推出了 EVMbench — 一個用於評估 AI 代理識別、修復及利用智能合約漏洞能力的基準測試。
該工具基於從 40 次審計中挑選的 120 個漏洞。大多數範例來自公開的代碼分析平台。它還包括來自 Tempo 區塊鏈安全測試的多個攻擊場景 — 這是一個由 Stripe 和 Paradigm 為高效且低成本的穩定幣支付而開發的專用第一層網路。
與 Tempo 的整合使得基準測試中加入了支付智能合約 — 這是預計「穩定幣」與 AI 代理將積極應用的領域。
為了建立測試環境,OpenAI 改編了現有的漏洞利用工具和腳本,並事先確認其實用性。
EVMbench 評估三種能力模式:
AI 模型的成效
OpenAI 在所有三個模式中測試了先進模型。在 Exploit 類別中,GPT-5.3-Codex 達到 72.2%,GPT-5 達到 31.9%。而在漏洞檢測與修復方面的表現較為謙遜 — 許多問題仍然難以發現與修復。
在 Detect 模式中,AI 代理有時在找到一個漏洞後就停止,而不是進行完整的審計。在 Patch 模式下,它們目前難以修補那些不明顯的問題,同時保持合約的完整功能。
提醒一下,2025 年 11 月,微軟推出了一個用於測試 AI 代理的環境,並揭示了現代數位助手所面臨的漏洞。