福利加码,Gate 广场明星带单交易员二期招募开启!
入驻发帖 · 瓜分 $20,000 月度奖池 & 千万级流量扶持!
如何参与:
1️⃣ 报名成为跟单交易员:https://www.gate.com/copytrading/lead-trader-registration/futures
2️⃣ 报名活动:https://www.gate.com/questionnaire/7355
3️⃣ 入驻 Gate 广场,持续发布交易相关原创内容
丰厚奖励等你拿:
首帖福利:首发优质内容即得 $30 跟单体验金
双周内容激励:每双周瓜分 $500U 内容奖池
排行榜奖励:Top 10 交易员额外瓜分 $20,000 登榜奖池
流量扶持:精选帖推流、首页推荐、周度明星交易员曝光
活动时间:2026 年 2 月 12 日 18:00 – 2 月 24 日 24:00(UTC+8)
详情:https://www.gate.com/announcements/article/49849
OpenAI 发布了评估 AI 代理破解智能合约能力的基准测试 - ForkLog:加密货币、人工智能、奇点、未来
OpenAI 公司联合 Paradigm 推出了 EVMbench——一种用于评估人工智能代理识别、修复和利用智能合约漏洞能力的基准测试。
该工具基于从40次审计中筛选出的120个漏洞示例。大部分示例来自公开的代码分析平台。它还包括一些来自 Tempo 区块链安全检测的攻击场景——Tempo 是由 Stripe 和 Paradigm 为高性能、低成本的稳定币支付而开发的第一层专用网络。
与 Tempo 的集成使得基准测试中加入了支付智能合约——这是“稳定币”和人工智能代理预计会广泛应用的领域。
为了创建测试环境,OpenAI 对现有的利用脚本和攻击脚本进行了适配,并事先确认其实际应用的可行性。
EVMbench 评估三种能力模式:
人工智能模型的表现
OpenAI 在所有三种模式下测试了先进模型。在 Exploit 模式中,GPT-5.3-Codex 达到72.2%,GPT-5 达到31.9%。而在漏洞检测和修复方面的表现则相对较弱——许多问题仍然难以发现和修复。
在 Detect 模式中,人工智能代理有时在发现一个漏洞后就停止,而不是进行完整的审计。在 Patch 模式下,它们目前难以修复那些不明显的问题,同时保持合约的完整功能。
提醒一下,2025年11月,微软推出了人工智能代理测试环境,并揭示了现代数字助手存在的漏洞。