Gate 广场「创作者认证激励计划」优质创作者持续招募中!
立即加入,发布优质内容,参与活动即可瓜分月度 $10,000+ 创作奖励!
认证申请步骤:
1️⃣ 打开 App 首页底部【广场】 → 点击右上角头像进入个人主页
2️⃣ 点击头像右下角【申请认证】,提交申请等待审核
立即报名:https://www.gate.com/questionnaire/7159
豪华代币奖池、Gate 精美周边、流量曝光等超 $10,000 丰厚奖励等你拿!
活动详情:https://www.gate.com/announcements/article/47889
Claude Sonnet 4 在高级AI编程中建立了新的性能标准
Anthropic 在2025年5月中旬的开发者大会上推出了其最新一代的AI模型,推出了Claude Opus 4和Claude Sonnet 4,作为其模型阵容中的强大补充。在这些发布中,Sonnet 4凭借其令人印象深刻的基准测试结果和实用能力迅速引起关注,巩固了Anthropic在竞争激烈的AI领域中的地位。
性能基准:Sonnet 4取得突破性成果
新款Sonnet 4模型在SWE-bench验证集上获得了72.7%的分数,这是一个显著的成就,超越了OpenAI的o3和Codex-1模型。在高计算模式下,旗舰Opus 4的性能更高,达到了79.4%,确立了其作为全球领先的自动编程解决方案的地位。这些指标展示了Anthropic在推进自主代码生成能力方面的承诺。值得注意的是,Sonnet 4的竞争表现使其跻身该类别的顶级模型行列,成为开发者寻求强大编程支持的有力选择。
延长的操作能力与行业纪录
来自Rakuten的独立测试显示,Opus 4可以连续进行长达7小时的编程任务,同时保持稳定并应对日益复杂的挑战。这一延长的运行时间打破了现有行业基准,为长时间会话的开发工作流程带来了新的可能性。最新一代模型引入了并行工具使用和增强的内存机制,使其比之前的版本能够进行更复杂、更协调的操作。
扩展的访问权限与开发者集成
Anthropic已向开发者社区全面开放Claude Code,民主化了对先进AI编程工具的访问。这一扩展使开发者能够在其集成开发流程中利用Sonnet 4的能力,促进自动化编程解决方案在行业中的更广泛应用。
Sonnet 4及其同类模型的发布标志着AI辅助开发的关键时刻,Sonnet 4在展示现代语言模型如何应对前所未有规模的复杂编程挑战方面发挥了核心作用。