Gate 广場「創作者認證激勵計畫」優質創作者持續招募中!
立即加入,發布優質內容,參與活動即可瓜分月度 $10,000+ 創作獎勵!
認證申請步驟:
1️⃣ 打開 App 首頁底部【廣場】 → 點擊右上角頭像進入個人首頁
2️⃣ 點擊頭像右下角【申請認證】,提交申請等待審核
立即報名:https://www.gate.com/questionnaire/7159
豪華代幣獎池、Gate 精美周邊、流量曝光等超過 $10,000 的豐厚獎勵等你拿!
活動詳情:https://www.gate.com/announcements/article/47889
Claude Sonnet 4 在高階 AI 編程中建立新的性能標準
Anthropic 在 2025 年 5 月中旬的開發者大會上推出了其最新一代的 AI 模型,推出了 Claude Opus 4 和 Claude Sonnet 4,作為其模型陣容中的強大補充。在這些發布中,Sonnet 4 迅速因其令人印象深刻的基準測試結果和實用能力而受到關注,鞏固了 Anthropic 在競爭激烈的 AI 領域中的地位。
性能基準:Sonnet 4 取得突破性成果
新款 Sonnet 4 模型在 SWE-bench 驗證集上取得了 72.7% 的分數,這是一項顯著的成就,超越了 OpenAI 的 o3 和 Codex-1 模型。在高運算模式下,旗艦款 Opus 4 的性能更進一步達到 79.4%,確立其為全球領先的自動程式設計解決方案。這些指標展現了 Anthropic 在推進自主程式碼生成能力方面的承諾。值得注意的是,Sonnet 4 的競爭性能使其位居該類型模型的頂尖行列,成為尋求強大程式設計協助的開發者的強力選擇。
延伸運作能力與行業紀錄
Rakuten 的獨立測試顯示,Opus 4 能在持續進行程式設計任務長達 7 小時的同時保持穩定,並處理越來越複雜的挑戰。這種延長的運行時間打破了現有的行業基準,並為長時間會話的開發流程帶來新的可能性。最新的模型世代引入了平行工具使用和增強的記憶機制,使操作更加複雜且協調性更高,較之前的版本更為先進。
擴展存取與開發者整合
Anthropic 已將 Claude Code 完全開放給開發者社群,民主化了高階 AI 程式設計工具的存取權。這一擴展使開發者能在其整合開發流程中充分利用 Sonnet 4 的能力,促進自動程式設計解決方案在行業中的更廣泛採用。
Sonnet 4 及其同儕模型的發布標誌著 AI 輔助開發的關鍵時刻,Sonnet 4 在展示現代語言模型如何應對前所未有規模的複雜程式設計挑戰方面扮演著核心角色。