未公開のAnthropic「Claude Mythos Preview」が、すべての主要なOSおよびWebブラウザにわたり、数千件の重大度の高いゼロデイ脆弱性を自律的に特定したことで、同社は、防御型サイバーセキュリティ連合「Project Glasswing」を立ち上げました。この連合は、AI利用クレジットとして最大$100 millionの支援を受けています。
要点:
Anthropicが「フロンティアAIの歴史における、最大規模の単体モデルとしての能力向上」と説明するこのモデルは、トレーニングを完了し、2026年4月7日に公に発表されました。内部の詳細が3月下旬に、誤設定されたコンテンツ管理システムによって約3,000の内部ファイルが露出したことが判明した後のことです。
Anthropicは、Claude Mythos Previewを一般公開もしないし、同社の一般APIを通じても提供しません。同社は、そのモデルが、未知のソフトウェアの欠陥を、人間の専門家や従来のAIシステムの双方を上回る速度と規模で発見し、悪用できることを実証した後、アクセスを精査されたパートナーの限定グループに制限しました。
サイバーセキュリティのベンチマークにおいて、MythosとClaude Opus 4.6のギャップは見過ごしにくいものです。MythosはCybergymで83.1%を獲得したのに対し、Opus 4.6は66.6%でした。またSWE-bench Verifiedでは93.9%対80.8%でした。SWE-bench Proでは77.8%対53.4%で、24ポイント差です。ツールなしのHumanity’s Last Examでは56.8%を達成し、前モデルは40.0%でした。
このモデルは、これらのバグを見つけるためにサイバーセキュリティ特化のトレーニングを必要としません。向上の要因は、推論におけるより広範な進歩、マルチステップの計画、そして自律的なエージェント的挙動です。隔離されたコンテナ内に対象のコードベースが与えられると、ソースコードを読み、メモリセーフティの欠陥に関する仮説を立て、ソフトウェアをコンパイルして実行し、Address Sanitizerのようなデバッガを使用し、脆弱性の可能性に基づいてファイルを順位付けし、動作するproof-of-concept(実証概念)エクスプロイトを伴う検証済みのバグ報告を作成します。
これらのエクスプロイトの中には、ほとんど人手の指示を要しないものもありました。Tomshardware.comによれば、27歳のOpenBSD TCP SACK脆弱性――攻撃者が悪意のあるパケットを細工することで、応答する任意のホストをリモートからクラッシュさせられる微妙な整数オーバーフロー――は、約1,000回の実行後に自律的に発見され、総コストは$20,000未満だったと報じられています。16歳のFFmpeg H.264のバグは、Mythosがそれを見つけるまでに500万回超の自動テストと複数の監査を生き延びました。
ブラウザの結果は特に注目を集めました。Firefox 147のJavaScriptエンジンのテストで、Mythosは181件の完全なシェルエクスプロイトと29件のレジスタ制御ケースを生成しました。Claude Opus 4.6は、同じテストセットで2件のシェルエクスプロイトしか作れませんでした。このモデルは、直近の100件のCVEを40件の悪用可能な候補に絞り込み、そのうち半数超を実際に悪用した後、Linuxカーネルの権限昇格チェーン(サーバ上でユーザーからrootへ)も実行できることを構築しました。
人間のバリデータは、モデルの脆弱性報告198件をレビューし、重大度の評価に89%の確率で同意しました。重大度レベルが1段階以内の一致では98%の同意でした。
特定されたバグのうち、これまでに完全にパッチが当たっているのは1%未満です。Anthropicは責任ある開示を調整し、未パッチの問題に対して暗号学的SHA-3のコミットメントを公開し、完全な詳細をリリースする前に90日超+45日というタイムラインに従います。FreeBSD NFSサーバのリモートコード実行バグであるCVE-2026-4747(17年前のもの)――完全な非認証のrootアクセスを許すもの――は、すでに開示の中で挙げられている事例の1つです。

モデルとともに発表されたProject Glasswingは、同様のツールが広く利用可能になる前に、これらの能力を防御へと向けることを目指すAnthropicの取り組みです。創設パートナーには、Amazon Web Services、Apple、Broadcom、Cisco、Crowdstrike、Google、JPMorganChase、Linux Foundation、Microsoft、Nvidia、Palo Alto Networksが含まれます。アクセスは、さらに40を超える追加の重要なソフトウェア組織へ拡張されています。
Anthropicはオープンソースのセキュリティ寄付として$4 millionを拠出することを約束しました。内訳は、Linux Foundation経由のOpenSSFを通じてAlpha-Omegaへ$2.5 million、Apache Software Foundationへ$1.5 millionです。
同社は、MythosのようなAIツールが、脆弱性の発見や悪用のハードルを下げることを認め、さらに、統制なしで同様の能力が広がった場合に差し迫って生じうるリスクとして、国家主体(state actors)、中国、イラン、北朝鮮、ロシア、ならびに犯罪グループを挙げました。守る側(defenders)が技術を完全に統合するまでの、移行期の混乱期間があると説明しています。
Anthropicは、今後のClaude Opusのリリースには危険なサイバーセキュリティ出力を検知してブロックするためのセーフガードが含まれると述べ、精査済みのセキュリティ専門家向けにCyber Verification Programを導入する計画です。パートナーの調査結果とパッチが当たった脆弱性に関する公開レポートは、90日以内に期待されています。