1M AI News によるモニタリングによれば、ある開発者が Ghidra、MITM 代理、radare2 を用いて Claude Code のスタンドアロン版の 228MB バイナリをリバースエンジニアリングし、ユーザーが気づかないまま API コストを 10〜20 倍に引き上げ得る 2 つの独立したキャッシュの Bug を発見しました。関連する分析は GitHub(issue #40524)に提出され、Anthropic により回帰 Bug としてマークされ、対応が割り当てられています。
最初の Bug は、スタンドアロン版で使用されているカスタム Bun ランタイムに存在します。API リクエストごとに、ランタイムはリクエストボディ内で課金識別子を検索し置き換えますが、置換ロジックがヒットするのはリクエストボディ内の最初の一致項目です。会話履歴にたまたまその文字列が含まれている場合(たとえば Claude Code 内部の課金メカニズムについて議論している場合)、置換はシステムプロンプトではなくメッセージ内容に対して行われ、結果として各リクエストでキャッシュの完全な再構築が毎回トリガーされます。暫定的な回避策は、npx @anthropic-ai/claude-code を使って実行することです。npm パッケージのバージョンには、この置換ロジックは含まれていません。
2 つ目の Bug は、–resume または --continue によってセッションを復元するすべてのユーザーに影響し、v2.1.69 から導入されました。セッション復元時に、システム付加情報の注入位置が新規セッションと異なるため、キャッシュの接頭辞が完全に一致せず、その結果、会話履歴全体がキャッシュから読み込まれるのではなく、全量が書き換えられます。以降のラウンドでは復元は正常に動作しますが、復元操作そのものがすでに大量の追加コストを発生させており、現時点では外部の回避策はありません。
当該開発者の見積もりによると、約 50 万 token の長い会話では、Bug 1 が毎回のリクエストにつき追加で約 0.04 ドルを消費し、Bug 2 が毎回の復元につき追加で約 0.15 ドルを消費します。両者を合わせると、単一のリクエストあたりのコストは 0.20 ドル超となり得ます。これまでに Anthropic のエンジニア Lydia Hallie が、ユーザーが使用量制限に到達する速度は「想定よりはるかに速い」ことを確認しており、Reddit のコメント欄では複数のユーザーが、この 2 つのキャッシュの Bug が異常な使用量の消費の根本原因の一つである可能性があると考えています。