この記事ではAIエージェントに特化して解説します。AIエージェント全般は AIエージェントフレームワーク比較2026年版 をご覧ください。

何が起きたか

AnthropicのAI駆動型コーディングアシスタント「Claude Code」で、プロンプトキャッシュ機能を破壊する2つの独立したバグが発見された。このバグによりAPI利用料が想定の10〜20倍に跳ね上がる可能性がある。

Anthropicは公式Discordで以下を認めた:

「人々が予想をはるかに上回るペースでClaude Codeの使用制限に達している。積極的に調査中で、チームの最優先事項

フォーラムには多数の苦情が報告されている。

ユーザー証言

被害は全プランに及んでいる。

プラン 月額 証言
Claude Pro $20/月 「毎週月曜にマックスアウト、土曜にリセット。数週間続いている。30日中12日しか使えない
Max 5 $100/月 1時間で月額プランを使い果たした。以前は8時間の作業が可能だった」
自動化利用者 従量課金 「レート制限エラーをキャッチしないとリトライがループし、日額予算が数分で枯渇
Opus 4.6利用者 従量課金 「APIを幻覚で呼び出してループし、30分で$12消費。思考トークンが原因」

あるMax 5ユーザーは20の同時ヘッドレスセッションで数千ファイルを分析し、50%使用後に「軽微なリファクタリングとバグ修正を2〜3時間」行っただけで使用率が50%→90%に急上昇。追加の短時間セッションで100%に到達した。

タイムライン

日時 事象
3月上旬 使用制限倍増プロモーション実施中
3月28日 プロモーション終了。通常のクォータに復帰
同週 Anthropicがピーク時間帯クォータ削減施策を実施(約7%のユーザーが影響)
3月下旬 ユーザーからの異常消費報告が急増
3月31日 Reddit/r/ClaudeCodeでキャッシュバグ2件の詳細が投稿される
同日 The Registerが問題を報道
同日 Anthropicが「チームの最優先事項」と調査開始を宣言

プロモーション終了とバグ露呈が同時期に重なったため、因果関係への疑念がコミュニティで広がっている。

Claude Codeキャッシュバグの技術的詳細——プロンプトキャッシュの仕組みと破壊

プロンプトキャッシュとは

プロンプトキャッシュはClaude APIのコスト最適化機能。同一内容のテキスト(コードベース、システムプロンプト、ドキュメント等)を繰り返し処理する際、キャッシュ済みコンテンツを再利用してトークン処理コストを削減する。

キャッシュレベル 内容 トークン価格 有効期限
キャッシュ書き込み 初回キャッシュ生成 基本入力トークン単価 5分
キャッシュ読み取り キャッシュ再利用 基本単価の0.1倍 5分
1時間キャッシュ拡張 期間延長オプション 基本入力トークン単価の2倍 1時間

5分のキャッシュ有効期限の問題

基本的なキャッシュ有効期限がわずか5分。これが最大の落とし穴。

graph TD A["開発者がClaude Codeを起動"] --> B["プロンプト送信"] B --> C["キャッシュ書き込み(基本単価)"] C --> D["5分以内に次のリクエスト"] D --> E["キャッシュ読み取り(0.1倍)"] C --> F["5分経過(休憩・会議等)"] F --> G["キャッシュ失効"] G --> H["再開時に新規書き込み(基本単価)"] H --> I["トークン消費が繰り返し増加"] style F fill:#7f1d1d,stroke:#ef4444,color:#fff style G fill:#7f1d1d,stroke:#ef4444,color:#fff style I fill:#78350f,stroke:#f59e0b,color:#fff

短い休憩やClaude Code非使用時間が生じるたびにキャッシュが失効し、再開時に新規キャッシュ書き込みが発生。通常の開発フロー(コーディング→テスト→ドキュメント確認→コーディング)でこのパターンが繰り返されると、トークン消費が加速度的に増加する。

1時間キャッシュへのアップグレードは基本トークン単価の2倍コストとなるため、「コスト削減のために追加費用が発生する」というジレンマが生じる。

発見された2つのバグ

ユーザーがClaude Codeのバイナリをリバースエンジニアリングした結果、プロンプトキャッシュを破壊する2つの独立したバグが発見された。

バグ 影響 発見方法
バグ1 キャッシュが有効な条件下でもキャッシュが利用されず、毎回新規処理が実行される バイナリ解析
バグ2 キャッシュ書き込みが意図せず破壊され、キャッシュ恩恵を受けられないまま新規トークンが計上される 使用量ログ分析

これら2つのバグが組み合わさることで、本来キャッシュ読み取り(0.1倍)で処理されるべきリクエストが毎回新規処理(1倍)となり、理論上10倍のコスト増。さらにキャッシュ再構築のオーバーヘッドを含めると最大20倍に達する。

graph LR subgraph Normal["正常時のトークンコスト"] direction LR N1["リクエスト1: 書き込み 1x"] --> N2["リクエスト2: 読み取り 0.1x"] --> N3["リクエスト3: 読み取り 0.1x"] end subgraph Bug["バグ発生時のトークンコスト"] direction LR B1["リクエスト1: 書き込み 1x"] --> B2["リクエスト2: 書き込み 1x"] --> B3["リクエスト3: 書き込み 1x"] end style Bug fill:#7f1d1d,stroke:#ef4444

ダウングレードによる改善

バグ発見後、複数のユーザーがバージョン2.1.34へのダウングレードを試行。「顕著な改善」が確認された。これはバグが特定のバージョンで導入されたことを示唆している。

Claude Code料金プランとクォータの仕組み

Claude Codeの料金体系を理解することが、今回のキャッシュバグの影響を正しく評価するために不可欠だ。Claude Codeの料金プランには、サブスクリプション型(定額制)とAPI従量課金型の2つの利用形態がある。

サブスクリプション型の料金プラン

プラン 月額 特徴 クォータ(推定)
Free $0 基本機能、使用制限あり 非公開
Pro $20 「少なくとも無料版の5倍」 非公開
Standard Team 要問合せ 「Pro比1.25倍」 非公開
Max 5 $100 Pro比5倍相当(推定) 非公開
Max 20 $200 Pro比20倍相当(推定) 非公開

API従量課金型の料金

API経由で利用する場合、トークン単価は以下の通り。

モデル 入力トークン 出力トークン キャッシュ読み取り
Claude Sonnet 4 $3/1M $15/1M $0.30/1M
Claude Opus 4 $15/1M $75/1M $1.50/1M

キャッシュ読み取りは入力トークンの10分の1のコスト。つまりキャッシュが正常に動作していれば、2回目以降のリクエストで入力コストが90%削減される。今回のバグではこの削減が効かず、毎回フルプライスが課金されていた。

料金プラン選択のポイント

flowchart TD A["Claude Codeを使いたい"] --> B{"利用頻度は?"} B -- "週数回程度" --> C["Free / Proプラン
月額$0〜$20"] B -- "毎日数時間" --> D{"予算上限を
設定したい?"} D -- "Yes" --> E["Max 5プラン
月額$100
予算上限あり"] D -- "No" --> F["API従量課金
使った分だけ"] B -- "自動化・大規模" --> G["API従量課金
+月次上限設定必須"]

影響範囲

プラン別のクォータ仕様(非公開)

Anthropicは各プランの具体的な月別トークン数を非公開としている。公開されている情報は以下のみ:

プラン 月額 公開情報
Pro $20/月 「少なくとも無料版の5倍」
Standard Team 「Pro比1.25倍」
Max 5 $100/月 具体的な数値なし
Max 20 $200/月 具体的な数値なし

ユーザーはダッシュボード内のクォータ消費状況でしか実制限を知ることができない。この不透明性が苦情の根本的な原因の一つ。

影響を受けるユースケース

ユースケース リスクレベル 理由
大規模コードベース解析 🔴 極めて高い 同じファイル群を繰り返し参照するため、キャッシュバグの影響が最大化
自動化ワークフロー 🔴 極めて高い エラーの自動リトライで予算が数分で枯渇
ドキュメント処理 🟡 高い 大量のテキストを繰り返し参照
単発の質問応答 🟢 低い キャッシュ依存度が低い

Opus 4.6の追加リスク

Opus 4.6モデルは拡張思考(Extended Thinking)機能を持ち、思考ステップでのトークン消費が大きい。あるユーザーは「Opus 4.6がAPIを幻覚で呼び出してループし、手動で停止するまで30分で$12消費した」と報告。思考トークンの冗長さがキャッシュバグと相乗効果を生んでいる可能性がある。

自動化ワークフロー——隠れた最大のリスク

Claude Codeを自動化ワークフロー内で実行する場合、隠れたリスクが存在する。

graph TD A["自動化スクリプトがClaude Codeを呼び出し"] --> B["API呼び出し"] B --> C{"レート制限?"} C -- No --> D["正常レスポンス"] C -- Yes --> E["レート制限エラー"] E --> F{"エラーハンドリング?"} F -- 明示的なキャッチ --> G["待機して再試行"] F -- 汎用エラーとして処理 --> H["即座にリトライ"] H --> I["リトライループ"] I --> J["日額予算が数分で枯渇 ️"] style J fill:#7f1d1d,stroke:#ef4444,color:#fff style H fill:#78350f,stroke:#f59e0b,color:#fff

レート制限エラーが汎用エラーに見えるため、エラーハンドリングが不十分なスクリプトでは無言のリトライが発動する。これは「あらゆるプロセスにAIを組み込め」というマーケティングメッセージと「予期せぬ予算枯渇」という現実の大きなギャップを示唆している。

Anthropicの対応状況

対応 状態
問題の認知 ✅ 「チームの最優先事項」と宣言
バグの公式確認 ❌ 未発表
修正版リリース ❌ 未発表
クォータ仕様の公開 ❌ 未対応
過剰請求の補償 ❌ 未対応
ダウングレードの推奨 ❌ 非公式(ユーザー発見)

ユーザーへの推奨対応

即座に実施すべき対応

  1. API使用量の監視 — Anthropicコンソールで日次・セッション別の消費を追跡
  2. 月次支出額の上限設定 — ダッシュボードで上限を設定し、予期しない高額請求を防止
  3. バージョン2.1.34へのダウングレード検討 — ユーザー報告で「顕著な改善」が確認済み
  4. エラーハンドリングの実装 — 自動化ワークフローでレート制限エラーを明示的にキャッチ

確認すべきチェックリスト

  • ダッシュボードでクォータ消費の異常がないか確認
  • 自動化スクリプトにレート制限エラーのハンドリングがあるか
  • 月次支出上限が設定されているか
  • Claude Codeのバージョンを確認(最新版でバグが発生しやすい)
  • キャッシュ機能の無効化で改善するかテスト

業界への影響

影響 詳細
価格透明性の危機 具体的な月別クォータ非開示により、開発者が予算計画不可能
信頼低下リスク プロモーション終了とバグ露呈が同時期に重なり因果関係への疑念
エンタープライズ障壁 費用予測ができない状況では企業導入判断が困難
競合の相対評価 OpenAI Codex、Cursor等とのコスト比較が再検討
APIキャッシング標準化 キャッシング機能の実装品質に関する業界全体の認識が変化

コミュニティの反応

Reddit/r/ClaudeCodeとHacker Newsで複数のスレッドが立ち、以下の指摘が集中:

  • 「Claude はあなたに検証不可能な作業に対して課金しているのか? 支払った以上のものを得られないのか?」
  • 「Opus 4.6は思考ステップでトークンを食い尽くす
  • 複数のサブスクリプション購入を検討するユーザーも(1アカウントの制限を回避するため)

Claude Codeキャッシュバグの回避策:実践的なコスト管理

キャッシュバグが修正されるまでの間、Claude Code料金を抑えるための実践的なコスト管理手法を整理する。

APIダッシュボードでの監視設定

# Claude Codeのバージョン確認
claude --version

# 問題が報告されているバージョンからダウングレード
# (公式推奨ではないが、ユーザー報告で改善確認済み)
npm install -g @anthropic-ai/[email protected]

# 使用量の確認(Claude Code内から)
/usage

自動化スクリプトでのレート制限対策

import time
import anthropic

client = anthropic.Anthropic()

def safe_claude_call(prompt, max_retries=3):
    """レート制限エラーを適切にハンドルする関数"""
    for attempt in range(max_retries):
        try:
            response = client.messages.create(
                model="claude-sonnet-4-20250514",
                max_tokens=1024,
                messages=[{"role": "user", "content": prompt}]
            )
            return response
        except anthropic.RateLimitError as e:
            wait_time = min(2 ** attempt * 30, 300)  # 30s, 60s, 300s
            print(f"レート制限。{wait_time}秒待機...")
            time.sleep(wait_time)
        except anthropic.APIError as e:
            # レート制限が汎用エラーに見える場合がある
            if "rate" in str(e).lower() or "quota" in str(e).lower():
                wait_time = 60
                print(f"クォータ関連エラー。{wait_time}秒待機...")
                time.sleep(wait_time)
            else:
                raise
    raise Exception("最大リトライ回数超過")

月次予算上限の設定手順

  1. Anthropicコンソールにログイン
  2. Settings > Billing > Usage Limits を開く
  3. Monthly spending limit に上限額を設定(例: $50)
  4. Notification threshold をオンにし、80%到達時にメール通知
予算上限を設定しないリスク
キャッシュバグ + 自動リトライの組み合わせで、1日で数百ドルの請求が発生した事例が報告されている。API利用者は必ず月次予算上限を設定すること。サブスクリプション型(Pro/Max)はクォータ制なので請求上限は月額固定だが、使用可能時間が激減する。
対策 効果 難易度 対象プラン
月次予算上限設定 請求額の上限保証 API従量課金
バージョンダウングレード キャッシュ効率改善 全プラン
リトライ間隔の設定 暴走防止 API自動化
セッション間隔の短縮 キャッシュ有効期限内に再利用 全プラン
不要ファイルのコンテキスト除外 トークン消費削減 全プラン

Claude Codeの詳細な機能と活用方法については別記事で解説している。

今後の展望

Anthropicに求められる対応:

  1. バグ修正 — プロンプトキャッシュ破壊の2つのバグを正式に認め、修正版を配布
  2. 透明化 — 各プラン別の月別トークンクォータを具体的に公表
  3. キャッシュ仕様改善 — 5分の有効期限を現実的な開発フローに合わせた期間へ延長
  4. 補償 — バグ期間中に過剰請求されたユーザーへの対応
  5. 監視ツール強化 — リアルタイムのトークン消費可視化とアラート機能

この問題はAI開発ツールが「開発の自動化」を謳いながら、その実運用で予算爆発を招く根本的な矛盾を露呈させている。なお同日、Claude Codeのソースコード51万行がnpmソースマップ経由で流出する事態も発生しており、Anthropicにとって厳しい1日となった。

参照ソース


この記事はAI業界の最新動向を速報でお届けする「AI Heartland ニュース」です。