AnthropicのAI駆動型コーディングアシスタント「Claude Code」ユーザーが異常な高速でトークン使用量を消費し、クォータを枯渇させる問題が発生している。同社は公式Discord上で「人々が予想をはるかに上回るペースでClaude Codeの使用制限に達している。積極的に調査中で、チームの最優先事項」と認めており、フォーラムには多数の苦情が報告されている。Claude Pro購読者は「毎週マックスアウトし、月間の大半で使用不可になっている」と報告。月額の高いプランの利用者でも「短時間で使い切った。以前は長時間使えたのに」と証言。
この問題は複数の要因が重なった結果だと考えられる。Anthropicがピーク時間帯でのクォータ削減政策を実施し、約7%のユーザーが影響を受けた。同時期に使用制限を倍増する期間限定プロモーションが終了。さらに深刻なのは、ユーザーがClaude Codeのバイナリをリバースエンジニアリングしたところ、プロンプトキャッシュを破壊するバグが2つ発見され、トークンコスト10~20倍の隠れた上昇を引き起こしていた可能性がある。これらの要因がAI開発における「ユーザーと提供企業の価格・使用モデルに関する暗黙の交渉」を浮き彫りにしている。
Claude Codeが過剰なトークン消費を引き起こす技術的メカニズムはプロンプトキャッシュの仕様にある。
| キャッシュレベル | 内容 | トークン価格 | 有効期限 |
|---|---|---|---|
| キャッシュ書き込み | 初回キャッシュ生成 | 基本入力トークン単価 | 5分 |
| キャッシュ読み取り | キャッシュ再利用 | 基本単価の0.1倍 | 5分 |
| 1時間キャッシュ拡張 | 期間延長オプション | 基本入力トークン単価の2倍 | 1時間 |
問題の根底:基本的なキャッシュ有効期限がわずか5分。短い休憩やClaude Code非使用時間が生じるとキャッシュが失効し、再開時に新規キャッシュ書き込みが発生。これが通常の開発フローで繰り返されると、トークン消費が指数関数的に増加する。1時間キャッシュへのアップグレードは基本トークン単価の2倍コストとなるため、コスト削減効果と追加費用のジレンマを生む。
ユーザーが報告したバグの事例:
複数の購読プランが影響を受けている。Claude Pro購読者から「月間の大部分で枯渇」という報告がある一方、より高い月額料金のプランでも「短時間で消費」という報告がある。Anthropicは各プランの具体的な月別トークン数を非公開としており、ユーザーはダッシュボード内のクォータ消費状況でしか実制限を知ることができない状況が続いている。この不透明性が苦情の背景に存在する。
3月28日、使用制限倍増プロモーションが終了した。同時期にAnthropicがピーク時間帯クォータ削減施策を実施(約7%ユーザー対象)。その後、複数のバグ報告が寄せられ、ユーザーは旧バージョンへのダウングレードを試行するなど、問題解決を模索している。Anthropicは公式に「チームの最優先事項」として調査を進めていることを表明。
Claude Codeを自動化ワークフロー内で実行する場合、隠れたリスクが存在する。レート制限エラーが汎用エラーに見えて自動リトライが発生すると、予期せぬタイミングで予算枯渇に至る可能性がある。これはマーケティングメッセージ(「あらゆるプロセスにAIを組み込め」)と現実の制限(予期せぬ予算枯渇)の大きなギャップを示唆している。
Anthropicは「チームの最優先事項」と調査着手を宣言しているが、以下の対応が必要と考えられる:
この問題はAI開発ツールが「開発の自動化」を謳いながら、その実運用で予算爆発を招く根本的な矛盾を露呈させている。
この記事はAI業界の最新動向を速報でお届けする「AI Heartland ニュース」です。