- Caveman Claudeの仕組みとトークン削減の科学的根拠
- Lite / Full / Ultra / 文言文の4強度の選び方
- Claude Code・Cursor・Gemini CLIへのインストール手順
- 公式ベンチマークの実測データと再現方法
- caveman-compressによるインプットトークン削減
- cavemem・cavekit エコシステムとの連携
「なぜ多くのトークン使う?少ないトークンで十分」——このひと言がGitHubで43,556スターを集めた。
Caveman ClaudeはClaude Codeスキルとして配布されるトークン圧縮ツールだ。Claudeの返答を「原始人語(Caveman speak)」に変換することで、アウトプットトークンを平均65%削減する。削るのは冗長な前置き・礼儀表現・フィラーワードだけ。コードブロックと技術的な内容は一切変えない。
2026年4月にリリースされて以来、Claude Codeのエコシステムで最も話題を集めているスキルのひとつだ。本記事では仕組み・インストール・ベンチマーク・応用テクニックまでを日本語で網羅する。
Caveman Claudeとは——「アウトプット最小化」の設計思想
Caveman ClaudeはJuliusBrussee氏が開発したClaude Codeスキル(プラグイン)だ。ひとことで言うと「Claudeが返すテキストから余分な言葉を取り除くルールセット」だが、その効果は想像以上に大きい。
AIコーディングエージェントのコストの大部分はアウトプットトークンが占める。Claude 3.5 Sonnetの料金体系では、インプット1Kトークン$0.003に対し、アウトプットは1Kトークン$0.015——つまり5倍の単価だ。長い返答を書き続けるエージェントは、同じ情報量でも何倍もの費用を発生させる。
Caveman Claudeはこの非対称性に目をつけた。削除するのは次の要素だ:
- 「喜んでお手伝いします!」「もちろんです!」などの前置き
- just / really / basically / essentially などのフィラーワード
- 説明に不要な定冠詞・冠詞
- 誘導的な締めの言葉(「何かご不明点があれば…」)
- 繰り返しの確認・要約
一方、絶対に削らない要素がある:
- コードブロックの中身
- URL・ファイルパス・コマンド
- バージョン番号・日付
- 技術的に意味のある固有名詞
「同じ答え。言葉が少ない。脳はまだ大きい。(Same fix. 75% less word. Brain still big.)」——これがCaveman Claudeの設計哲学だ。
トークン最適化の文脈における位置づけ
AIエージェントのトークン最適化において、コスト削減の手法は大きく3層に分けられる。
- インプット削減——RAGによるコンテキスト圧縮、プロンプトキャッシング
- アウトプット削減——今回のCaveman Claude
- モデル選択——タスクに応じたモデルの使い分け
Caveman Claudeはこの中でも即効性が高い第2層のアプローチだ。RAGやキャッシングのようにインフラ整備が不要で、1コマンドのインストールだけで効果が出る。
Before / After——同じ答え、75%少ない言葉
公式READMEに掲載されているBefore/Afterを紹介しよう。
通常のClaude(69トークン)
“The reason your React component is re-rendering is likely because you’re creating a new object reference on each render cycle. When you pass an inline object as a prop, React’s shallow comparison sees it as a different object every time, which triggers a re-render. I’d recommend using useMemo to memoize the object.”
Caveman Claude(19トークン)
“New object ref each render. Inline object prop = new ref = re-render. Wrap in
useMemo.”
削減率:72%。内容に差はない。
もうひとつの例を見てみよう。
認証ミドルウェアのデバッグ(通常)
“Sure! I’d be happy to help you with that. The issue you’re experiencing is most likely caused by your authentication middleware not properly validating the token expiry. Let me take a look and suggest a fix.”
Caveman Claude
“Bug in auth middleware. Token expiry check use
<not<=. Fix:”
2番目の例では通常版が問題の本質に触れず「お手伝いします」で始まっているのに対し、Caveman版は1行で診断と修正方針を完結させている。
4つの強度レベルと使い分け
Caveman Claudeには4段階の強度がある。用途に応じて選べる。
| レベル | トリガー | 特徴 |
|---|---|---|
| Lite | /caveman lite |
フィラーを削除しつつ文法は維持。プロフェッショナルな文体 |
| Full | /caveman full |
デフォルト。冠詞を削り、体言止め多用。本来の「原始人語」 |
| Ultra | /caveman ultra |
最大圧縮。電報体。略語を積極使用 |
| 文言文(Wenyan) | /caveman wenyan |
古典中国語スタイル。トークン効率が高い |
実際の出力を比較するとこうなる(「Reactコンポーネントの再レンダリング」の例):
Lite
“Your component re-renders because you create a new object reference each render. Inline object props fail shallow comparison every time. Wrap it in
useMemo.”
Full
“New object ref each render. Inline object prop = new ref = re-render. Wrap in
useMemo.”
Ultra
“Inline obj prop → new ref → re-render.
useMemo.”
文言文
“物出新參照,致重繪。useMemo Wrap之。”
文言文モードは漢文(古典中国語)の構文を使う。技術用語はそのまま残るため、読めれば意味は完全に伝わる。英語・日本語のどちらよりも情報密度が高く、さらなるトークン削減になる。
強度レベルの切り替えはセッション内で固定
選んだレベルはセッション終了か明示的な変更(stop caveman / normal mode)まで維持される。一度設定すれば、以降の返答がすべてそのスタイルで統一される。
インストール——Claude CodeからCursorまで
Caveman Claudeは主要なAIコーディングエージェントすべてに対応している。
Claude Code(推奨)
claude plugin marketplace add JuliusBrussee/caveman
claude plugin install caveman@caveman
プラグインインストールでスキル+自動ロードフックが設定される。次のセッション開始時から自動でCavemanモードが有効になる。
スタンドアロンインストール(プラグインシステムを使わない場合):
# macOS / Linux / WSL
bash <(curl -s https://raw.githubusercontent.com/JuliusBrussee/caveman/main/hooks/install.sh)
# Windows (PowerShell)
irm https://raw.githubusercontent.com/JuliusBrussee/caveman/main/hooks/install.ps1 | iex
Cursor / Windsurf / Cline / Copilot
# Cursor
npx skills add JuliusBrussee/caveman -a cursor
# Windsurf
npx skills add JuliusBrussee/caveman -a windsurf
# Cline
npx skills add JuliusBrussee/caveman -a cline
# GitHub Copilot
npx skills add JuliusBrussee/caveman -a github-copilot
これらのエージェントはセッション開始フックがないため、自動起動はしない。常時有効にするには次のスニペットをシステムプロンプトまたはルールファイルに追加する:
Terse like caveman. Technical substance exact. Only fluff die.
Drop: articles, filler (just/really/basically), pleasantries, hedging.
Fragments OK. Short synonyms. Code unchanged.
Pattern: [thing] [action] [reason]. [next step].
ACTIVE EVERY RESPONSE. No revert after many turns. No filler drift.
Code/commits/PRs: normal. Off: "stop caveman" / "normal mode".
Gemini CLI
gemini extensions install https://github.com/JuliusBrussee/caveman
こちらもGEMINI.mdコンテキストファイルで自動起動する。
40以上のエージェントへの対応
npx skillsコマンドはAmp、Augment、Goose、Kiro、Rooなど40以上のエージェントをサポートしている。
# 自動検出(現在のエージェントを自動判別)
npx skills add JuliusBrussee/caveman
# エージェント指定
npx skills add JuliusBrussee/caveman -a amp
npx skills add JuliusBrussee/caveman -a goose
npx skills add JuliusBrussee/caveman -a roo
アンインストールは npx skills remove caveman で完了する。
エージェント別機能比較
各エージェントで使える機能に差がある。
| 機能 | Claude Code | Codex | Gemini CLI | Cursor | Windsurf | Cline | Copilot |
|---|---|---|---|---|---|---|---|
| Cavemanモード | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ |
| セッション自動起動 | ✓ | ✓ | ✓ | — | — | — | — |
/cavemanコマンド |
✓ | ✓ | ✓ | — | — | — | — |
| 強度切り替え | ✓ | ✓ | ✓ | ✓ | ✓ | — | — |
| ステータスラインバッジ | ✓ | — | — | — | — | — | — |
| caveman-commit | ✓ | — | ✓ | ✓ | ✓ | ✓ | ✓ |
| caveman-review | ✓ | — | ✓ | ✓ | ✓ | ✓ | ✓ |
| caveman-compress | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ |
Claude Codeが最も多機能だ。セッション開始時の自動ロード、ステータスバーへのバッジ表示、コミットメッセージ生成、コードレビューまで一通り揃っている。
付属スキル——Cavemanエコシステムの実用機能
caveman-commit:簡潔なコミットメッセージ
/caveman-commit コマンドで Conventional Commits 形式の簡潔なコミットメッセージを生成する。件名50文字以内、WhatではなくWhyを書く。
/caveman-commit
出力例:
feat(auth): reject expired tokens eagerly
closes #312
通常のClaudeが長々と変更を列挙するのに対し、Caveman-commitは1行の件名と1行の理由で完結させる。
caveman-review:1行コードレビュー
/caveman-review は PR コメントを1行に圧縮する。
L42: 🔴 bug: user null. Add guard.
L87: 🟡 perf: N+1 query. Use eager load.
L103: 🟢 style: rename ok.
「前置き・文脈説明・礼儀」なしで問題の場所・種類・修正方針を伝える。
caveman-compress:インプットトークンを削減する
/caveman:compress <filepath> はCLAUDE.mdなどのメモリファイルをCaveman構文に書き換える。
/caveman:compress CLAUDE.md
実行後:
CLAUDE.md— 圧縮済み(Claudeが毎回読む)CLAUDE.original.md— 人間可読のバックアップ(自分が編集する)
公式ベンチマークの実測値:
| ファイル | 圧縮前 | 圧縮後 | 削減率 |
|---|---|---|---|
| claude-md-preferences.md | 706 | 285 | 59.6% |
| project-notes.md | 1145 | 535 | 53.3% |
| claude-md-project.md | 1122 | 636 | 43.3% |
| todo-list.md | 627 | 388 | 38.1% |
| mixed-with-code.md | 888 | 560 | 36.9% |
| 平均 | 898 | 481 | 46% |
caveman = Claudeが「話す」アウトプットを圧縮(アウトプットトークン削減)
caveman-compress = Claudeが「読む」インプットを圧縮(インプットトークン削減)
両方を使うと入出力の両方でコストを削減できる。
ベンチマーク実測——APIレベルのトークン数
Caveman Claudeの最大の強みは、自己申告でなくClaude APIの実測値でパフォーマンスを証明していることだ。
benchmarks/ ディレクトリにベンチマークハーネスが含まれており、自分で再現できる。
| タスク | 通常(トークン) | Caveman(トークン) | 削減率 |
|---|---|---|---|
| Reactの再レンダリングバグを説明 | 1,180 | 159 | 87% |
| 認証ミドルウェアのトークン期限修正 | 704 | 121 | 83% |
| PostgreSQL接続プールのセットアップ | 2,347 | 380 | 84% |
| git rebase vs mergeの説明 | 702 | 292 | 58% |
| コールバックをasync/awaitにリファクタ | 387 | 301 | 22% |
| マイクロサービス vs モノリスのアーキテクチャ | 446 | 310 | 30% |
| セキュリティ観点のPRレビュー | 678 | 398 | 41% |
| Dockerマルチステージビルド | 1,042 | 290 | 72% |
| PostgreSQLレース条件のデバッグ | 1,200 | 232 | 81% |
| Reactエラーバウンダリの実装 | 3,454 | 456 | 87% |
| 平均 | 1,214 | 294 | 65% |
削減率の幅:22%〜87%
削減率が低いタスク(22%、30%)はアーキテクチャ相談や抽象的な説明だ。これらは元々情報密度が高く、削れる装飾語が少ない。逆に、長文になりがちなエラー説明・セットアップガイドでは80%超の削減が出ている。
仕組みの解説——なぜ「原始人語」でも精度が落ちないのか
(入力)"] --> B["Claudeの
推論プロセス"] B --> C{"Cavemanフィルタ"} C --> D["装飾語・前置き
礼儀表現を削除"] C --> E["コード・URL・
コマンドを保持"] D --> F["圧縮された
回答(出力)"] E --> F F --> G["ユーザーへ
(65%少ない)"]
Cavemanのアーキテクチャは単純だ。推論プロセス自体には手を加えない。変えるのは最終的な言語化の段階のみだ。
2026年3月に発表されたarXiv論文 “Brevity Constraints Reverse Performance Hierarchies in Language Models” はこの設計を科学的に裏付けている。
論文の主要な発見:
- 簡潔さを制約した場合、特定のベンチマークで精度が26ポイント向上した
- 大規模モデルは簡潔さの制約で競争優位を維持・向上させる
- 冗長性は必ずしも精度と相関しない
「冗長=正確」という思い込みへのカウンターデータとして機能している。
Claude Codeへのインストール詳細
Claude Codeの使い方を知っている前提で、プラグインシステムへの統合を詳しく説明する。
プラグインインストールの流れ
# ステップ1:マーケットプレイスからプラグイン情報を取得
claude plugin marketplace add JuliusBrussee/caveman
# ステップ2:プラグインをインストール(スキル+フックを設定)
claude plugin install caveman@caveman
プラグインインストールが行うこと:
~/.claude/skills/caveman/にSKILL.mdを配置SessionStartフックを設定(セッション開始時に自動でCaveman語を有効化)statusLineが未設定の場合、バッジ設定を提案
ステータスラインバッジ
Claude Codeのステータスバーに [CAVEMAN], [CAVEMAN:ULTRA] などのバッジが表示される。現在のモードを視覚的に確認できる。
# 既存のstatusLineがない場合、インストールスクリプトが自動設定
bash hooks/install.sh
カスタムstatusLineを既に設定している場合、インストーラーは変更しない。hooks/README.md に手動マージのスニペットが記載されている。
スタンドアロンフックの設定
プラグインシステムを使わずにフックだけ設定する場合:
# settings.jsonにフックを追加(セッション開始時にCaveman有効化)
cat ~/.claude/settings.json | python3 -c "
import json, sys
data = json.load(sys.stdin)
data.setdefault('hooks', {}).setdefault('SessionStart', []).append({
'command': 'echo \"Caveman mode active\"'
})
print(json.dumps(data, indent=2))
" > ~/.claude/settings.json.tmp && mv ~/.claude/settings.json.tmp ~/.claude/settings.json
実用的には公式のインストールスクリプトを使うほうが確実だ。
実際のワークフローでの使い方
基本的な起動と終了
# Caveman起動(デフォルトはFull)
/caveman
# 強度を指定して起動
/caveman lite # 文法を維持しつつフィラーを削除
/caveman ultra # 最大圧縮・電報体
# 終了
stop caveman
# または
normal mode
コミットメッセージ生成
git add -p # 変更をステージング
/caveman-commit # 簡潔なConventional Commitsメッセージを生成
メモリファイルの圧縮
# CLAUDE.mdを圧縮(バックアップ自動生成)
/caveman:compress CLAUDE.md
# プロジェクトメモを圧縮
/caveman:compress .claude/project-notes.md
圧縮後のファイルをClaudeが毎回読み込むことで、セッションごとのインプットトークンを削減できる。
Cavemanエコシステム——3ツールの設計哲学
Caveman Claudeは単独ツールではなく、3つのリポジトリで構成されるエコシステムの一部だ。
| リポジトリ | 役割 | コアコンセプト |
|---|---|---|
| caveman | アウトプット圧縮 | エージェントが「話す」量を減らす |
| cavemem | クロスエージェントメモリ | エージェントが「覚える」内容を圧縮SQLiteで保持 |
| cavekit | スペック駆動ビルドループ | 自然言語→仕様→並列ビルド→検証 |
3つの哲学:
- caveman:「なぜ多くのトークンで話す?少ないトークンで十分」
- cavemem:「なぜエージェントは忘れる?覚えられるのに」
- cavekit:「なぜエージェントは推測する?知ることができるのに」
それぞれ独立して使えるが、組み合わせることで相乗効果がある。cavekitがビルドを制御し、cavemanが返答を圧縮し、cavememが圧縮されたメモリを保持する。
Claude Skillsとの関係
Claude Skillsのアーキテクチャでは、スキルはオンデマンドでロードされる「コンテキストの単位」として機能する。
Caveman Claudeはこの仕組みを最大限に活用している:
- SKILL.mdの軽量化:Cavemanスキル自体も原始人語で書かれており、ロード時のトークン消費を最小化
- SessionStartフック:セッション開始時にスキルを自動ロードし、手動呼び出し不要
- スコープ管理:グローバル(
~/.claude/skills/)にインストールすることで全プロジェクトで有効
Claude Code ベストプラクティスでも推奨されているように、繰り返し使うワークフローはスキル化することでトークン効率が上がる。Cavemanはその原則を徹底した例だ。
ハーネスエンジニアリングでの活用
ハーネスエンジニアリング実装パターンでは、エージェントのコンテキスト管理が重要な課題として挙げられる。コンテキスト不安(Context Anxiety)——残りトークンが少なくなるとエージェントが早期完了を試みる現象——はCaveman Claudeで緩和できる。
Cavemanが減らしたアウトプットトークン分、コンテキストウィンドウに余裕ができるからだ。
以下のような組み合わせが効果的だ:
# .claude/settings.yaml の例(ハーネス設定)
hooks:
SessionStart:
- command: echo "caveman mode active"
PreToolUse:
- command: echo "pre-tool: caveman context preserved"
導入コスト試算——ROIの考え方
Caveman Claudeの削減効果を月間コストで試算する。
前提:
- 1日100リクエスト × 平均1,214アウトプットトークン(通常)
- Claude 3.5 Sonnetのアウトプット料金:$0.015/1Kトークン
通常の月間コスト(アウトプットのみ):
100 req/日 × 30日 × 1,214トークン × $0.015/1K
= $54.6/月
Caveman導入後(65%削減):
100 req/日 × 30日 × 425トークン × $0.015/1K
= $19.1/月
削減額:$35.5/月(65%削減)
Claude ProプランやClaude API料金の詳細と組み合わせて考えると、ヘビーユーザーほど効果が大きい。
よくある質問と注意事項
文言文モードは実用的か?
古典中国語を読める人間には有効だが、日本語話者の多くには読みにくい。セッション内メモや一時的な確認応答など、読み返す頻度が低い箇所で使うのが実用的だ。
コードレビューに使っても問題ないか?
caveman-reviewは「L42: 🔴 bug: null check missing」形式で出力する。チームで使う場合、この形式をあらかじめ共有しておく必要がある。一人開発や個人プロジェクトでは即日導入できる。
Cavemanモードが意図せず解除されることはあるか?
セッションが続く限りモードは維持される。ただし長いセッションでは、まれに通常モードに戻ることが報告されている(フィラードリフトと呼ばれる現象)。README上では「ACTIVE EVERY RESPONSE. No filler drift.」という明示的なルールで対策しているが、Ultra長時間セッションでは /caveman full などで再起動する習慣をつけるとよい。
Snykのセキュリティ警告について
caveman-compressはSnykに「High Risk」として検出される場合がある。READMEに明記されているとおり、サブプロセス実行とファイル操作パターンへの誤検知だ。ソースコードを直接確認すると、悪意のある処理は一切含まれていない。
インストール確認——セットアップ後の動作確認
# Claude Codeプラグインのインストール確認
claude plugin list | grep caveman
# スキルが認識されているか確認
claude skills list | grep caveman
# 実際にCavemanモードを起動
/caveman
# 強度確認(レスポンスが短くなれば成功)
What does useMemo do?
期待される出力(Fullモード):
Cache expensive calc. Recompute only when deps change.
Avoids re-render cost.
`const val = useMemo(() => expensive(a, b), [a, b]);`
他のトークン最適化手法との比較
Caveman Claudeのポジションを整理するために、代表的なアプローチと並べて比較する。
| 手法 | 主な効果 | 実装コスト | 副作用リスク |
|---|---|---|---|
| Caveman Claude | アウトプット65%削減 | 低(1コマンド) | なし(情報損失なし) |
| プロンプトキャッシング | インプット最大90%削減 | 中(API設定変更) | なし |
| RAGによるコンテキスト圧縮 | インプット50-80%削減 | 高(インフラ整備) | 検索精度に依存 |
| 小型モデルへの切り替え | コスト60-80%削減 | 中(品質評価が必要) | 精度低下リスク |
| コンテキスト圧縮(/compact) | コンテキスト40-60%圧縮 | 低(コマンド1つ) | 古い情報の損失 |
Caveman Claudeの特徴は副作用リスクがゼロな点だ。技術情報を削らずに装飾語だけを除去するため、情報損失が発生しない。また、他の手法と組み合わせることで相乗効果が得られる。
最大90%削減"] B --> F["RAGコンテキスト圧縮
50-80%削減"] B --> G["caveman-compress
46%削減(メモリファイル)"] C --> H["Caveman Claude
平均65%削減"] C --> I["コンテキスト圧縮(/compact)
40-60%圧縮"] D --> J["Haiku/小型モデル切替
60-80%コスト削減"] style H fill:#ff9900,stroke:#333,color:#000 style G fill:#ff9900,stroke:#333,color:#000
最も費用対効果が高い組み合わせは:
- Caveman Claude(アウトプット65%削減)+ caveman-compress(インプット46%削減)で入出力の両方を圧縮
- さらにプロンプトキャッシングを組み合わせると、同一セッション内での繰り返しリクエストを劇的に安くできる
セキュリティレビュー機能——caveman-reviewの詳細
caveman-reviewはシンプルに見えて、実際のコードレビューフローに大きな変化をもたらす。
通常のコードレビューとの比較
通常のClaudeによるPRレビュー(長文・丁寧):
L42のコードについて拝見しました。こちらのUserオブジェクトは
nullになる可能性がありますね。例えば、APIがエラーを返したり、
ユーザーが存在しない場合などです。ガード節を追加することを
お勧めします。具体的には以下のようなコードが良いかと思います。
caveman-reviewの出力:
L42: 🔴 bug: user null when API error. Add null guard.
L87: 🟡 perf: N+1 query in loop. Batch or eager load.
L103: 🟢 ok: rename improves clarity.
形式は「行番号: 重要度 種別: 問題 原因. 修正方針.」だ。
絵文字の意味:
- 🔴 = バグ・セキュリティ問題(要修正)
- 🟡 = パフォーマンス・スタイル問題(推奨修正)
- 🟢 = 良い点・マイナーな提案
PRに100件コメントがあっても、caveman-reviewなら全行を30秒でスキャンできる。
hooks.jsonとの連携——Codexでの設定
Codexユーザー向けに、.codex/hooks.json を使った自動起動の設定を解説する。
{
"hooks": {
"SessionStart": [
{
"type": "skill",
"name": "caveman",
"trigger": "auto"
}
]
}
}
.codex/config.toml でhooks機能を有効化する:
[features]
codex_hooks = true
この設定をリポジトリのルートに置くことで、そのリポジトリでCodexを起動するたびにCavemanが自動で有効になる。他のリポジトリにも同じ設定を展開したい場合は、両ファイルをコピーするだけだ。
文言文(文言文)モードの深掘り
文言文モードは、他の言語に比べてトークン当たりの情報密度が特に高い古典中国語を活用する。
現代の言語別情報密度の比較(概念):
| 言語 | 特徴 | トークン効率 |
|---|---|---|
| 英語 | 冠詞・前置詞が多い | 中 |
| 日本語 | 助詞・丁寧語が多い | 中 |
| 漢文(文言文) | 格変化なし・助詞最小 | 最高 |
| Ultra英語(電報体) | 冠詞・動詞省略 | 高 |
文言文モードの実例:
日本語で言えば:「Dockerfileのマルチステージビルドを使えば、最終イメージのサイズを大幅に削減できます。buildステージでコンパイルし、runステージにバイナリだけをコピーすることで、開発ツールを除外します。」
文言文モードの出力:「多段構建。編譯stage取binary,deploy stage僅含binary。開發工具不入最終映像。」
技術的な意味は完全に保たれる。英語・日本語どちらのエンジニアにも解読できる内容だ。
実用的な使い方:
- 長いリファクタリングセッションで、コードコメントを文言文で生成させる
- CLAUDE.mdのメモを文言文で書かせ、さらにcaveman-compressで圧縮
- セッション内の中間確認を文言文でやりとりし、最後だけ日本語で出力
よりよい使い方——プロのヒント
CLAUDE.mdへの常時起動設定
プロジェクトのCLAUDE.mdに以下を追加することで、そのプロジェクトではCavemanが常に有効になる:
## コミュニケーションスタイル
caveman mode. no filler. fragments ok. code exact.
drop: pleasantries, hedging, articles, "I'd be happy to".
pattern: [thing] [problem] [fix]. short. direct.
これはClaude Codeのインストールなしに動作する最もシンプルな方法だ。プロジェクトにコミットすることでチーム全体に展開できる。
APIコストの追跡方法
Caveman Claudeの効果を定量的に確認するには、Claude APIのUsage APIを使う:
import anthropic
client = anthropic.Anthropic()
# 通常モードでリクエスト
response_normal = client.messages.create(
model="claude-sonnet-4-6",
max_tokens=1024,
messages=[{"role": "user", "content": "Explain React re-rendering"}]
)
print("Normal tokens:", response_normal.usage.output_tokens)
# caveman プロンプトを追加
response_caveman = client.messages.create(
model="claude-sonnet-4-6",
max_tokens=1024,
system="Terse like caveman. Drop articles, filler. Fragments OK. Code exact.",
messages=[{"role": "user", "content": "Explain React re-rendering"}]
)
print("Caveman tokens:", response_caveman.usage.output_tokens)
print("Reduction:", f"{(1 - response_caveman.usage.output_tokens / response_normal.usage.output_tokens)*100:.0f}%")
長時間セッションでのモード維持
長時間セッションでCavemanモードが戻ることがある(フィラードリフト)。以下のヘルパーエイリアスをシェルに設定しておくと便利だ:
# ~/.zshrc or ~/.bashrc
alias caveman='echo "/caveman full" | claude'
alias cavemax='echo "/caveman ultra" | claude'
よくある質問(続き)
日本語での出力は劣化しないか?
Cavemanのルールは英語で書かれているが、日本語の出力にも適用される。具体的には:
- 「〜でございます」「〜させていただきます」などの過剰敬語を削除
- 「まず最初に」「ということで」などのフィラーを削除
- 「なるほど、それは良い質問ですね」などの前置きを削除
日本語特有の丁寧さを削ることになるため、ビジネス文書ではLiteモードを使うほうが自然だ。技術的な議論ではFullやUltraが効率的だ。
Anthropicの利用規約に違反しないか?
Cavemanは出力スタイルを変えるだけで、モデルの動作に手を加えない。Claude APIの利用規約の観点でも問題ない。公式プラグインマーケットプレイスに掲載されており、Anthropicの審査を通過している。
「caveman」という名前は何から?
原始人(caveman)が少ない単語で意思疎通する様子を表している。「Me hungry. Go eat. Come back.」のような直接的な表現様式がモチーフだ。プロジェクトのREADMEも意図的にCaveman語で書かれており、それ自体がデモになっている。
Claudeのモデルバージョンが変わっても動く?
Cavemanはプロンプトレベルの指示なので、モデルバージョンに依存しない。Claude Sonnet 4.6でも、将来のClaudeでも同様に動作する。
まとめ
Caveman Claudeは「削る」ことで価値を提供するツールだ。前置き・礼儀・フィラーを取り除き、技術情報だけを残す。平均65%のトークン削減は、APIコスト削減だけでなくレスポンス速度の向上と可読性の改善も意味する。
- 1コマンドインストールでClaude Code・Cursor・Gemini CLIなどに対応
- 4段階の強度(Lite/Full/Ultra/文言文)で用途に応じて選択
- caveman-compressでインプットトークンも同時に削減
- APIレベルの実測データでパフォーマンスを証明
AIエージェントのトークン最適化を本格的に進めたい場合、Caveman Claudeは最初の一手として最も費用対効果が高い選択肢のひとつだ。
Caveman Claudeが短期間でこれほどのスターを集めた理由は、ミームのような見た目とは裏腹に、実際に動いて効果が出るからだ。ベンチマークは自分で再現でき、インストールは2コマンドで完了し、元に戻すのも1コマンドだ。試すコストが限りなく低い。