🏠 ホーム ニュース 📖 解説記事 📚 トピック解説 🏷️ タグ一覧 ℹ️ About
ツール
💰 API料金計算機 NEW
🔍 記事を検索
カテゴリ
📡 RSSフィード
Follow
X (Twitter) 🧵 Threads
🔧 ツール
💰API料金計算機
トピック
🧠 Claude Code 🤖 AIエージェント 🎵 AIコーディング / Vibe Coding 🔌 MCP(Model Context Protocol) 🔍 RAG & ナレッジシステム 💬 LLM / ローカルAI 🔒 セキュリティ ⚙️ DevOps & 自動化 💰 Claude API & 料金 🎨 UI生成 & デザインシステム
ニュース一覧 🏷️タグから探す
Subscribe
📡 RSSフィード
ホーム explain 2026.04.23

Caveman Claudeで65%トークン削減|散文を「原始人語」に圧縮するClaude Codeスキル解説

JuliusBrussee/caveman
🪨
Caveman Claudeで65%トークン削減|散文を「原始人語」に圧縮するClaude Codeスキル解説 - AIツール日本語解説 | AI Heartland
// なぜ使えるか
「なぜ多くのトークン使う?少ないトークンで十分」——1行のフレーズと43,556スターが証明するCaveman Claudeの実用性。Claude CodeスキルのトークンコストをAPIレベルの実測データで検証した日本語解説がほぼ存在しないため、仕組み・インストール・ベンチマークを網羅する。
この記事でわかること
  • Caveman Claudeの仕組みとトークン削減の科学的根拠
  • Lite / Full / Ultra / 文言文の4強度の選び方
  • Claude Code・Cursor・Gemini CLIへのインストール手順
  • 公式ベンチマークの実測データと再現方法
  • caveman-compressによるインプットトークン削減
  • cavemem・cavekit エコシステムとの連携

「なぜ多くのトークン使う?少ないトークンで十分」——このひと言がGitHubで43,556スターを集めた。

Caveman ClaudeはClaude Codeスキルとして配布されるトークン圧縮ツールだ。Claudeの返答を「原始人語(Caveman speak)」に変換することで、アウトプットトークンを平均65%削減する。削るのは冗長な前置き・礼儀表現・フィラーワードだけ。コードブロックと技術的な内容は一切変えない。

2026年4月にリリースされて以来、Claude Codeのエコシステムで最も話題を集めているスキルのひとつだ。本記事では仕組み・インストール・ベンチマーク・応用テクニックまでを日本語で網羅する。


Caveman Claudeとは——「アウトプット最小化」の設計思想

Caveman ClaudeはJuliusBrussee氏が開発したClaude Codeスキル(プラグイン)だ。ひとことで言うと「Claudeが返すテキストから余分な言葉を取り除くルールセット」だが、その効果は想像以上に大きい。

AIコーディングエージェントのコストの大部分はアウトプットトークンが占める。Claude 3.5 Sonnetの料金体系では、インプット1Kトークン$0.003に対し、アウトプットは1Kトークン$0.015——つまり5倍の単価だ。長い返答を書き続けるエージェントは、同じ情報量でも何倍もの費用を発生させる。

Caveman Claudeはこの非対称性に目をつけた。削除するのは次の要素だ:

一方、絶対に削らない要素がある:

「同じ答え。言葉が少ない。脳はまだ大きい。(Same fix. 75% less word. Brain still big.)」——これがCaveman Claudeの設計哲学だ。

トークン最適化の文脈における位置づけ

AIエージェントのトークン最適化において、コスト削減の手法は大きく3層に分けられる。

  1. インプット削減——RAGによるコンテキスト圧縮、プロンプトキャッシング
  2. アウトプット削減——今回のCaveman Claude
  3. モデル選択——タスクに応じたモデルの使い分け

Caveman Claudeはこの中でも即効性が高い第2層のアプローチだ。RAGやキャッシングのようにインフラ整備が不要で、1コマンドのインストールだけで効果が出る。


Before / After——同じ答え、75%少ない言葉

公式READMEに掲載されているBefore/Afterを紹介しよう。

Reactコンポーネントの不要な再レンダリングについて質問した場合

通常のClaude(69トークン)

“The reason your React component is re-rendering is likely because you’re creating a new object reference on each render cycle. When you pass an inline object as a prop, React’s shallow comparison sees it as a different object every time, which triggers a re-render. I’d recommend using useMemo to memoize the object.”

Caveman Claude(19トークン)

“New object ref each render. Inline object prop = new ref = re-render. Wrap in useMemo.”

削減率:72%。内容に差はない。

もうひとつの例を見てみよう。

認証ミドルウェアのデバッグ(通常)

“Sure! I’d be happy to help you with that. The issue you’re experiencing is most likely caused by your authentication middleware not properly validating the token expiry. Let me take a look and suggest a fix.”

Caveman Claude

“Bug in auth middleware. Token expiry check use < not <=. Fix:”

2番目の例では通常版が問題の本質に触れず「お手伝いします」で始まっているのに対し、Caveman版は1行で診断と修正方針を完結させている。


4つの強度レベルと使い分け

Caveman Claudeには4段階の強度がある。用途に応じて選べる。

レベル トリガー 特徴
Lite /caveman lite フィラーを削除しつつ文法は維持。プロフェッショナルな文体
Full /caveman full デフォルト。冠詞を削り、体言止め多用。本来の「原始人語」
Ultra /caveman ultra 最大圧縮。電報体。略語を積極使用
文言文(Wenyan) /caveman wenyan 古典中国語スタイル。トークン効率が高い

実際の出力を比較するとこうなる(「Reactコンポーネントの再レンダリング」の例):

Lite

“Your component re-renders because you create a new object reference each render. Inline object props fail shallow comparison every time. Wrap it in useMemo.”

Full

“New object ref each render. Inline object prop = new ref = re-render. Wrap in useMemo.”

Ultra

“Inline obj prop → new ref → re-render. useMemo.”

文言文

“物出新參照,致重繪。useMemo Wrap之。”

文言文モードは漢文(古典中国語)の構文を使う。技術用語はそのまま残るため、読めれば意味は完全に伝わる。英語・日本語のどちらよりも情報密度が高く、さらなるトークン削減になる。

強度レベルの切り替えはセッション内で固定

選んだレベルはセッション終了か明示的な変更(stop caveman / normal mode)まで維持される。一度設定すれば、以降の返答がすべてそのスタイルで統一される。


インストール——Claude CodeからCursorまで

Caveman Claudeは主要なAIコーディングエージェントすべてに対応している。

Claude Code(推奨)

claude plugin marketplace add JuliusBrussee/caveman
claude plugin install caveman@caveman

プラグインインストールでスキル+自動ロードフックが設定される。次のセッション開始時から自動でCavemanモードが有効になる。

スタンドアロンインストール(プラグインシステムを使わない場合):

# macOS / Linux / WSL
bash <(curl -s https://raw.githubusercontent.com/JuliusBrussee/caveman/main/hooks/install.sh)

# Windows (PowerShell)
irm https://raw.githubusercontent.com/JuliusBrussee/caveman/main/hooks/install.ps1 | iex

Cursor / Windsurf / Cline / Copilot

# Cursor
npx skills add JuliusBrussee/caveman -a cursor

# Windsurf
npx skills add JuliusBrussee/caveman -a windsurf

# Cline
npx skills add JuliusBrussee/caveman -a cline

# GitHub Copilot
npx skills add JuliusBrussee/caveman -a github-copilot

これらのエージェントはセッション開始フックがないため、自動起動はしない。常時有効にするには次のスニペットをシステムプロンプトまたはルールファイルに追加する:

Terse like caveman. Technical substance exact. Only fluff die.
Drop: articles, filler (just/really/basically), pleasantries, hedging.
Fragments OK. Short synonyms. Code unchanged.
Pattern: [thing] [action] [reason]. [next step].
ACTIVE EVERY RESPONSE. No revert after many turns. No filler drift.
Code/commits/PRs: normal. Off: "stop caveman" / "normal mode".

Gemini CLI

gemini extensions install https://github.com/JuliusBrussee/caveman

こちらもGEMINI.mdコンテキストファイルで自動起動する。

40以上のエージェントへの対応

npx skillsコマンドはAmp、Augment、Goose、Kiro、Rooなど40以上のエージェントをサポートしている。

# 自動検出(現在のエージェントを自動判別)
npx skills add JuliusBrussee/caveman

# エージェント指定
npx skills add JuliusBrussee/caveman -a amp
npx skills add JuliusBrussee/caveman -a goose
npx skills add JuliusBrussee/caveman -a roo

アンインストールは npx skills remove caveman で完了する。


エージェント別機能比較

各エージェントで使える機能に差がある。

機能 Claude Code Codex Gemini CLI Cursor Windsurf Cline Copilot
Cavemanモード
セッション自動起動
/cavemanコマンド
強度切り替え
ステータスラインバッジ
caveman-commit
caveman-review
caveman-compress

Claude Codeが最も多機能だ。セッション開始時の自動ロード、ステータスバーへのバッジ表示、コミットメッセージ生成、コードレビューまで一通り揃っている。


付属スキル——Cavemanエコシステムの実用機能

caveman-commit:簡潔なコミットメッセージ

/caveman-commit コマンドで Conventional Commits 形式の簡潔なコミットメッセージを生成する。件名50文字以内、WhatではなくWhyを書く。

/caveman-commit

出力例:

feat(auth): reject expired tokens eagerly

closes #312

通常のClaudeが長々と変更を列挙するのに対し、Caveman-commitは1行の件名と1行の理由で完結させる。

caveman-review:1行コードレビュー

/caveman-review は PR コメントを1行に圧縮する。

L42: 🔴 bug: user null. Add guard.
L87: 🟡 perf: N+1 query. Use eager load.
L103: 🟢 style: rename ok.

「前置き・文脈説明・礼儀」なしで問題の場所・種類・修正方針を伝える。

caveman-compress:インプットトークンを削減する

/caveman:compress <filepath> はCLAUDE.mdなどのメモリファイルをCaveman構文に書き換える。

/caveman:compress CLAUDE.md

実行後:

公式ベンチマークの実測値:

ファイル 圧縮前 圧縮後 削減率
claude-md-preferences.md 706 285 59.6%
project-notes.md 1145 535 53.3%
claude-md-project.md 1122 636 43.3%
todo-list.md 627 388 38.1%
mixed-with-code.md 888 560 36.9%
平均 898 481 46%
cavemanとcaveman-compressの違い

caveman = Claudeが「話す」アウトプットを圧縮(アウトプットトークン削減)

caveman-compress = Claudeが「読む」インプットを圧縮(インプットトークン削減)

両方を使うと入出力の両方でコストを削減できる。


ベンチマーク実測——APIレベルのトークン数

Caveman Claudeの最大の強みは、自己申告でなくClaude APIの実測値でパフォーマンスを証明していることだ。

benchmarks/ ディレクトリにベンチマークハーネスが含まれており、自分で再現できる。

タスク 通常(トークン) Caveman(トークン) 削減率
Reactの再レンダリングバグを説明 1,180 159 87%
認証ミドルウェアのトークン期限修正 704 121 83%
PostgreSQL接続プールのセットアップ 2,347 380 84%
git rebase vs mergeの説明 702 292 58%
コールバックをasync/awaitにリファクタ 387 301 22%
マイクロサービス vs モノリスのアーキテクチャ 446 310 30%
セキュリティ観点のPRレビュー 678 398 41%
Dockerマルチステージビルド 1,042 290 72%
PostgreSQLレース条件のデバッグ 1,200 232 81%
Reactエラーバウンダリの実装 3,454 456 87%
平均 1,214 294 65%

削減率の幅:22%〜87%

重要な注意点:Cavemanはアウトプットトークンのみに作用する。思考・推論トークン(thinking tokens)は対象外だ。「Cavemanは口を小さくするが、脳は小さくしない(Caveman make mouth smaller. Caveman not make brain smaller.)」というREADMEの一文がこれを的確に表している。

削減率が低いタスク(22%、30%)はアーキテクチャ相談や抽象的な説明だ。これらは元々情報密度が高く、削れる装飾語が少ない。逆に、長文になりがちなエラー説明・セットアップガイドでは80%超の削減が出ている。


仕組みの解説——なぜ「原始人語」でも精度が落ちないのか

flowchart LR A["ユーザーの質問
(入力)"] --> B["Claudeの
推論プロセス"] B --> C{"Cavemanフィルタ"} C --> D["装飾語・前置き
礼儀表現を削除"] C --> E["コード・URL・
コマンドを保持"] D --> F["圧縮された
回答(出力)"] E --> F F --> G["ユーザーへ
(65%少ない)"]

Cavemanのアーキテクチャは単純だ。推論プロセス自体には手を加えない。変えるのは最終的な言語化の段階のみだ。

2026年3月に発表されたarXiv論文 “Brevity Constraints Reverse Performance Hierarchies in Language Models” はこの設計を科学的に裏付けている。

論文の主要な発見:

「冗長=正確」という思い込みへのカウンターデータとして機能している。


Claude Codeへのインストール詳細

Claude Codeの使い方を知っている前提で、プラグインシステムへの統合を詳しく説明する。

プラグインインストールの流れ

# ステップ1:マーケットプレイスからプラグイン情報を取得
claude plugin marketplace add JuliusBrussee/caveman

# ステップ2:プラグインをインストール(スキル+フックを設定)
claude plugin install caveman@caveman

プラグインインストールが行うこと:

  1. ~/.claude/skills/caveman/ にSKILL.mdを配置
  2. SessionStart フックを設定(セッション開始時に自動でCaveman語を有効化)
  3. statusLine が未設定の場合、バッジ設定を提案

ステータスラインバッジ

Claude Codeのステータスバーに [CAVEMAN], [CAVEMAN:ULTRA] などのバッジが表示される。現在のモードを視覚的に確認できる。

# 既存のstatusLineがない場合、インストールスクリプトが自動設定
bash hooks/install.sh

カスタムstatusLineを既に設定している場合、インストーラーは変更しない。hooks/README.md に手動マージのスニペットが記載されている。

スタンドアロンフックの設定

プラグインシステムを使わずにフックだけ設定する場合:

# settings.jsonにフックを追加(セッション開始時にCaveman有効化)
cat ~/.claude/settings.json | python3 -c "
import json, sys
data = json.load(sys.stdin)
data.setdefault('hooks', {}).setdefault('SessionStart', []).append({
    'command': 'echo \"Caveman mode active\"'
})
print(json.dumps(data, indent=2))
" > ~/.claude/settings.json.tmp && mv ~/.claude/settings.json.tmp ~/.claude/settings.json

実用的には公式のインストールスクリプトを使うほうが確実だ。


実際のワークフローでの使い方

基本的な起動と終了

# Caveman起動(デフォルトはFull)
/caveman

# 強度を指定して起動
/caveman lite      # 文法を維持しつつフィラーを削除
/caveman ultra     # 最大圧縮・電報体

# 終了
stop caveman
# または
normal mode

コミットメッセージ生成

git add -p  # 変更をステージング
/caveman-commit  # 簡潔なConventional Commitsメッセージを生成

メモリファイルの圧縮

# CLAUDE.mdを圧縮(バックアップ自動生成)
/caveman:compress CLAUDE.md

# プロジェクトメモを圧縮
/caveman:compress .claude/project-notes.md

圧縮後のファイルをClaudeが毎回読み込むことで、セッションごとのインプットトークンを削減できる。


Cavemanエコシステム——3ツールの設計哲学

Caveman ecosystem

Caveman Claudeは単独ツールではなく、3つのリポジトリで構成されるエコシステムの一部だ。

リポジトリ 役割 コアコンセプト
caveman アウトプット圧縮 エージェントが「話す」量を減らす
cavemem クロスエージェントメモリ エージェントが「覚える」内容を圧縮SQLiteで保持
cavekit スペック駆動ビルドループ 自然言語→仕様→並列ビルド→検証

3つの哲学:

それぞれ独立して使えるが、組み合わせることで相乗効果がある。cavekitがビルドを制御し、cavemanが返答を圧縮し、cavememが圧縮されたメモリを保持する。


Claude Skillsとの関係

Claude Skillsのアーキテクチャでは、スキルはオンデマンドでロードされる「コンテキストの単位」として機能する。

Caveman Claudeはこの仕組みを最大限に活用している:

  1. SKILL.mdの軽量化:Cavemanスキル自体も原始人語で書かれており、ロード時のトークン消費を最小化
  2. SessionStartフック:セッション開始時にスキルを自動ロードし、手動呼び出し不要
  3. スコープ管理:グローバル(~/.claude/skills/)にインストールすることで全プロジェクトで有効

Claude Code ベストプラクティスでも推奨されているように、繰り返し使うワークフローはスキル化することでトークン効率が上がる。Cavemanはその原則を徹底した例だ。


ハーネスエンジニアリングでの活用

ハーネスエンジニアリング実装パターンでは、エージェントのコンテキスト管理が重要な課題として挙げられる。コンテキスト不安(Context Anxiety)——残りトークンが少なくなるとエージェントが早期完了を試みる現象——はCaveman Claudeで緩和できる。

Cavemanが減らしたアウトプットトークン分、コンテキストウィンドウに余裕ができるからだ。

以下のような組み合わせが効果的だ:

# .claude/settings.yaml の例(ハーネス設定)
hooks:
  SessionStart:
    - command: echo "caveman mode active"
  PreToolUse:
    - command: echo "pre-tool: caveman context preserved"

導入コスト試算——ROIの考え方

Caveman Claudeの削減効果を月間コストで試算する。

前提:

通常の月間コスト(アウトプットのみ):
100 req/日 × 30日 × 1,214トークン × $0.015/1K
= $54.6/月

Caveman導入後(65%削減):
100 req/日 × 30日 × 425トークン × $0.015/1K
= $19.1/月

削減額:$35.5/月(65%削減)

Claude ProプランやClaude API料金の詳細と組み合わせて考えると、ヘビーユーザーほど効果が大きい。


よくある質問と注意事項

文言文モードは実用的か?

古典中国語を読める人間には有効だが、日本語話者の多くには読みにくい。セッション内メモや一時的な確認応答など、読み返す頻度が低い箇所で使うのが実用的だ。

コードレビューに使っても問題ないか?

caveman-reviewは「L42: 🔴 bug: null check missing」形式で出力する。チームで使う場合、この形式をあらかじめ共有しておく必要がある。一人開発や個人プロジェクトでは即日導入できる。

Cavemanモードが意図せず解除されることはあるか?

セッションが続く限りモードは維持される。ただし長いセッションでは、まれに通常モードに戻ることが報告されている(フィラードリフトと呼ばれる現象)。README上では「ACTIVE EVERY RESPONSE. No filler drift.」という明示的なルールで対策しているが、Ultra長時間セッションでは /caveman full などで再起動する習慣をつけるとよい。

Snykのセキュリティ警告について

caveman-compressはSnykに「High Risk」として検出される場合がある。READMEに明記されているとおり、サブプロセス実行とファイル操作パターンへの誤検知だ。ソースコードを直接確認すると、悪意のある処理は一切含まれていない。


インストール確認——セットアップ後の動作確認

# Claude Codeプラグインのインストール確認
claude plugin list | grep caveman

# スキルが認識されているか確認
claude skills list | grep caveman

# 実際にCavemanモードを起動
/caveman

# 強度確認(レスポンスが短くなれば成功)
What does useMemo do?

期待される出力(Fullモード):

Cache expensive calc. Recompute only when deps change. 
Avoids re-render cost. 
`const val = useMemo(() => expensive(a, b), [a, b]);`

他のトークン最適化手法との比較

Caveman Claudeのポジションを整理するために、代表的なアプローチと並べて比較する。

手法 主な効果 実装コスト 副作用リスク
Caveman Claude アウトプット65%削減 低(1コマンド) なし(情報損失なし)
プロンプトキャッシング インプット最大90%削減 中(API設定変更) なし
RAGによるコンテキスト圧縮 インプット50-80%削減 高(インフラ整備) 検索精度に依存
小型モデルへの切り替え コスト60-80%削減 中(品質評価が必要) 精度低下リスク
コンテキスト圧縮(/compact) コンテキスト40-60%圧縮 低(コマンド1つ) 古い情報の損失

Caveman Claudeの特徴は副作用リスクがゼロな点だ。技術情報を削らずに装飾語だけを除去するため、情報損失が発生しない。また、他の手法と組み合わせることで相乗効果が得られる。

graph TD A["トークンコスト削減戦略"] --> B["インプット削減"] A --> C["アウトプット削減"] A --> D["モデル最適化"] B --> E["プロンプトキャッシング
最大90%削減"] B --> F["RAGコンテキスト圧縮
50-80%削減"] B --> G["caveman-compress
46%削減(メモリファイル)"] C --> H["Caveman Claude
平均65%削減"] C --> I["コンテキスト圧縮(/compact)
40-60%圧縮"] D --> J["Haiku/小型モデル切替
60-80%コスト削減"] style H fill:#ff9900,stroke:#333,color:#000 style G fill:#ff9900,stroke:#333,color:#000

最も費用対効果が高い組み合わせは:

  1. Caveman Claude(アウトプット65%削減)+ caveman-compress(インプット46%削減)で入出力の両方を圧縮
  2. さらにプロンプトキャッシングを組み合わせると、同一セッション内での繰り返しリクエストを劇的に安くできる

セキュリティレビュー機能——caveman-reviewの詳細

caveman-reviewはシンプルに見えて、実際のコードレビューフローに大きな変化をもたらす。

通常のコードレビューとの比較

通常のClaudeによるPRレビュー(長文・丁寧)

L42のコードについて拝見しました。こちらのUserオブジェクトは
nullになる可能性がありますね。例えば、APIがエラーを返したり、
ユーザーが存在しない場合などです。ガード節を追加することを
お勧めします。具体的には以下のようなコードが良いかと思います。

caveman-reviewの出力

L42: 🔴 bug: user null when API error. Add null guard.
L87: 🟡 perf: N+1 query in loop. Batch or eager load.
L103: 🟢 ok: rename improves clarity.

形式は「行番号: 重要度 種別: 問題 原因. 修正方針.」だ。

絵文字の意味:

PRに100件コメントがあっても、caveman-reviewなら全行を30秒でスキャンできる。


hooks.jsonとの連携——Codexでの設定

Codexユーザー向けに、.codex/hooks.json を使った自動起動の設定を解説する。

{
  "hooks": {
    "SessionStart": [
      {
        "type": "skill",
        "name": "caveman",
        "trigger": "auto"
      }
    ]
  }
}

.codex/config.toml でhooks機能を有効化する:

[features]
codex_hooks = true

この設定をリポジトリのルートに置くことで、そのリポジトリでCodexを起動するたびにCavemanが自動で有効になる。他のリポジトリにも同じ設定を展開したい場合は、両ファイルをコピーするだけだ。


文言文(文言文)モードの深掘り

文言文モードは、他の言語に比べてトークン当たりの情報密度が特に高い古典中国語を活用する。

現代の言語別情報密度の比較(概念):

言語 特徴 トークン効率
英語 冠詞・前置詞が多い
日本語 助詞・丁寧語が多い
漢文(文言文) 格変化なし・助詞最小 最高
Ultra英語(電報体) 冠詞・動詞省略

文言文モードの実例:

日本語で言えば:「Dockerfileのマルチステージビルドを使えば、最終イメージのサイズを大幅に削減できます。buildステージでコンパイルし、runステージにバイナリだけをコピーすることで、開発ツールを除外します。」

文言文モードの出力:「多段構建。編譯stage取binary,deploy stage僅含binary。開發工具不入最終映像。」

技術的な意味は完全に保たれる。英語・日本語どちらのエンジニアにも解読できる内容だ。

実用的な使い方:


よりよい使い方——プロのヒント

CLAUDE.mdへの常時起動設定

プロジェクトのCLAUDE.mdに以下を追加することで、そのプロジェクトではCavemanが常に有効になる:

## コミュニケーションスタイル

caveman mode. no filler. fragments ok. code exact. 
drop: pleasantries, hedging, articles, "I'd be happy to".
pattern: [thing] [problem] [fix]. short. direct.

これはClaude Codeのインストールなしに動作する最もシンプルな方法だ。プロジェクトにコミットすることでチーム全体に展開できる。

APIコストの追跡方法

Caveman Claudeの効果を定量的に確認するには、Claude APIのUsage APIを使う:

import anthropic

client = anthropic.Anthropic()

# 通常モードでリクエスト
response_normal = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=1024,
    messages=[{"role": "user", "content": "Explain React re-rendering"}]
)
print("Normal tokens:", response_normal.usage.output_tokens)

# caveman プロンプトを追加
response_caveman = client.messages.create(
    model="claude-sonnet-4-6", 
    max_tokens=1024,
    system="Terse like caveman. Drop articles, filler. Fragments OK. Code exact.",
    messages=[{"role": "user", "content": "Explain React re-rendering"}]
)
print("Caveman tokens:", response_caveman.usage.output_tokens)
print("Reduction:", f"{(1 - response_caveman.usage.output_tokens / response_normal.usage.output_tokens)*100:.0f}%")

長時間セッションでのモード維持

長時間セッションでCavemanモードが戻ることがある(フィラードリフト)。以下のヘルパーエイリアスをシェルに設定しておくと便利だ:

# ~/.zshrc or ~/.bashrc
alias caveman='echo "/caveman full" | claude'
alias cavemax='echo "/caveman ultra" | claude'

よくある質問(続き)

日本語での出力は劣化しないか?

Cavemanのルールは英語で書かれているが、日本語の出力にも適用される。具体的には:

日本語特有の丁寧さを削ることになるため、ビジネス文書ではLiteモードを使うほうが自然だ。技術的な議論ではFullやUltraが効率的だ。

Anthropicの利用規約に違反しないか?

Cavemanは出力スタイルを変えるだけで、モデルの動作に手を加えない。Claude APIの利用規約の観点でも問題ない。公式プラグインマーケットプレイスに掲載されており、Anthropicの審査を通過している。

「caveman」という名前は何から?

原始人(caveman)が少ない単語で意思疎通する様子を表している。「Me hungry. Go eat. Come back.」のような直接的な表現様式がモチーフだ。プロジェクトのREADMEも意図的にCaveman語で書かれており、それ自体がデモになっている。

Claudeのモデルバージョンが変わっても動く?

Cavemanはプロンプトレベルの指示なので、モデルバージョンに依存しない。Claude Sonnet 4.6でも、将来のClaudeでも同様に動作する。


まとめ

Caveman Claudeは「削る」ことで価値を提供するツールだ。前置き・礼儀・フィラーを取り除き、技術情報だけを残す。平均65%のトークン削減は、APIコスト削減だけでなくレスポンス速度の向上と可読性の改善も意味する。

AIエージェントのトークン最適化を本格的に進めたい場合、Caveman Claudeは最初の一手として最も費用対効果が高い選択肢のひとつだ。

43,556スターの背景にある実用性

Caveman Claudeが短期間でこれほどのスターを集めた理由は、ミームのような見た目とは裏腹に、実際に動いて効果が出るからだ。ベンチマークは自分で再現でき、インストールは2コマンドで完了し、元に戻すのも1コマンドだ。試すコストが限りなく低い。

参照ソース

B!
B! この記事をはてブに追加
よくある質問
Caveman Claudeとは何ですか?
Claude CodeやCursor、Gemini CLIなど主要AIコーディングエージェントに対応したトークン圧縮スキルです。Claudeの返答を「原始人語(Caveman speak)」に変換することでアウトプットトークンを平均65%削減しながら、技術的な正確性を100%維持します。
どうやってインストールしますか?
Claude Codeなら `claude plugin marketplace add JuliusBrussee/caveman && claude plugin install caveman@caveman` の2コマンドで完了します。Cursor・Windsurf・Clineなどは `npx skills add JuliusBrussee/caveman -a <エージェント名>` で対応しています。
技術的な正確性は保たれますか?
はい。Caveman Claudeは冗長な装飾語・前置き・礼儀表現のみを削除し、コードブロック・URL・ファイルパス・コマンド・バージョン番号はそのまま出力します。2026年3月のarXiv論文では、簡潔な応答制約が特定ベンチマークで精度を26ポイント向上させたことも報告されています。
文言文(Wenyan)モードとは何ですか?
漢文の文体を使って技術情報を出力するモードです。人類が発明した最もトークン効率の高い書き言葉である古典中国語を用いることで、さらなる圧縮を実現します。`/caveman wenyan` で有効化できます。
caveman-compressとcavemanの違いは何ですか?
cavemanはClaudeが「話す」アウトプットを圧縮します。caveman-compressはClaudeが「読む」インプット(CLAUDE.mdなどのメモリファイル)を圧縮します。両者を組み合わせると入出力両方のトークンコストを削減できます。
🧠
Claude Code
Claude Codeの使い方・設定・内部アーキテクチャ・拡張エコシステムを網羅。Harness Engineering・AI MDファイル・Claude Designも含む →
広告
GitHub で見る
役に立ったらシェアをお願いします
🔔 AI速報、毎日Xで配信中
Claude Code・MCP・AIエージェントの最新ニュースをいち早くお届け
@peaks2314 をフォロー
記事の信頼性について
AI Heartland エディトリアルポリシーに基づき作成
複数ソース照合
公式情報・報道等を突き合わせて確認
ファクトチェック済
ソースURLの内容を検証
参照ソース明記
記事末尾に引用元を掲載
Next Read →
🕵️ BISSA Scanner解析:AI支援の大規模脆弱性スキャンと.envクレデンシャル窃取の仕組み
関連記事
💳 Claude ProでClaude Codeが使えなくなった——新プラン比較と移行の判断フロー
Claude ProからClaude Codeが除外され、Max($100〜)が必須に。Free/Pro/Max 5x/Max 20xの機能比較表、ChatGPT Plus・Gemini AI Proとの料金比較、「どのプランを選ぶか」の判断フローを公式情報のみで整理。
2026.04.22
🎨 Claude Design活用術:Figma・Canva AI・v0と徹底比較+実用プロンプト集
claude design 使い方をFigma・Canva AI・v0・Lovableとの詳細比較で解説。ユースケース別の選択ガイドとコピペ実用プロンプト20選も収録。2026年最新版。
2026.04.19
🔧 ハーネスエンジニアリング実装パターン完全解説|AIの自律ループ×安全実行の設計手法
ハーネスエンジニアリング aiの実装パターンを徹底解説。Generator-Evaluatorパターン・スプリント分解・コンテキスト管理・安全ループ・可観測性まで、Anthropic公式ブログ事例に基づいたマルチエージェント設計を具体的なコードで網羅。
2026.04.19
📋 AGENTS.md完全ガイド:OpenAI Codex・Devin・Claude Codeでの書き方と違い
agents.md とは何か、OpenAI Codex CLIが自動ロードするエージェント指示ファイルを完全解説。グローバル・プロジェクト・サービス層の3層構造、AGENTS.override.md、Devin対応、Claude CodeとCLAUDE.mdとの違いを書き方テンプレート付きで網羅。
2026.04.19
Popular
#1 POPULAR
🎨 Claude Design使い方・料金・v0/Figma比較 — テキストだけでプロトタイプを作るAnthropicのAIデザインツール
Anthropicが2026年4月に公開したClaude DesignはPro月額$20から追加費用なしで使えるAIデザインツール。テキスト指示だけでプロトタイプ・スライド・LPを生成できる。料金・Figma/v0/Lovable比較・オンボーディング手順・実践プロンプト例まで、デザイン知識ゼロから使い始める方法をまとめた。
#2 POPULAR
🎨 awesome-design-md:DESIGN.mdでAIにUI生成させる方法【58ブランド対応】
DESIGN.mdをプロジェクトに置くだけでAIエージェントが一貫したUI生成を実現。Vercel・Stripe・Claudeなど58ブランドのデザイン仕様をnpx 1コマンドで導入する方法と、実際の出力差を検証した結果を解説。
#3 POPULAR
📊 TradingView MCP:Claude CodeからTradingViewを完全操作する78ツールのMCPサーバー
TradingView MCPはClaude CodeからTradingView Desktopを直接操作できる78ツール搭載のMCPサーバー。チャート分析、Pine Script開発、マルチペイン、アラート管理、リプレイ練習まで自然言語で実行。導入手順を解説
#4 POPULAR
🔍 last30days-skill完全ガイド|Reddit・X・YouTube横断AIリサーチスキルの使い方2026年版
last30days-skillはReddit・X・YouTube・TikTokなど10+ソースを横断して最新30日のトレンドをAIで分析するClaude Codeスキル。使い方・設定・活用例を解説。
#5 POPULAR
🚨 Composer 脆弱性 CVE-2026-40261 PerforceドライバRCE、2.9.6/2.2.27で修正
PHP Composerの脆弱性CVE-2026-40261(CVSS 8.8)はPerforce未インストールでも任意コード実行が成立。composer install/requireでRCEリスク。修正版2.9.6/2.2.27へ今すぐcomposer self-updateで更新。全PHP開発者・CI環境が影響対象。
← OpenViking入門:AIエージェントのコンテキスト管理をファイルシステムで変えるByteDance発OSSの仕組み BISSA Scanner解析:AI支援の大規模脆弱性スキャンと.envクレデンシャル窃取の仕組み →