2026年4月、JuliusBrussee/caveman が拍子抜けするほどシンプルな発想を世に出した:Claude(と30+のAIエージェント)にカベマン風の話し方をさせると、出力トークンが65%減る。タグライン:「why use many token when few do trick」。
数週間で AGENTS.md ルールセット、Claude Code プラグインマーケットプレイス、Codex CLI 拡張、Gemini CLI 設定 と AI コーディングコミュニティ各所に広がった。「caveman.md ってなんだ?」「CLAUDE.md / AGENTS.md / .cursorrules とどう違う?」と疑問に思った人へ — これが完全リファレンス。
本記事は Caveman とは何か、4つの圧縮レベル、ベンチマークデータ、対応エージェント全数のインストール方法、そして AGENTS.md vs CLAUDE.md vs .cursor/rules 3方比較 で整理したルールファイル・エコシステムにおける Caveman の位置づけを網羅する。
Caveman の正体
Caveman は 新しいルールファイル形式ではない。既存の AGENTS.md(または CLAUDE.md、または .cursorrules)に放り込む 指示セット だ。配信方式は他の AGENTS.md コンテンツと同じ、ただし 中身 が「冗長さを削れ」に特化している。
公式 README 原文:「Caveman only affects output tokens — thinking/reasoning tokens untouched. Caveman no make brain smaller. Caveman make mouth smaller.」(Caveman は出力トークンのみに作用 — 思考/推論トークンには手を出さない。Cavemanは脳を小さくしない、口を小さくする。)
10の代表的タスクで測定された結果、出力トークンの平均65%削減(22-87%の幅)。コード、URL、ファイルパス、技術的な内容はバイト単位で保持される — 圧縮されるのは技術内容を取り巻く自然言語のプロースだけ。
なぜ「Caveman」?
スタイルがネーミングを物語っている。普通のClaudeなら:
「ファイルを確認して、構造を分析して、何を扱っているか理解しますね。」
Caveman モード:
Read file. Structure clear.(ファイル読んだ。構造分かった。)
これは芸でなく合理的設計。Caveman docs が引用する 2026年3月の論文によれば 「大規模モデルを短い回答に制約すると、特定のベンチマークで精度が26ポイント改善した」。冗長な出力は推論を悪化させる相関があり、お詫び口調の前置きやメタコメントを除くことで、モデルは直接的・正確な回答に向かう。
4段階の圧縮レベル
Caveman は4つの明確な圧縮モードを同梱:
| レベル | 挙動 | 用途 |
|---|---|---|
lite | 冗長語を取るだけ | 保守的 — 自然なプロースは残る、余分なパディングだけトリム |
full | デフォルトの caveman モード | 電報調だが読める。日常推奨。 |
ultra | 最大電報体 | 絶対的な簡潔さが欲しい時。多少読みづらい。 |
wenyan | 漢文調変種 | 最短。お遊び or 純粋ログスタイル用途。 |
/caveman <level> をセッションごとに設定するか、AGENTS.md でデフォルトを指定する。モデルの思考は満載のまま — 表面のテキストだけが変化する。
10ルール(要約)
Caveman ルールセットは圧縮哲学を10の指針に蒸留している:
- 冗長語禁止 — 「ご了承ください…」「念のため…」「お時間いただきます…」 削除
- 説明より先に実行 — コード・結果を先に、プロースは後で
- メタコメント禁止 — これから何をするか実況しない
- 前置き禁止 — ウォームアップ不要
- 後置き禁止 — 「他に何かあれば…」のサインオフ不要
- ツール宣言禁止 — ツール使用は silent、結果だけが重要
- 必要時のみ説明 — 非自明な決定にコメント、自明には不要
- コードに語らせる — コードブロック周辺のナレーションを最小化
- エラーは修正対象、ナレーション対象ではない — silently デバッグ、修正報告
- プロース圧縮、技術成果物保持 — コード/URL/パスはバイト単位で保持
このルールが移植性の源。同じルールセットを AGENTS.md、CLAUDE.md、.cursorrules のどこに入れても、主要 AI コーディングエージェント全部で圧縮出力が得られる。
ベンチマーク(実数値)
Caveman リポには tiktoken で検証された 10タスクのベンチマークが同梱されている:
| タスクカテゴリ | ベースライントークン | Caveman トークン | 削減率 |
|---|---|---|---|
| React 再レンダーバグ解説 | 1,180 | 159 | 87% |
| PostgreSQL 競合状態デバッグ | 1,200 | 232 | 81% |
| アーキテクチャ議論 | — | — | 平均30% |
| Web 検索要約 | — | — | 68% |
| コード編集 | — | — | 50% |
| Q&A | — | — | 72% |
10タスク平均:65% 出力削減。
メモリファイル圧縮(既存 CLAUDE.md / プロジェクトノートを Caveman 化)では 入力トークンを ~46% 削減、入力トークンは毎セッションロードされるため複利的に効く。
Claude Code ユーザーが出力トークンに月$50払っているなら、65%削減で月$17、つまり $33 セーブ。AGENTS.md に10行追加するだけで月数千円浮く。
インストール方法
Caveman は30+のエージェントを別々の delivery 機構で対応。
ユニバーサル ワンライナー(Unix系)
curl -fsSL https://raw.githubusercontent.com/JuliusBrussee/caveman/main/install.sh | bash
ユニバーサル ワンライナー(Windows PowerShell 5.1+)
irm https://raw.githubusercontent.com/JuliusBrussee/caveman/main/install.ps1 | iex
インストーラはどのエージェントが存在するか(Claude Code、Codex CLI、Gemini CLI、Cursor、Windsurf、Cline、Copilot 等)を検出して、それぞれ適切に設定する。Node ≥18 必要。再実行は安全。
エージェント別の delivery
| エージェント | Caveman が delivery される場所 | 自動起動? |
|---|---|---|
| Claude Code | プラグイン ~/.claude/plugins/caveman/ + CLAUDE.md import | はい |
| Codex CLI | プラグイン ~/.codex/plugins/caveman/ | はい |
| Gemini CLI | Gemini CLI プラグインシステム経由の Extension | はい |
| Cursor | .cursor/rules/caveman.mdc の alwaysApply: true | ルールロード時 |
| Windsurf | .windsurf/rules/caveman.md の trigger: always_on | ルールロード時 |
| Cline | .clinerules/caveman.md | はい |
| Copilot | AGENTS.md import 経由のカスタム指示 | はい |
| Aider | .aider.conf.yml の指示参照 | はい |
自動起動しないエージェントでは、ユーザーがセッションごとに /caveman を呼んで opt-in する。
ツール一式
コアルールセット以外に、Caveman は複数のユーティリティコマンドを同梱:
| コマンド | 用途 |
|---|---|
/caveman <level> | このセッションの圧縮レベルを設定 |
/caveman-commit | Conventional commit メッセージを生成(≤50文字) |
/caveman-review | 1行 PR フィードバック |
/caveman-stats | セッションのトークン消費量を表示 |
/caveman-compress <file> | 既存の CLAUDE.md / メモリファイルを caveman 化リライト |
caveman-shrink MCP middleware | MCP サーバのツール記述を圧縮(コンテキストオーバーヘッド削減) |
caveman-shrink middleware は特に有用 — MCP サーバはしばしば冗長なツール記述で毎セッションのコンテキストウィンドウを肥大化させる。caveman-shrink を通すと、ツール機能を変えずにトークンを回収できる。
AGENTS.md エコシステムにおける位置づけ
Caveman は 既存ルールファイル用のコンテンツ であって、新しいルールファイル形式ではない。配置マッピング:
| あなたが使うもの | Caveman の入れ場所 |
|---|---|
| AGENTS.md | AGENTS.md の1セクション(または @caveman.md で import) |
| CLAUDE.md | CLAUDE.md の1セクション(または @AGENTS.md 経由で caveman コンテンツ) |
| .cursor/rules/ | alwaysApply: true の .mdc ファイル |
| .windsurf/rules/ | trigger: always_on の .md ファイル |
| プラグインマーケットプレイス | どのエージェントにもルールを delivery するスタンドアロンプラグイン |
ルール内容がプレーン Markdown プロースなので、どの形式でも同等に動く。インストーラの仕事はファイルを置く場所と適切なエージェントへの紐付けを判断するだけ。
ルールファイル全般のカバレッジは AGENTS.md vs CLAUDE.md vs .cursor/rules を参照。
Caveman エコシステム
Caveman は周辺プロジェクト群を生んでいる:
cavemem— 横断エージェントメモリ圧縮。CLAUDE.md / プロジェクトノートを定期的に圧縮形式でリライト、自動で。cavekit— caveman 圧縮込みの spec-driven build loop。再現性のあるスキャフォルディングタスクに有用。cavegemma— Gemma 4 31B モデルに圧縮を重み内に焼き付けた fine-tune モデル。ローカル動作、ルールファイル不要。
ほとんどのユーザーには core caveman インストールで十分。エコシステムは圧縮を Claude/Codex/Cursor の外(セルフホストモデルや特殊ワークフロー)まで広げたいユーザー向け。
Caveman が効くケースと逆効果なケース
Caveman が優秀なケース:
- 長セッション で出力トークンが積み上がる場合(リファクタリング、複数ファイル編集)
- コスト感度の高いチーム で Claude API を at scale で使う場合
- すでに短く話すエンジニア — caveman が好みのスタイルとマッチ
- CI 環境 で冗長な出力でログが読めない場合
Caveman が逆効果なケース:
- 「考えながら話して」が欲しいペアプロ — caveman は考えながら話す部分を圧縮する
- 新人エンジニアのオンボーディング — caveman 出力はエージェントが何をしているか学習中の人には追いにくい
- コンプライアンス重視ワークフロー で明示的なモデル推論監査ログが必要
- 顧客向けチャットインターフェース — caveman スタイルはエンジニア以外には素っ気なく聞こえる
正しい答えは タスクごとにトグル:リファクタ系作業には /caveman full、探索的セッションには /caveman lite or オフ。
プロジェクトの AGENTS.md に Caveman を追加すべき?
実用テスト:直近1週間で「コードだけくれ」と思いつつ Claude の応答をざっと読み飛ばした回数を数える。1日1回以上なら入れる。プロースの応答を最後まで読んで有用と感じるなら見送り。
2026 年の本番エンジニアリングチームほぼ全てで答えは Yes。65%トークン削減は直接的コスト削減 + セッション反復の高速化、精度コストは最小限。
よくある落とし穴
- グローバルにインストールして on のままにしてる。プロジェクトにジョインする新メンバーが短い応答に混乱する。チーム README に Caveman を明記。
wenyanモードを共有コードベースで使う。漢文調変種は楽しいがほとんどのチームには読めない。共有プロジェクトではfull推奨。- CLAUDE.md を過度に圧縮。
caveman-compressは instruction を caveman 化して上書き — 圧縮が複利。commit 前に出力を読む。 - Caveman がコードを圧縮しないことを忘れる。一部ユーザーは出力削減を全方面に期待 — 自然言語プロースだけが圧縮、コードは全長。
prompt-type hook で/cavemanを使う。prompt hook は JSON 応答を期待するモデル呼び出しを発火 — caveman 圧縮はその hook の JSON 出力を短縮できるが、hook ハンドラ 自体は caveman context で実行されない。設計時に考慮。
2026 Q2 アップデート: v1.7.0 → v1.8.2 直近リリース
Caveman は 2026年4月15日〜5月12日の間に4本のプロダクションリリースを出している。5月より前にインストールしたなら、ユニバーサルインストーラを再実行する価値あり — 計測機能と新規エージェント統合が増えている。
v1.8.2(2026年5月12日)— インストーラ修正
curl | bashのスキル自動インストールが--yes --allでプロンプトなしに完走するように修正(CI で必須)- Gemini
commands/caveman-init.tomlに余分な YAML フェンスが入っていてgemini extensions installが失敗していたバグを修正 - Codex 設定キーを
codex_hooks→hooksにリネーム(Codex CLI 2026.5 の設定スキーマに整合)
v1.8.0(2026年5月10日)— OpenClaw + opencode ネイティブ統合
- OpenClaw: Caveman が
~/.openclaw/workspace/にネイティブスキルとして落ちるようになった。npx シムが廃止され、インストーラが OpenClaw を検出するとゲートウェイの workspace に直接スキルファイルを書き込む - opencode: ネイティブプラグインパスが
~/.config/opencode/plugins/caveman/に変更。以前は npx ラッパー必須だったが、v1.8.0 以降はプラグインファイルを直接配置する - インストーラ全面リライト: 34 プロバイダー検出、
--only <provider>バリデーション、O_NOFOLLOW + 0600の symlink-safe フラグ書き込み - リポジトリ再構成:
src/にhooks/,rules/,tools/,mcp-servers/を統合 - テスト 50/50 パス(v1.7.0比 +7)
v1.7.0(2026年5月1日)— 計測・cavecrew・MCP middleware
Q2 最大のリリース。4つの目玉機能:
/caveman-statsスキル — セッション JSONL ファイルを読み、入出力トークンを集計、Anthropic 現行料金を適用し、累計 USD 節約額を報告する。エコシステム初の 実測 ベース節約レポート(推定値ではなく)- Statusline 節約バッジ —
[CAVEMAN] ⛏ 12.4kを Claude Code の statusline にインライン表示。生涯削減トークン数を常時可視化。v1.7.0+ ではデフォルト ON caveman-shrinkMCP middleware — 正式に npm publish。任意の MCP サーバをラップし、tool / prompt / resource 記述を caveman 風に書き換えてからコンテキストウィンドウに入れる- cavecrew サブエージェント — 3つの定義済みサブエージェント(
investigator/builder/reviewer)を Claude Haiku/Sonnet/Haiku で構成、エージェント間ハンドオフトークンを ~60% 削減
v1.6.0(2026年4月15日)— セキュリティ硬化
safeWriteFlag()で symlink 攻撃対策(O_NOFOLLOW+ atomic 書き込み +0600権限)~/.claude/package.jsonが"type": "module"のときの ESMrequireエラー修正CLAUDE_CONFIG_DIR環境変数を hooks と statusline で尊重- 自然言語アクティベーション(
"talk like caveman"/"normal mode")が GA - 長セッションで caveman スタイルを保持する per-turn reinforcement
v1.6.0 → v1.8.2 の累積効果として、Caveman は 計測可能・マルチエージェント対応・サプライチェーン安全 なツールになった。4月に物珍しさで導入したなら、5月の各リリースは予算ガバナンス目的での採用理由になる。
実測:/caveman-stats と Statusline バッジ
v1.7.0 以前、Caveman の「65%削減」はメンテナの tiktoken ベンチマーク値だった。v1.7.0 でユーザーごとの実測機能が入った:
# Claude Code 内、いつでも:
/caveman-stats
# 出力例(実セッション):
Caveman Savings — Last 30 Days
Output tokens saved: 187,420
Output tokens spent: 102,180
Estimated reduction: 64.7%
USD saved (at Sonnet $15/M out): $2.81
Lifetime saved: 1.42M tokens / $21.34
スキルは Claude Code が ~/.claude/projects/<project>/ に書く JSONL を読み、Caveman ありとなしでのトークン消費を集計、Anthropic 現行料金を適用する。
Statusline バッジ は同じデータの常時表示 UI。v1.7.0+ をインストールすると、Claude Code セッションごとに [CAVEMAN] ⛏ 12.4k(実生涯削減数)が statusline に出る。セッション終了後に更新される。非表示にしたい場合は設定で caveman.statusline = false。
API 予算を管理するチームには、/caveman-stats(開発者ごとのレポート)+ statusline バッジ(常時可視化されたナッジ)の組み合わせで、AGENTS.md カテゴリで初の 計測ループが閉じた ルールセットになっている。
Cavecrew: マルチエージェント・サブエージェント設計
v1.7.0 最大のアーキテクチャ追加が cavecrew — Claude Code サブエージェント間のハンドオフ層を圧縮するワーキング実装。
標準的なマルチエージェント設計(1つのオーケストレータが専門エージェントに委譲する形)は、ハンドオフのプロース に大量トークンを浪費する。「では X エージェントに委譲して、戻り値を…」のナレーションが、長セッションでは委譲のたびに積もり、エージェント間トラフィックの 30-60% を占める。
Cavecrew は3つのサブエージェントを caveman 圧縮済みシステムプロンプト + bullet-list inter-agent contract で定義する:
| サブエージェント | モデル | 役割 | ハンドオフスタイル |
|---|---|---|---|
investigator | Claude Haiku | コードベース検索・コンテキスト収集 | bullet-list の事実だけを返す |
builder | Claude Sonnet | investigator のレポートを元にコード書き/編集 | diff + テストを返す、ナレーションなし |
reviewer | Claude Haiku | builder の出力に lint/typecheck、リグレッション報告 | pass/fail + diff to revert |
オーケストレータは順次(または安全な範囲で並列)実行する。メンテナのベンチマークでは、デフォルト(非圧縮)の同じワークフローと比べてエージェント間トークントラフィックを ~60% 削減。
cavecrew は単体インストール(curl ... | bash -s -- --only cavecrew)も可能、または自前の圧縮ハンドオフ・サブエージェントスタックのテンプレートとして使える。Claude Code サブエージェント全般の設計は Claude Code Subagents 完全リファレンス を参照。
OpenClaw・opencode 統合
v1.8.0 は2つの新興エージェントプラットフォームに first-class サポートを追加した。
OpenClaw
OpenClaw は Slack/Discord/iMessage/MCP 経由で Claude(他モデルも)を露出するセルフホスト型ゲートウェイ。Caveman v1.8.0 では ~/.openclaw/workspace/ にネイティブスキルとして配置される:
# OpenClaw のみ対象でインストール
curl -fsSL https://raw.githubusercontent.com/JuliusBrussee/caveman/main/install.sh \
| bash -s -- --only openclaw
ゲートウェイセッションごとにスキルが自動起動する。Slack のメッセージを OpenClaw 経由で Claude にブリッジしているチームでは、Slack からの返信1本1本が caveman 圧縮を経るようになる — 出力トークン課金のサポートチャネル運用でコスト予測が立ちやすい。
opencode
opencode はオープンソースのコードエージェント CLI。v1.8.0 ネイティブプラグインパス:
~/.config/opencode/plugins/caveman/
├─ plugin.yml # opencode plugin manifest
├─ rules/ # 10 rules in opencode-compatible markdown
└─ commands/ # /caveman, /caveman-stats, etc.
前リリースは npx シムでラップする必要があった。v1.8.0 はプラグインファイルを直接配置するので、opencode から見ると他のインストール済みプラグインと同等のネイティブプラグインに見える。
どちらの統合も同じ哲学:圧縮ルールはマークダウン、インストーラがエージェントごとの正しい配信パスを判断する。Claude Code + Cursor + OpenClaw + opencode を併用しているなら、1回のインストーラ実行で全部に Caveman が紐づく。
FAQ
Caveman.MD と AGENTS.md / CLAUDE.md の違いは?
Caveman は 新しいルールファイル形式ではない。既存の AGENTS.md / CLAUDE.md / .cursor/rules / .windsurf/rules に 入れる 指示セット(10ルール + 4圧縮レベル)。指示は「プロース出力を平均65%圧縮する」がコード・URL・パス・技術的内容はバイト単位で保持する。
Caveman は実際いくら節約できる?
ベンチマークで出力トークンを平均65%削減(22-87%幅)。Claude 出力トークン月$50 のユーザーで月$33返金。入力トークン圧縮(CLAUDE.md / メモリファイルへの caveman-compress)で更に~46%削減、セッション越しに複利的に効く。
Caveman で Claude の精度は落ちる?
落ちない、むしろ逆かも。Caveman docs が引用する 2026年3月の論文では 「大規模モデルを短い回答に制約すると、特定のベンチマークで精度が26ポイント改善」。冗長な前置きは悪い推論と相関する — Caveman は前置きを除き、思考トークン計算には手を出さない。
lite / full / ultra / wenyan モードの違いは?
lite は冗長語のみ除く — 出力は自然なプロースのまま。full はデフォルトの caveman、電報調だが読める。ultra は最大簡潔さ、若干読みづらい。wenyan は漢文調を模倣、最短出力(お遊び or 純粋ログスタイル用)。
Caveman は Cursor / Windsurf / Cline / Aider で動く?
動く — ユニバーサルインストーラが30+の対応エージェントを検出して各々設定。Cursor には .cursor/rules/caveman.mdc の alwaysApply: true。Windsurf には .windsurf/rules/caveman.md の trigger: always_on。Cline は .clinerules/caveman.md。Aider は .aider.conf.yml 経由。
Claude Code 公式 plugin system で Caveman を使える?
使える — Caveman は Claude Code プラグイン として ~/.claude/plugins/caveman/ にインストール。プラグインは自動起動、セッションごとの opt-in 不要。アンインストールはディレクトリ削除+ Claude Code 再起動。
caveman-shrink MCP middleware とは?
別ユーティリティで、MCP サーバのツール記述をコンテキストウィンドウ入り前に圧縮する。MCP サーバはしばしば冗長な複数段落のツール記述で毎セッションの起動コンテキストを肥大化させる — caveman-shrink がこれを圧縮形式でリライトし、ツール機能を変えずにトークンを回収する。
Caveman は私のプロンプトを圧縮する?それともモデル出力だけ?
デフォルトで出力のみ。モデルの入力(あなたのプロンプト + CLAUDE.md + ツール記述)は、明示的に caveman-compress をメモリファイルに、または caveman-shrink を MCP 記述に実行しない限り変わらない。コスト節約は主に出力側 — モデルが冗長になりがちな部分。
インストーラを使わず手動で Caveman ルールを追加できる?
できる。リポの README が10ルールを逐語で列挙している — そのまま AGENTS.md(または CLAUDE.md、または .cursor/rules/caveman.mdc)にプレーン Markdown としてコピー。インストーラは複数エージェントを一度に紐付ける利便性。
自分のセッションでの実節約額をどう計測する?
Claude Code 内で /caveman-stats を実行する(v1.7.0+)。~/.claude/projects/<project>/ のセッション JSONL ファイルを読み、入出力トークンを集計、Anthropic 現行料金を適用し、累計 USD 節約額を報告する。同じデータが statusline バッジ([CAVEMAN] ⛏ 12.4k)の元になり、v1.7.0+ ではデフォルト表示される。AGENTS.md カテゴリで初の ユーザーごとの実測 節約 — メンテナベンチマーク値ではない。
cavecrew とは?通常の Claude Code サブエージェントとどう違う?
cavecrew は v1.7.0 で追加された caveman 圧縮済みサブエージェント・ハンドオフのリファレンス実装。3つのサブエージェント — investigator(Haiku)/ builder(Sonnet)/ reviewer(Haiku) — が圧縮済みシステムプロンプトと bullet-list の inter-agent contract を使う。メンテナベンチマークでは非圧縮デフォルト比でハンドオフトークンを ~60% 削減。curl ... | bash -s -- --only cavecrew でインストール、または自前の圧縮ハンドオフ・サブエージェントスタックのテンプレートとして使える。
Caveman は OpenClaw / opencode で動く?
動く、v1.8.0(2026年5月10日)以降。OpenClaw には ~/.openclaw/workspace/ にネイティブスキルとして配置される — Slack/Discord/iMessage の返信がゲートウェイ経由なら、ブリッジで出力トークン圧縮できるので有用。opencode には ~/.config/opencode/plugins/caveman/ にネイティブプラグインとして配置(npx シム廃止)。ユニバーサルインストーラが両方を自動検出する。Claude Code、Cursor、Codex CLI、Gemini CLI と組み合わせれば、1回のインストール実行で 34 の対応プロバイダーパスすべてに Caveman が紐づく。
関連記事
- AGENTS.md vs CLAUDE.md vs .cursor/rules 3方比較
- AGENTS.md ベストプラクティス 2026
- AGENTS.md × Codex セットアップガイド 2026
- AGENTS.md × GitHub Copilot 統合 2026
- Claude Code Subagents 完全リファレンス 2026
- Claude Code Subagents 公式ドキュメント・リファレンス 2026
- Claude Code Hooks 完全リファレンス 2026
- 2026年インストールすべきClaude Code Skillsベスト15
- What is Career-Ops?
- 165以上のAIコーディングルール実例集
外部参考
- JuliusBrussee/caveman on GitHub — v1.8.2(2026年5月12日)
- getcaveman.dev — 公式サイト(Cavemem、Caveman Code)
- Caveman CLAUDE.md ルール掲載(PS)
- Caveman リリースページ — フル changelog