GoogleでChromeのDX責任者を務めるAddy Osmani氏が2026年に公開した addyosmani/agent-skills は、AIコーディングエージェントの最大の弱点である「最短ルート信仰」を、20スキル+7スラッシュコマンド+反論テーブルという三層構造で物理的に封じ込める汎用フレームワークだ。GitHub Starは2026年5月時点で35,000超、forks 4,000超を達成し、Claude Code・Cursor・Copilot・Gemini CLI・Windsurf・OpenCode・Kiroの全主要ハーネスに横断対応している。
Claude Code Skillsの基本コンセプト全般は Claude Code Skills徹底解説 を併せて参照してほしい。
30秒で理解する agent-skills
- 何者か: Google Chrome DX責任者Addy Osmani氏が2026年にMITで公開したSkills集大成OSS。GitHub Star 35,000+、fork 4,000+。
- 構造: 20スキル+7スラッシュコマンド+3エージェントペルソナ+4参照チェックリスト。SDLC 6フェーズ(DEFINE/PLAN/BUILD/VERIFY/REVIEW/SHIP)に整列。
- 核となる発明: Anti-Rationalization Tables(反論テーブル)。LLMが言い出しがちな「テスト後で書く」等の言い訳を事前列挙し反論をハードコード。
- 対応ハーネス: Claude Code・Cursor・Gemini CLI・Windsurf・OpenCode・GitHub Copilot・Kiro。同じMarkdownを横展開可能。
- 使い所: AGENTS.md+hooks+skillsの4層モデルで、長時間エージェント実行時のショートカット問題を構造的に解決する基盤として最有力。
agent-skillsとは何か—Addy Osmani氏が「シニアの仕事」を成文化した理由
Addy Osmani氏はGoogleでChromeのDeveloper Experience(DX)責任者を務め、Web Vitals・Lighthouse・Performance Best Practiceの普及を主導してきた人物だ。著書『Software Engineering at Google』(共著)で広く知られ、Hyrum’s Lawや80/15/5テストピラミッド等の概念を実践現場に持ち込んだ第一人者でもある。
そのAddy Osmani氏が2026年に公開したのが agent-skills だ。氏自身がブログ記事で語る動機は明快である。
動機—エージェントは「シニアの見えない仕事」を全部スキップする
「シニアエンジニアの仕事の大半は、diffに表れない部分でできている」。これがagent-skillsの出発点になっているコアテーゼだ。
AIコーディングエージェントは「動くコード」を最短で出すことを学習目標として最適化されている。だが実際のシニアエンジニアの仕事は、そこに到達する前後にこそ集中する。仕様の確定・タスク分解・テスト戦略・レビュー・スコープ規律・ドキュメント・デプロイ計画——これらは全て「diffに表れない」が、書かれたコードの寿命と保守性を決める。
Addy氏はこの構造を「ジュニアエンジニアと同じ失敗モード」と表現する。ジュニアは何を聞かずにコードを書き始め、テストを書かずに「動きました」と報告し、レビュー指摘で初めて欠けていた工程に気付く。今のAIエージェントもまったく同じ振る舞いをする。
解決アプローチ—スキャフォールドを「強制可能」な形で外付けする
agent-skillsの解決策はシンプルだ。シニアエンジニアが自分自身に課している無意識のチェックリストを、SKILL.md(スキル定義Markdown)として明文化し、エージェントランタイムに強制可能な形で渡す。提案や推奨ではなく、各フェーズで実行する手順とエグジットクライテリア(完了判定基準)を含むワークフローとして。
agent-skillsの設計思想 5原則
- Process over Prose: エッセイ的説明文ではなく、エージェントが実行可能なワークフローを書く。
- Anti-Rationalization Tables: 「言い訳→反論」を事前列挙する。LLMの説得力ある自己正当化を防ぐ。
- Verification as Non-Negotiable: 全スキルの終端に必ず「証拠」(テスト合格・ビルド成功・ランタイムトレース等)を要求。
- Progressive Disclosure: メタスキル(using-agent-skills)がルーター役で、必要なスキルだけ動的活性化。トークン浪費を防ぐ。
- Scope Discipline: 「依頼された範囲だけ触れ」を明文化。PRマージ可能性の最大決定要因。
Addy氏自身の言葉
ブログから抜粋できる氏の表現は以下に集約される。
“Process over prose. Workflows over reference.”
「プロセスは散文に勝る。ワークフローはリファレンスに勝る」。要するに、エージェントは「書かれたガイドライン」を読んで賢くなったりはしない。「実行手順」を踏ませることでだけ品質が上がる、という割り切りだ。
“Passing tests are evidence, not proof.”
「合格テストは証拠であって証明ではない」。これはVERIFYフェーズの基本姿勢で、テスト全合格をもって完了とせず、ユーザー可視の振る舞いと人間レビューを必須化する設計に直結している。
この章のポイント
- Addy Osmani氏はGoogle Chrome DX責任者で『Software Engineering at Google』の知見をエージェント設計に持ち込んだ
- 核となる問題意識は「エージェントはシニアのdiffに表れない仕事を全部スキップする」こと
- 解決は「シニアの無意識チェックリストを強制可能な手順書として外付けする」
- 5原則の中核はAnti-Rationalization TablesとVerification as Non-Negotiable
6フェーズSDLCと20スキルの全体像
agent-skillsの構造は、ソフトウェア開発のライフサイクルを6フェーズに分割し、各フェーズに必要なスキルを配置した格子状になっている。
フェーズ図
/spec] --> B[PLAN
/plan] B --> C[BUILD
/build] C --> D[VERIFY
/test] D --> E[REVIEW
/review] E --> F[SHIP
/ship] F -.feedback.-> A E -.simplify.-> G[/code-simplify/] G -.-> E style A fill:#fef3c7,stroke:#d97706,color:#000 style B fill:#dbeafe,stroke:#2563eb,color:#000 style C fill:#d1fae5,stroke:#059669,color:#000 style D fill:#fce7f3,stroke:#db2777,color:#000 style E fill:#e0e7ff,stroke:#4f46e5,color:#000 style F fill:#fed7aa,stroke:#ea580c,color:#000 style G fill:#fef9c3,stroke:#a16207,color:#000
各フェーズには「キープリンシプル」(守るべき第一原則)が紐づいている。これがエージェントの優先順位判断の基準になる。
フェーズ別キープリンシプル一覧
- DEFINE → "Spec before code"(コードより先に仕様)
- PLAN → "Small, atomic tasks"(小さく原子的なタスク)
- BUILD → "One slice at a time"(垂直スライスを1枚ずつ)
- VERIFY → "Tests are proof"(テストは証拠)
- REVIEW → "Improve code health"(コードの健康度を上げる)
- SHIP → "Faster is safer"(速い方が安全)
- code-simplify → "Clarity over cleverness"(明快さは賢さに勝る)
全20スキルの一覧表
| Phase | Skill | 主要原則・パターン | 起動タイミング |
|---|---|---|---|
| DEFINE | idea-refine | 発散/収束思考 | あいまいな概念の具体化 |
| DEFINE | spec-driven-development | PRD(目的・コマンド・構造・スタイル・テスト・境界) | 新規プロジェクト・大規模変更 |
| PLAN | planning-and-task-breakdown | 受け入れ条件+依存順序 | 仕様→実装単位への分解 |
| BUILD | incremental-implementation | 垂直スライス・フィーチャーフラグ・ロールバック容易性 | 複数ファイル変更 |
| BUILD | test-driven-development | Red-Green-Refactor・80/15/5・DAMP・Beyoncé Rule | ロジック実装・バグ修正 |
| BUILD | context-engineering | ルールファイル・コンテキストパッキング・MCP連携 | セッション開始・出力品質低下 |
| BUILD | source-driven-development | 公式ドキュメント引用+未検証タグ | フレームワーク選定 |
| BUILD | frontend-ui-engineering | デザインシステム・WCAG 2.1 AA | UI構築 |
| BUILD | api-and-interface-design | Hyrum’s Law・One-Version Rule・境界バリデーション | API・モジュール境界設計 |
| VERIFY | browser-testing-with-devtools | Chrome DevTools MCPでDOM/Console/Network | ブラウザ実装デバッグ |
| VERIFY | debugging-and-error-recovery | 5ステップトリアージ・Stop-the-line | テスト失敗・予期せぬ振る舞い |
| REVIEW | code-review-and-quality | 5軸レビュー・~100行PR・Nit/Optional/FYIラベル | マージ前 |
| REVIEW | code-simplification | Chesterton’s Fence・Rule of 500 | 動くが読みづらいコード |
| REVIEW | security-and-hardening | OWASP Top 10・3層境界 | 入力・認証・外部連携 |
| REVIEW | performance-optimization | Core Web Vitals・計測ファースト | 性能要件・退行 |
| SHIP | git-workflow-and-versioning | Trunk-based・atomic commit・~100行 | あらゆる変更 |
| SHIP | ci-cd-and-automation | Shift Left・フィーチャーフラグ・品質ゲート | パイプライン構築 |
| SHIP | deprecation-and-migration | Code-as-liability・compulsory/advisory廃止 | システム移行・廃止 |
| SHIP | documentation-and-adrs | ADR・Whyを残すドキュメント | 設計判断・API変更 |
| SHIP | shipping-and-launch | プレ立ち上げチェック・段階的ロールアウト | 本番デプロイ準備 |
7スラッシュコマンドとの対応
20スキルは膨大すぎてユーザーが直接呼び出すのは現実的でない。そこでスラッシュコマンドが「フェーズ単位の入口」として用意されており、コマンド発動時に関連スキルが自動活性化する設計になっている。
/spec → idea-refine + spec-driven-development
/plan → planning-and-task-breakdown
/build → incremental-implementation + TDD + context-engineering + 関連BUILD系
/test → test-driven-development + browser-testing + debugging
/review → code-review-and-quality + security-and-hardening + performance + simplification
/code-simplify → code-simplification
/ship → git-workflow + ci-cd + deprecation + documentation + shipping-and-launch
この章のポイント
- 20スキルはSDLC 6フェーズ(DEFINE/PLAN/BUILD/VERIFY/REVIEW/SHIP)に整列
- 各フェーズには第一原則が紐づく("Spec before code"・"Tests are proof"等)
- 7スラッシュコマンドが入口、内部で関連スキルが自動活性化
- code-simplifyだけはレビュー横断で再帰的に呼ばれる位置づけ
Anti-Rationalization Tables——「言い訳と反論」の発明
agent-skillsを他のSkillsリポジトリと決定的に区別している発明が、各SKILL.mdに必ず含まれる反論テーブル(Anti-Rationalization Table)だ。
反論テーブルの構造
書式は単純だ。各スキルファイルの末尾近くに「Excuse(言い訳)」と「Rebuttal(反論)」の2列テーブルが置かれる。エージェントが手順を省略しようとした時に内心で考えるであろう自己正当化を先回りして書き出し、それぞれに反論をハードコードしてある。
典型的な反論パターン例
- "This task is too simple to need a spec."(タスクが単純すぎて仕様は不要)
→ 受け入れ条件は依然として必要。5行で十分、ゼロは不可。 - "I'll write tests later."(テストは後で書く)
→ 「後」は来ない。先に失敗テストを書け。 - "Tests pass, ship it."(テスト通った、出荷OK)
→ 合格は証拠であって証明ではない。ユーザー可視の振る舞いと人間レビューを実施。 - "I just need to refactor this real quick."(ちょっとだけリファクタ)
→ 依頼されたスコープに集中。リファクタは別PRで。 - "This pattern looks fine to me."(このパターンで大丈夫そう)
→ Hyrum's Law:観測可能な振る舞いは全て依存対象になる。境界を明示せよ。
なぜこのパターンが効くのか
LLMの最大の強みは「説得力ある文章生成」だが、これは同時に最大の弱点でもある。エージェントは自分自身に対して説得力のある言い訳を生成して手順を省略する。「このタスクは小さいので仕様書は時間の無駄」「テストはユーザーが指示しなかったので不要」——これらは全て正しく聞こえる。
反論テーブルは、これらのもっともらしい言い訳を事前にカタログ化することで、エージェントが「自分はオリジナルな判断をしている」と錯覚するルートを物理的に塞ぐ。ハードコードされた反論文の存在は、モデルにとって「同じ論点を再度自分で発見できない」状況を作る。
これは行動経済学的に言えばコミットメント・デバイスだ。事前に逃げ道を塞ぐことで、後から「やっぱりこっちでいいか」と判断を翻すコストを上げている。
反論テーブルが守る5つの非交渉項目
メタスキルusing-agent-skillsからAddy氏が抽出した、AGENTS.mdに必ず書くべき5つの非交渉ルールは以下だ。
Five Non-Negotiables for Any AGENTS.md
- Surface assumptions before building(前提を可視化してから作り始めよ)
- Stop and ask when requirements conflict(要件が矛盾したら止まって聞け)
- Push back when warranted(必要なら押し返せ。エージェントはYESマシンではない)
- Prefer boring, obvious solutions(退屈で当たり前の解を選べ)
- Touch only what you're asked to touch(依頼されたものだけ触れ)
特に3番目の「Push back when warranted」は重要だ。エージェントが過剰に従順だとユーザーの誤指示が修正されないままコードに焼き込まれる。反論テーブルは、エージェント自身の手順省略だけでなく、ユーザーへの押し返しも奨励する。
この章のポイント
- 反論テーブルは「言い訳→反論」の2列ハードコード形式で各SKILL.mdに必須
- LLMの自己説得能力を逆手に取り、想定言い訳を先回りで列挙+反論することで省略ルートを塞ぐ
- 5つの非交渉ルールはAGENTS.mdに最低限書くべき内容として推奨される
- 従順すぎるエージェント問題に対しても「push back」を奨励する
Google発のソフトウェア工学プラクティスを丸ごと埋め込む
agent-skillsの内部に埋め込まれている工学知識は、『Software Engineering at Google』(通称SWE-Book)とGoogle Engineering Practicesから引き継がれた実践知の集大成と言える。
Hyrum’s Law(api-and-interface-designスキル)
“With a sufficient number of users of an API, it does not matter what you promise in the contract: all observable behaviors of your system will be depended on by somebody.”
「APIに十分な数のユーザーがいる時、契約書で何を約束したかは関係ない。観測可能な全ての振る舞いが誰かの依存対象になる」(Hyrum Wright氏発)。これがHyrum’s Lawだ。api-and-interface-designスキルはこの法則を出発点に、One-Version Rule(一バージョン原則)と境界バリデーションを必須化する。
Beyoncé Rule(test-driven-developmentスキル)
“If you liked it, you should have put a (test) on it.”
「気に入ったなら(テストを)書いておけば良かったのに」。Beyoncéの楽曲「Single Ladies」をもじったSWE-Bookの定番表現で、コードを残したいなら必ずテストで囲え、という規律を意味する。test-driven-developmentスキルはこの規律をRed-Green-Refactor手順と組み合わせて強制する。
80/15/5 テストピラミッド
╱E2E╲ 5% エンドツーエンド
╱─────╲
╱統合テスト╲ 15% 統合・契約テスト
╱──────────╲
ユニットテスト 80% 関数・クラス単体
下に行くほど数が多く速く安定、上に行くほど少なく遅く脆弱。比率は80/15/5を目安とする。これはGoogle社内の経験則として広く知られているが、agent-skillsはこれをエージェントに自動適用させる点が新しい。
Chesterton’s Fence(code-simplificationスキル)
“Do not remove a fence until you know why it was put up.”
「フェンスがそこに立てられた理由を知るまで、フェンスを取り壊してはならない」(G.K.チェスタトン)。code-simplificationスキルはこの法則をAIエージェントに教え込み、「動かないように見えるコード」「冗長に見える条件分岐」を即座に削除しないよう強制する。同時にRule of 500(一画面に収まる単位を超えないモジュール設計)と組み合わせて、簡潔化の方向を限定する。
Five-Step Triage(debugging-and-error-recoveryスキル)
エラー対応の標準手順として以下を強制する。
Five-Step Triage
- Reproduce(再現):失敗を100%再現できる最小手順を確立
- Localize(局所化):失敗箇所を特定(バイナリサーチ・bisect等)
- Reduce(縮小):再現に必要な最小ケースまで削ぎ落とす
- Fix(修正):根本原因を直す(症状を隠さない)
- Guard(防御):再発防止テストを追加
Stop-the-line rule: テスト失敗・ビルド破壊が発生したら全ての別作業を止め、まず復旧する。トヨタ生産方式の「アンドンコード」をエージェントに適用したもの。
Five-Axis Review(code-review-and-qualityスキル)
PRレビューを5軸で評価する手順。
| 軸 | 確認事項 |
|---|---|
| Correctness | 仕様・要件を満たすか |
| Clarity | 6か月後の自分が読めるか |
| Tests | テストは挙動を捉えているか |
| Security | 入力検証・認可境界 |
| Performance | 既知のホットパスの退行 |
加えて~100行PRサイジング(PR1本あたりdiffを100行程度に抑える)と severity ラベル(Nit / Optional / FYI)の運用が組み込まれている。これは「大きすぎるPRはレビューされない」というGoogle社内の経験則を、エージェントに事前分割させることで対応する。
Trunk-Based Development(git-workflow-and-versioningスキル)
長寿命ブランチを廃し、main直下に小さくマージする運用。git-workflow-and-versioningスキルは以下を強制する。
# 推奨パターン
git checkout -b feat/small-change
# ~100行のatomic commitを1〜3個
git commit -m "Add validation for email field"
git push origin feat/small-change
# CI緑化を確認 → main即マージ → ブランチ削除
「Faster is Safer」(速いほうが安全)というSHIPフェーズの原則は、長寿命ブランチに溜まったコンフリクトと統合債務こそが障害の最大要因だ、という経験則に立脚している。
この章のポイント
- agent-skillsはSWE-Book/Google Engineering Practicesの実践知をエージェント自動適用形に変換した集大成
- Hyrum's Law・Beyoncé Rule・Chesterton's Fence・Five-Step Triage・Five-Axis Review・Trunk-Based Developmentが各スキルに埋め込み
- ~100行PR・80/15/5テストピラミッド等の定量規律がエージェントに強制可能になる
- Stop-the-line・Faster is Saferといった文化的原則も明文化済
全主要ハーネスへのインストール—Markdown1本で横展開
agent-skillsの実用面で重要なのは、書き換え不要で全主要ハーネスに横展開できることだ。SKILL.mdというMarkdown形式が、Claude Code・Cursor・Gemini CLI・Windsurf・OpenCode・GitHub Copilot・Kiroの全てで(やや異なる方式ながら)認識される。
Claude Code(推奨:マーケットプレース経由)
# Claude Code内で実行
/plugin marketplace add addyosmani/agent-skills
/plugin install agent-skills@addy-agent-skills
SSHエラーが出る場合はHTTPSで強制クローンする。
/plugin marketplace add https://github.com/addyosmani/agent-skills.git
/plugin install agent-skills@addy-agent-skills
ローカル開発で試す場合は以下。
git clone https://github.com/addyosmani/agent-skills.git
claude --plugin-dir /path/to/agent-skills
導入直後から/spec /plan /build /test /review /code-simplify /shipがClaude Code内で使える状態になる。Claude Code Skills機構の自動活性化を最大限活用したい場合はこのルートが最適だ。Claude Code全般のセットアップは Claude Codeベストプラクティス2026 を参照してほしい。
Cursor
SKILL.mdを.cursor/rules/にコピーする方式。プロジェクト固有のルールとしてCursorが起動時に読み込む。
mkdir -p .cursor/rules
cp -r /path/to/agent-skills/skills/* .cursor/rules/
Gemini CLI
ネイティブインストールコマンドで自動配置できる。
gemini skills install https://github.com/addyosmani/agent-skills.git --path skills
# またはローカルクローンから
gemini skills install ./agent-skills/skills/
GEMINI.mdへの追記方式も対応している(永続コンテキスト用途)。
Windsurf
.windsurfrules設定にスキル本文を追加する。詳細は公式docs/windsurf-setup.mdを参照。
OpenCode
AGENTS.mdとskillツールでエージェント駆動の活性化を行う。
GitHub Copilot
agents/配下の定義をCopilotペルソナとして利用、.github/copilot-instructions.mdにスキル本文を追加する二段構え。
Kiro IDE & CLI
.kiro/skills/配下にProjectまたはGlobalレベルで配置。Agents.md形式に対応している。
横展開の威力
ここが重要だ。同じMarkdownファイルを書き換えずに、上記7ハーネス全てで動く。これは単なる「対応」ではなく、企業導入時の選択リスクを劇的に下げる。
「Claude Codeに賭けて全社導入したが半年後にCursorに移行することになった」というケースで、Skills資産を捨てずに引き継げる。これがAddy氏が掲げる「Write once, runtime enforces everywhere(一度書けば全ランタイムで強制される)」の本質的な価値だ。
この章のポイント
- Claude Code・Cursor・Gemini CLI・Windsurf・OpenCode・Copilot・Kiroの全7主要ハーネス対応
- 同じSKILL.md Markdownを書き換えずに横展開可能
- Claude Codeは
/plugin marketplace addが最簡 - 企業のハーネス選択リスクを劇的に下げるのが横展開の本質的価値
agent-skills vs 他Skills集の使い分け
2026年5月時点でClaude Code Skills関連のリポジトリは複数存在する。それぞれの位置づけを比較しておこう。
主要Skills集の比較表
| 項目 | agent-skills (Addy) | anthropics/skills | prismatic-skills | claude-code-templates |
|---|---|---|---|---|
| 提供元 | Addy Osmani(個人) | Anthropic公式 | Prismatic(iPaaS) | davila7(コミュニティ) |
| ライセンス | MIT | MIT | MIT | MIT |
| GitHub Star | 35,000+ | 5,000+ | 26 | 4,000+ |
| ターゲット | SDLC全工程汎用 | 知識ワーカー(PDF/Excel等) | iPaaS製品束ね | 横断カタログ |
| 対応ハーネス | 7種類(Claude/Cursor/Gemini/Windsurf/OpenCode/Copilot/Kiro) | Claude Code中心 | Claude Code専用 | Claude Code中心 |
| 反論テーブル | 全スキルに必須 | なし | なし | なし |
| エージェントペルソナ | 3種(reviewer/test/security) | 多数 | 7種 | 多数 |
| 主軸 | 工程強制 | 形式特化 | 製品連携 | カタログ |
| 自社プラグイン参考度 | 中(汎用知識) | 中(参照実装) | 高(製品連携テンプレ) | 中(カタログ運用) |
どれを選ぶか
選択ガイド
- SDLC全工程の品質を底上げしたい→ agent-skills(最有力)
- PDF/Excel/PPT処理を任せたい→ anthropics/skills
- 自社SaaSにClaude Codeプラグインを束ねたい→ prismatic-skillsをテンプレートとして参照
- 個別タスクに合うスキルを横断検索したい→ claude-code-templates(カタログ運用)
- これらは併用可能。agent-skills(基盤)+anthropics/skills(形式処理)+prismatic-skills(自社製品)の三層構成が現実解。
claude-code-templatesの詳細は claude-code-templates完全解説、Prismatic Skillsの設計パターンは Prismatic Skills徹底解剖 を参照してほしい。
この章のポイント
- agent-skillsはSDLC全工程汎用のベースレイヤーとして他Skills集より明確に上位
- anthropics/skills(形式特化)・prismatic(製品連携)・templates(カタログ)と役割が重ならない
- 三層構成で併用するのが2026年現実解
実装テイクアウェイ—自社プロジェクトに落とし込む方法
agent-skillsの設計思想を自社プロジェクトに移植したい開発者のために、実装パターンを5つにまとめる。
Takeaway 1: 反論テーブルを最初から書く
新規SKILL.mdを書く時、最初に書くべきは「言い訳→反論」の2列テーブルだ。先に手順本文を書くと、後から付け足された反論テーブルは形骸化しがちになる。逆に反論テーブルから書き始めると、手順本文がそれを満たすように設計される。
## Anti-Rationalization Table
| Excuse | Rebuttal |
|---|---|
| "依存ライブラリ追加で済む" | 既存ライブラリで実現可能か30秒検討せよ。新規依存はメンテ債務。 |
| "型定義は後で書く" | 後はない。型なしで書いたコードを後から型付けする工数は2-3倍。 |
Takeaway 2: SDLC 6フェーズに整列させる
社内独自スキルを書く際も、必ずDEFINE/PLAN/BUILD/VERIFY/REVIEW/SHIPのどれかに割り当てる。「複数フェーズに跨る」スキルは大抵スコープが広すぎる兆候だ。
Takeaway 3: 終端で「証拠」を要求する
各SKILL.mdの最後に「完了条件として何を提出するか」を書く。「テスト合格スクショ」「pnpm build成功ログ」「Lighthouse Performance 90+」等、ファイル名・コマンド出力・数値の形で具体化する。
Takeaway 4: メタスキルで動的活性化を設計する
スキルが10個を超えたら、using-agent-skills相当のメタスキル(ルーター)を必ず用意する。「いまどのスキルを呼ぶべきか」をモデルに毎回判断させると、不必要な活性化でトークンを浪費する。タスクのキーワードから決定論的にスキルを選ぶロジックを書いた方が安定する。
Takeaway 5: agents/とskills/を責務分離する
agent-skillsはcode-reviewer test-engineer security-auditorの3エージェントペルソナをスキルとは別ディレクトリagents/に持つ。これは
- skills/: 手順書(誰がやってもこう進める)
- agents/: 専門役(特定の視点・基準で判断)
という責務分離だ。社内導入時もこの2ディレクトリ構造を踏襲するとメンテしやすい。
最短導入ステップ
git clone https://github.com/addyosmani/agent-skills.git- 自社プロジェクトの
.claude/skills/にスキル全体をコピーまたは選別コピー - AGENTS.md/CLAUDE.mdに
using-agent-skills相当のメタスキル参照を追加 /specから始めて全コマンドを1度通しで試す- 反論テーブルに自社固有の言い訳を追記してチューニング
最低限の体験で1日、業務での定着まで1〜2週間というのが導入実績の目安だ。
この章のポイント
- 反論テーブルは最初に書く。後付けは形骸化する
- SDLC 6フェーズに整列させ、跨るスキルはスコープ過多のサイン
- 終端で「証拠」を必ず要求する(ファイル名・コマンド出力・数値)
- 10スキル超えたらメタスキルでルーティング設計
- skills/(手順)とagents/(専門役)を責務分離
まとめ—長時間エージェント時代の必須インフラ
addyosmani/agent-skillsは、AIコーディングエージェントが「動くコードを最速で出す」目標最適化の副作用としてシニアエンジニアの実務をスキップする問題を、20スキル+7コマンド+反論テーブル+3エージェントペルソナという四層構造で構造的に解決する2026年最重要のSkills集大成だ。
この記事のまとめ
- 何が新しいか: SWE-Bookの工学知識をエージェント自動強制可能な形に翻訳した最初の本格事例。
- 核となる発明: Anti-Rationalization Tablesでエージェントの自己説得経路を物理的に塞ぐ。
- 構造: SDLC 6フェーズ整列の20スキル+7スラッシュコマンド+3エージェントペルソナ+4参照チェックリスト。
- 横展開: Claude Code・Cursor・Gemini CLI・Windsurf・OpenCode・Copilot・Kiroの全7ハーネスに同一Markdownで対応。
- 使い所: AGENTS.md+hooks+skillsの4層モデルで長時間エージェント実行の品質基盤として最有力。
- これから: 反論テーブル方式は他のSkills集にも波及する可能性が高い。標準パターン化が予想される。
長時間エージェント実行が当たり前になる2026年後半以降、ショートカットで生まれる「デバッグの考古学(debugging archaeology)」を防ぐためのスキャフォールドは贅沢ではなく必須インフラになる。Addy Osmani氏の言葉を借りれば「The job is to encode discipline as something the agent cannot talk itself out of.」(仕事は、規律をエージェントが言いくるめられない形で符号化することだ)。
agent-skillsは、その符号化作業のリファレンス実装として、現時点で最も完成度が高い。
Claude Code Skills全般の概念は Claude Code Skills徹底解説、Claude Codeの運用ベストプラクティスは Claude Codeベストプラクティス2026、ベンダー製プラグインの設計パターンは Prismatic Skills徹底解剖 を併読してほしい。
参照ソース
- addyosmani/agent-skills – GitHub — リポジトリ本体(Star 35,000+、MIT、最新push 2026-05-07)
- Agent Skills Framework – Addy Osmani Blog — 設計思想の一次情報・5原則・反論テーブルの解説
- Software Engineering at Google — Hyrum’s Law・Beyoncé Rule・80/15/5の原典
- Google Engineering Practices documentation — Five-Axis Review・~100行PRの原点
- Claude Code Skills徹底解説 — Skills機構の全体像