Anthropicが2026年に「Claude Codeでマルチエージェントを組むなら、まずSub-agent機能を試して、それで足りなければ外部ハーネスを検討してほしい」と公式ドキュメントに明記して以降、その「外部ハーネス」のデファクト候補として急速に存在感を増しているOSSがある。
ruvnet/ruflo(旧Claude Flow)だ。2026年5月4日時点で★40,081、当日だけで+1,834を稼ぎ、forks 4,528、購読者340名、SWE-benchスコア84.8%、Claude Code直叩き比でAPIコスト75%削減を謳う。Anthropic公式のClaude Code SDKを土台に、100体以上の専門エージェントを単一ワークスペース内で群(swarm)として協調させることを目的としたオーケストレーション基盤である。
AIエージェントを設計する前に、まずフレームワーク全体の地図を把握したい人はAIエージェントフレームワーク比較2026年版を先に読むと、ruflo・LangGraph・CrewAI・AutoGen・OpenHandsがそれぞれどの軸に位置するかが整理しやすい。
正体: Claude Code/Codex CLIにプラグイン経由で組み込むマルチエージェント・スウォーム基盤。旧名Claude Flow、2026年にrufloへ改名。
差別化: 27個のオーケストレーションフック・314個のネイティブMCPツール・AgentDB(HNSWベクトル検索)・mTLS連邦化。Sub-agentの親子ツリーを超えてmesh/adaptiveトポロジーを実現。
採用判断: Claude Codeを業務で毎日数時間以上使う、または複数人・複数リポ・複数マシンを跨いだエージェント協調が必要なチーム向け。1人で短時間使う用途ではClaude Code単体やSub-agentで十分。
rufloとは:Claude Code SDKを土台にした「群知能」拡張レイヤー
rufloは、AnthropicのClaude Code SDKをコア依存として、その上にスウォーム制御・自己学習メモリ・連邦通信・エンタープライズセキュリティを乗せたOSSである。リポジトリはruvnet/ruflo、TypeScriptが約60%でRust製のWASMカーネルが約20%、残りはシェルとマークダウンで構成される。コードベースは2026年4月のv3メジャーリビルドで25万行を超えた。
名前の由来とリブランド
開発者rUv(ruvnet)は2026年に旧称「Claude Flow」を「ruflo」へ改名した。理由は本人いわく「Rust・フロー状態・必然性を感じる構築物への愛着」。同時に名前空間としてのClaude依存を弱め、GPT・Gemini・Cohere・Ollama・自前のruvLLMを含むマルチプロバイダ対応へ舵を切ったことを意味する。Claude Codeはあくまで第一級のホスト環境という位置づけだ。
数字で見る現在地
GitHub Issue #945の「Claude Flow V3」アナウンスによれば、v3の設計目標は「単一マシンの単発ハーネスから、永続メモリと連邦通信を持つチーム単位の知能インフラへ昇格させること」だった。実装後の指標は以下の通り。
| 指標 | 値 | 出典 |
|---|---|---|
| GitHub Stars | 40,081(+1,834/日) | GitHub API(2026-05-04) |
| Forks | 4,528 | 同上 |
| サブスクライバー | 340 | 同上 |
| 安定版 | v3.6.12 | リリースタブ |
| ネイティブMCPツール | 314 | README |
| 自走エージェント | 100以上 | README |
| SWE-bench solve率 | 84.8% | プロジェクトベンチマーク(自社計測) |
| APIコスト削減 | 75%(Claude Code直叩き比) | 同上 |
特筆すべきはSWE-benchの数値で、Anthropic公式が2026年初頭に報告したClaude Sonnet 4.6単体のスコアを上回る。これは「複数エージェントが協調すればモデル単体より高い解決率に到達する」というマルチエージェント仮説への一つの実証データになっている。ただし計測方法はruflo側の自社計測なので、第三者再現が出るまでは「目安」として読むのが妥当だ。
Claude Code/Codexへのネイティブ統合の仕組み
ruflo最大の特徴は、Claude CodeやCodex CLIにユーザー側のCLIコマンドを変えずにスウォーム機能を注入する設計にある。仕組みは大きく3層に分かれる。
1. プラグインマーケットプレース経由の導入
Claude Codeの公式プラグインマーケットプレースに4種類のrufloプラグインが登録されており、/plugin installで1コマンド導入できる。
/plugin install ruflo-core@ruflo
/plugin install ruflo-swarm@ruflo
/plugin install ruflo-autopilot@ruflo
/plugin install ruflo-federation@ruflo
ruflo-coreが最低限の依存(フックランタイム・AgentDB)、ruflo-swarmが複数エージェント協調、ruflo-autopilotがGoal-Oriented Action Planning(GOAP、A*探索による目的分解)、ruflo-federationがmTLS連邦通信を担当する。プロジェクト規模に応じて段階的に追加できる。
CLIスタンドアロンで使いたい場合は次の通り。
curl -fsSL https://cdn.jsdelivr.net/gh/ruvnet/ruflo@main/scripts/install.sh | bash
npx ruflo@latest init --wizard
2. 27個のオーケストレーションフック
導入後、.claude/settings.jsonにrufloのフックが自動登録され、ユーザーのBash/Edit/Read等のツール呼び出しを透過的にインターセプトする。Anthropic公式のフック仕様(PreToolUse/PostToolUse/SubagentStop等)の上に、ルーティング・メモリ書き込み・トラジェクトリ学習などの27フックを実装している。
ユーザーから見れば「いつものClaude Code」のままだが、裏側では入力タスクが自動で分類され、適切なエージェントに振られ、結果がAgentDBに記録される。「/agentコマンドを叩いてサブエージェントを呼ぶ」という明示操作が不要になるのが体験上の最大の違いだ。
3. MCPサーバーとしての公開
Claude Code外(Cursor・VS Code・Codex CLI等)からrufloを呼びたい場合、MCPサーバーとして公開できる。
claude mcp add ruflo -- npx -y @claude-flow/cli@latest
これによりruflo自体が314個のMCPツールを露出し、別ホストのIDEからも同じスウォームを参照できるようになる。Claude Code=メイン操作席、ruflo=裏のオーケストレーター、他IDE=MCP越しのリモコンという3層構成が成立する。
アーキテクチャ図解:Router/Swarm/Memory/LLMの4層
rufloの内部はおおむね4層に分かれる。Mermaid図で全体像を整理する。
Hooks"] Router["Intelligent Router
(89% routing accuracy)"] subgraph Swarm["Swarm Layer"] Hierarchical["Hierarchical
トポロジー"] Mesh["Mesh
トポロジー"] Adaptive["Adaptive
トポロジー"] end Agents["100+ Specialized
Agents"] subgraph Memory["Memory Layer"] AgentDB["AgentDB
(HNSW索引)"] SONA["SONA Neural
Patterns"] ReasoningBank["Reasoning
Bank"] end AIDefence["AIDefence
(Prompt Injection防御)"] end subgraph Providers["LLM Providers"] Claude["Claude"] GPT["GPT"] Gemini["Gemini"] Ollama["Ollama / ruvLLM"] end subgraph Federation["Federation (任意)"] Other["別マシンの
rufloインスタンス"] end User --> ClaudeCode ClaudeCode --> Hooks Hooks --> Router Router --> Swarm Swarm --> Agents Agents --> Memory Agents --> AIDefence AIDefence --> Providers Memory -.学習ループ.-> Router Agents <-.mTLS+ed25519.-> Other
ポイントは右端に伸びる学習ループだ。タスクが完了するとReasoningBankに「成功した推論経路」が、SONAに「ニューラルパターン」として蓄積される。次回似た入力が来ると、Routerはこの履歴を参照して89%の精度でエージェントを選定する(プロジェクト計測値)。Sub-agentが毎回ゼロからルーティングを決めるのに対し、rufloはセッションを跨いで学習が積み上がる構造になっている。
Claude Code Sub-agentとrufloの使い分け
ここがruflo導入を検討するうえで最も誤解されやすい論点だ。Anthropic公式のSub-agent機能とrufloは「機能が重なるが目的が違う」関係にある。
機能比較表
| 観点 | Claude Code Sub-agent | ruflo Swarm |
|---|---|---|
| 構造 | 親→子の単方向ツリー | hierarchical / mesh / adaptive 切替 |
| ライフサイクル | セッション単位(消える) | AgentDBで永続化 |
| メモリ | なし(毎回ゼロから) | HNSW索引のベクトル検索+知識グラフ |
| ルーティング | 親が明示指定 | 自動(Router、87%精度) |
| トポロジー | 固定 | タスク種別で動的切替 |
| マルチプロバイダ | Claude固定 | Claude/GPT/Gemini/Ollama+failover |
| マルチマシン | 不可 | mTLS+ed25519連邦 |
| 導入コスト | ゼロ(公式機能) | プラグイン4種+設定 |
| 公式サポート | あり | サードパーティOSS |
判断フロー
を組みたい"] --> Q1{"1セッション内で
完結するか?"} Q1 -->|"はい"| Sub["Claude Code Sub-agent
で十分"] Q1 -->|"いいえ"| Q2{"過去の経験を
跨いで学習させたいか?"} Q2 -->|"いいえ"| Sub2["スクリプト+Sub-agent
のループで対応"] Q2 -->|"はい"| Q3{"複数マシン・
複数組織で
連携するか?"} Q3 -->|"いいえ"| Local["ruflo-core +
ruflo-swarm"] Q3 -->|"はい"| Full["ruflo-core +
ruflo-swarm +
ruflo-federation"]
実務では、まずSub-agentで2〜3週間運用してみて「同じ初期プロンプトを毎回書き直している」「Sub-agent同士が情報を共有できなくて困っている」と感じたタイミングが、rufloへ移行する判断基準になる。最初からrufloを入れると複雑度が跳ね上がるので、段階導入が鉄則だ。
他のマルチエージェントフレームワークとの比較
ruflo導入を検討するチームが現実に並べて評価するのは、LangGraph・CrewAI・AutoGen・OpenHandsあたりだろう。それぞれの設計思想と相性を整理する。
比較表:5つのアプローチ
| 観点 | ruflo | LangGraph | CrewAI | AutoGen | OpenHands |
|---|---|---|---|---|---|
| レイヤー | Claude Code拡張 | 低レベル状態機械 | 中レベル宣言 | 中レベルChatベース | 自律コーディング |
| 主要言語 | TypeScript+Rust | Python | Python | Python | Python+TypeScript |
| 学習曲線 | 低(プラグイン導入) | 急(グラフ自作) | 緩(YAML/Class) | 緩(会話定義) | 緩(CLI起動) |
| 永続メモリ | AgentDB(標準) | LangMem経由 | 別途実装 | 別途実装 | サンドボックス内 |
| Claude Code統合 | ネイティブ | なし | なし | なし | なし |
| マルチマシン | mTLS連邦 | 非対応 | 非対応 | 非対応 | 非対応 |
| OSSライセンス | MIT | MIT | MIT | CC-BY-4.0+MIT | MIT |
| 想定ユーザー | Claude Code利用者 | エージェント設計者 | チーム導入担当 | 研究者・PoC | コーディング自動化 |
棲み分けの判断軸
LangGraphは「状態遷移を完全に手で握りたい」場面で最強だ。ノード・エッジ・条件分岐を自分で書ききるので、決定論的な振る舞いが求められる金融・医療系で選ばれる。学習コストは高い。
CrewAIは「ロールベースで宣言的に書きたい」用途向け。Researcher・Writer・Reviewerのようなクラスを並べてCrewに束ねる構造で、ビジネス職にも理解しやすい。永続メモリはLong-term Memoryプラグインで補う必要がある。
AutoGenはMicrosoft Researchの会話駆動フレームワーク。エージェント同士をChat参加者として定義する独特のメンタルモデルで、研究プロトタイプには強いが本番運用には別途固める必要がある。
OpenHandsは「コーディングタスクの自動化」に振り切ったエージェント単体製品で、ruflo・LangGraph・CrewAIのような汎用フレームワークではない。/agent/openhands/の解説どおり、SWE-benchで実績があるのでruflo検討の比較対象として挙がる。
rufloは上記とは設計の出発点が違う。「Claude Codeのユーザー体験を壊さずに、必要なときだけ群知能を背後で起動する」というアプローチで、CLIを毎日使うエンジニア個人がボトムアップで導入できるのが特徴だ。/agent/cloudflare-ai-code-review-multi-agent-2026/で紹介したCloudflare流のサーバーレス・マルチエージェント設計とは方向性が逆で、手元のラップトップ起点で群知能を立ち上げる発想に近い。
実際のワークフロー:3つの典型ユースケース
公式READMEとUSERGUIDEから、現実に動かすときの代表的な使い方を3つ抜粋する。
ユースケース1:大規模リファクタリングの自動分業
# Claude Codeを開いた状態で
> このリポジトリをTypeScript 5.5 + ESM対応にリファクタしてほしい
裏側でrufloが起動するスウォームの動きはおおむね次の通り。
- Routerが「
refactor-large」タスクと分類 - Hierarchicalトポロジーで
coordinatorエージェントがscanner/migrator/tester/reviewerを呼び出し scannerがtsconfig・依存関係をAgentDBにインデックス化migratorが並列で各ディレクトリを書き換えtesterが変更ごとにvitestを回し、reviewerが差分をレビュー- 失敗パターンはReasoningBankに記録され、次回類似タスクで回避
ユーザーがやることは最初の1メッセージだけ。Sub-agentで同じことをやろうとすると、親エージェントに分業ロジックを書き込む必要がある。
ユースケース2:チーム横断の知識共有
ruflo-federationを有効にすると、別チームの別マシンで動いているrufloインスタンスとセキュアに知識を共有できる。たとえば「フロントエンドチームのAgentDBに溜まったReact 19のmigrationノウハウ」を「バックエンドチームのClaude Codeセッション」から検索できる。mTLS+ed25519で識別し、14種のPII検出パイプラインで個人情報を自動マスキングしてから送出する仕組みだ。
ユースケース3:CI/CDへの組み込み
GitHub Actionsから@claude-flow/cliをMCP越しに呼び、PR毎にセキュリティスキャン・テスト生成・ドキュメント更新を並列で走らせる構成が一般的。Anthropic公式のClaude Code Actionと組み合わせると、PRコメントに各エージェントの結果がスレッドで並ぶ。/explain/claude-code-complete-guide-2026/のCI連携セクションで触れた基本構成の上に、複数の専門エージェントを束ねるレイヤーとしてrufloが乗るイメージだ。
導入時の注意点と落とし穴
短期間で人気が爆発したOSSによくある通り、rufloも過剰宣伝と現実の隔たりに注意したい点がいくつかある。
README記載の「SWE-bench 84.8%」「APIコスト75%削減」「ベクトル検索150x〜12,500x高速化」はいずれもプロジェクト側の自社計測値だ。第三者再現はまだ十分とは言えないので、自分のリポジトリで小さく測ってから本格採用を判断するのが安全策。
Why: マルチエージェント系OSSは設定とワークロード次第でスコアが大きく変わるため、固有環境での再計測が事実上必須。
APIコスト「総額」は減っても、1タスクあたりの瞬間的なトークン消費は増えやすい。Hooksとメモリ参照で前提コンテキストを大量に積むためで、Claude APIのレートリミットに引っかかりやすくなる。
Why: 1リクエストで100K近いcontextを使うパスがあるため、Tier 2以下のAPIキーでは429が頻発する報告がある。
2026年4月のv3メジャーリリースでフック仕様・MCPツール名・AgentDBスキーマが変更された。v2系の設定は移行スクリプトを通す必要があり、独自プラグインを書いていた場合は要書き直し。
Why: 25万行のリビルドが入った直後で、外部プラグインAPIはまだ完全には安定していない。
まとめ:誰が今ruflоを入れるべきか
rufloは「Claude Codeを業務基盤として使い倒すチーム」にとって、Sub-agentの先にある自然な拡張先になりつつある。一方、個人の趣味プロジェクトや週数時間の利用ではオーバースペックなので、まずSub-agentで困りごとを言語化してから検討するのが正解だ。
今すぐ検討する価値があるのは次の3パターン:
- Claude Codeを毎日数時間使い、複数のリポを並行で扱っているソロエンジニア
- チームで同じClaude Code知識を再利用したいスタートアップ・SaaS開発組織
- 別マシン・別組織のエージェント連携が要件に入っているエンタープライズ
逆に「PoCをLangGraphで書く方が早い」「ロールベースで設計したいからCrewAIで十分」「自律コーディング単体で良い」というケースでは、わざわざrufloを足す必要はない。フレームワーク全体の比較はAIエージェントフレームワーク比較2026年版、コーディング特化エージェントの選定はOpenHands完全ガイド、Claude Code純正のマネージドエージェント機能はClaude Managed Agentsを参照してほしい。
「Claude Codeのままで、頭数だけ100倍にしたい」という欲張りな要求に最初に応えるOSS——それが2026年5月時点のrufloの位置づけだ。
参照ソース
- ruvnet/ruflo(GitHubリポジトリ)
- ruflo README
- ruflo USERGUIDE
- Claude Flow V3: A Complete Rebuild for Multi-Agent Orchestration(Issue #945)
- Multi-Agent Security Guide(ruflo公式)
- Anthropic Claude Code SDK公式ドキュメント
- Claude Flow (Ruflo) v3.5: Complete Guide to Multi-Agent Orchestration(Pasquale Pillitteri)
- Claude Flow (Ruflo)(Ry Walker Research)