この記事ではMCPに特化して解説します。MCP(Model Context Protocol)全般は MCPサーバーの作り方2026完全ガイド をご覧ください。

GBrain:個人向けAI知識管理システム

Vannevar Bushが1945年に提唱した「memex」— あらゆる個人知識を検索・参照できる機械 — を現代のMarkdownとAIエージェントで実装したプロジェクト。

GBrainは「人物、企業、メディア、アイデアをすべてGitで管理されたMarkdownに記録し、AIエージェントがそれを夜間自動で拡張・検索する」仕組みを提供する。GitHubで2,983スターを獲得し、マークダウンベースのシンプルな設計とスケーラブルなアーキテクチャの実効性が広く認識されている。

Markdownベースの知識体系化

GBrainの最大の特徴は「Gitで管理されたMarkdownファイルが知識の全て」という設計思想だ。人物・企業・メディア・アイデアを統一スキーマで記録し、ファイル単位の直感的な構造化を実現する。

実際の運用例(公式READMEより):

カテゴリ 規模
人物プロファイル 3,000人以上
カレンダーデータ 13年分・21,000件以上
Apple Notes 5,800件以上
会議トランスクリプト 280件以上
独自アイデア 300件以上
メディアページ 500件以上(書籍・動画・記事)
設計の核心:「確定情報」と「追記タイムライン」の分離
ページ上部には検証済みの事実を配置し、下部には時系列記録を追記型で積み上げる。過去の判断背景を失わず、現在の理解も正確に保つ二層構造により、長期的な知識管理の耐久性を確保する。

ソーシャルグラフの検索と関係管理

3,000人規模のプロファイルから複雑なクエリに応答する。「PedroとDianaの両方を知っている人は誰か」「Series A以降に変わった点は何か」といった質問に、単純な集合演算とタイムライン差分で答える。

取材相手・投資家・パートナーの接触履歴と専門分野を記録することで、「この2人を紹介すべきか」という判断を既存データから導出できる仕組みになっている。

AIエージェントによる自動エンリッチメント

「ドリームサイクル」と呼ぶ夜間自動処理が、日中の会話をスキャンして知識ベースを自動拡張する。

OpenClaw や Hermes Agent との統合により、会話データ・メール・カレンダー・Apple Notesを自動入力できる。このサイクルは継続的な知識蓄積を生み出す:

  1. 会議・メール・ツイート・リンクが信号としてエージェントに検出される
  2. エージェントが既存の関連情報を読み込んで文脈を把握する
  3. 応答後に新情報を書き込む
  4. 各サイクルで知識が複合される

MCP層を経由することで、エージェント側の実装依存性を排除する設計を採用している。

システムアーキテクチャ

flowchart TD subgraph 入力層 A["会話・メール・メモ
カレンダー・Apple Notes"] end subgraph 知識モデル層 B["Markdownファイル群
(Git管理・source of truth)"] C["人物 / 企業 / アイデア
統一スキーマ"] end subgraph 検索インターフェース層 D["~500件:
grep検索"] E["500〜10,000件:
Postgres + pgvector"] end subgraph エージェント統合層 F["MCP / CLI層"] G["OpenClaw
Hermes Agent
Claude等"] end A -->|マークダウン変換| B B --> C C -->|規模に応じて選択| D C -->|規模に応じて選択| E D --> F E --> F F --> G G -->|"ドリームサイクル
夜間自動処理"| B

知識モデル層はMarkdownで統一スキーマを保つ。検索インターフェース層は運用規模に応じて柔軟に選択可能。このレイヤー分離により、バックエンド技術の選択を後から変更できる。

スケーラビリティ戦略

段階的に成長させる設計
Gitリポジトリとエディタだけで500ファイルまで快適に運用できる。必要になってから検索基盤を強化するアプローチで、技術的な先行投資が不要。

フェーズ1:grep + Git(0〜500ファイル)

Markdownファイルとシンプルなテキスト検索で開始可能。Gitリポジトリとテキストエディタがあれば即座に立ち上げられる。

# シンプルな全文検索
grep -r "Pedro" ~/gbrain/people/

フェーズ2:Postgres + pgvector(500〜10,000ファイル)

-- セマンティック検索の例(pgvector)
SELECT file_path, content
FROM documents
ORDER BY embedding <-> query_embedding
LIMIT 10;

インクリメンタル更新により、ファイル単体の変更で全インデックスを走査しない効率化を実現する。

重要な設計原則: ファイルベース→Postgres移行時も、Markdownファイル群が唯一の真実(source of truth)であり続ける。DBはあくまで検索インデックスに過ぎない。

実装開始のステップ

公式リポジトリが提供するスキーマとスキルパックを参照する:

GBrainが最も価値を発揮するのは、知識集約的な業務(研究・ジャーナリズム・経営判断)や、多数の関係者を長期追跡する場面だ。

類似ツールとの比較

ツール データ保管 AIエージェント連携 検索拡張 所有権
GBrain ローカルGit MCP対応(任意エージェント) pgvector対応 完全自己所有
Obsidian ローカルファイル プラグイン依存 プラグイン 完全自己所有
Notion クラウドSaaS 限定的 Notion AI SaaS依存
Roam Research クラウドSaaS 限定的 なし SaaS依存
MCPを使った他ツールとの統合
GBrainのMCP層は、Claude Code・OpenClawなど任意のMCP対応エージェントと接続できる。xMCP 等のMCP管理ツールと組み合わせることで、エージェントごとにGBrainへのアクセス権限を細かく制御できる。

まとめ

GBrainはMarkdown + Git + MCPという成熟した技術スタックを組み合わせ、個人知識管理にAIエージェントを統合する実用的なアプローチを示している。

データの完全な自己所有を維持しながら、複数のAIエージェントと知識を共有・自動拡張できる設計は、SaaS依存を避けたいパワーユーザーや研究者に特に適している。Gitリポジトリさえあれば今日から始められる低い参入障壁も魅力だ。

参照ソース