GBrain：Markdownで構築する個人AI知識管理システム、2983スターのセルフホスト型memex

garrytan/gbrain

🔌 MCP（Model Context Protocol） text-generation agents mcp ⭐ 2983

2026.04.11 1分更新 2026.04.13

GBrain：Markdownで構築する個人AI知識管理システム、2983スターのセルフホスト型memex - AIツール日本語解説 | AI Heartland

ノートツールの多くはデータをSaaSクラウドに預けるか、検索性が低い。GBrainはGitで管理されたMarkdownを唯一の真実とし、MCPを経由して任意のAIエージェントが読み書きできる。データの所有権を保ちながら複数エージェントと知識を共有できる設計が独自の価値を持つ。

この記事ではMCPに特化して解説します。MCP（Model Context Protocol）全般は MCPサーバーの作り方2026完全ガイドをご覧ください。

GBrain：個人向けAI知識管理システム

Vannevar Bushが1945年に提唱した「memex」— あらゆる個人知識を検索・参照できる機械 — を現代のMarkdownとAIエージェントで実装したプロジェクト。

GBrainは「人物、企業、メディア、アイデアをすべてGitで管理されたMarkdownに記録し、AIエージェントがそれを夜間自動で拡張・検索する」仕組みを提供する。GitHubで2,983スターを獲得し、マークダウンベースのシンプルな設計とスケーラブルなアーキテクチャの実効性が広く認識されている。

Markdownベースの知識体系化

GBrainの最大の特徴は「Gitで管理されたMarkdownファイルが知識の全て」という設計思想だ。人物・企業・メディア・アイデアを統一スキーマで記録し、ファイル単位の直感的な構造化を実現する。

実際の運用例（公式READMEより）：

カテゴリ	規模
人物プロファイル	3,000人以上
カレンダーデータ	13年分・21,000件以上
Apple Notes	5,800件以上
会議トランスクリプト	280件以上
独自アイデア	300件以上
メディアページ	500件以上（書籍・動画・記事）

設計の核心：「確定情報」と「追記タイムライン」の分離
ページ上部には検証済みの事実を配置し、下部には時系列記録を追記型で積み上げる。過去の判断背景を失わず、現在の理解も正確に保つ二層構造により、長期的な知識管理の耐久性を確保する。

ソーシャルグラフの検索と関係管理

3,000人規模のプロファイルから複雑なクエリに応答する。「PedroとDianaの両方を知っている人は誰か」「Series A以降に変わった点は何か」といった質問に、単純な集合演算とタイムライン差分で答える。

取材相手・投資家・パートナーの接触履歴と専門分野を記録することで、「この2人を紹介すべきか」という判断を既存データから導出できる仕組みになっている。

AIエージェントによる自動エンリッチメント

「ドリームサイクル」と呼ぶ夜間自動処理が、日中の会話をスキャンして知識ベースを自動拡張する。

OpenClaw や Hermes Agent との統合により、会話データ・メール・カレンダー・Apple Notesを自動入力できる。このサイクルは継続的な知識蓄積を生み出す：

会議・メール・ツイート・リンクが信号としてエージェントに検出される
エージェントが既存の関連情報を読み込んで文脈を把握する
応答後に新情報を書き込む
各サイクルで知識が複合される

MCP層を経由することで、エージェント側の実装依存性を排除する設計を採用している。

システムアーキテクチャ

flowchart TD subgraph 入力層 A["会話・メール・メモ
カレンダー・Apple Notes"] end subgraph 知識モデル層 B["Markdownファイル群
（Git管理・source of truth）"] C["人物 / 企業 / アイデア
統一スキーマ"] end subgraph 検索インターフェース層 D["~500件:
grep検索"] E["500〜10,000件:
Postgres + pgvector"] end subgraph エージェント統合層 F["MCP / CLI層"] G["OpenClaw
Hermes Agent
Claude等"] end A -->|マークダウン変換| B B --> C C -->|規模に応じて選択| D C -->|規模に応じて選択| E D --> F E --> F F --> G G -->|"ドリームサイクル
夜間自動処理"| B

知識モデル層はMarkdownで統一スキーマを保つ。検索インターフェース層は運用規模に応じて柔軟に選択可能。このレイヤー分離により、バックエンド技術の選択を後から変更できる。

スケーラビリティ戦略

段階的に成長させる設計
Gitリポジトリとエディタだけで500ファイルまで快適に運用できる。必要になってから検索基盤を強化するアプローチで、技術的な先行投資が不要。

フェーズ1：grep + Git（0〜500ファイル）

Markdownファイルとシンプルなテキスト検索で開始可能。Gitリポジトリとテキストエディタがあれば即座に立ち上げられる。

# シンプルな全文検索
grep -r "Pedro" ~/gbrain/people/

フェーズ2：Postgres + pgvector（500〜10,000ファイル）

-- セマンティック検索の例（pgvector）
SELECT file_path, content
FROM documents
ORDER BY embedding <-> query_embedding
LIMIT 10;

インクリメンタル更新により、ファイル単体の変更で全インデックスを走査しない効率化を実現する。

重要な設計原則： ファイルベース→Postgres移行時も、Markdownファイル群が唯一の真実（source of truth）であり続ける。DBはあくまで検索インデックスに過ぎない。

実装開始のステップ

公式リポジトリが提供するスキーマとスキルパックを参照する：

GBRAIN_RECOMMENDED_SCHEMA.md — 推奨ディレクトリ構造とMarkdownテンプレート
GBRAIN_SKILLPACK.md — 自動化スキルセット一覧

GBrainが最も価値を発揮するのは、知識集約的な業務（研究・ジャーナリズム・経営判断）や、多数の関係者を長期追跡する場面だ。

類似ツールとの比較

ツール	データ保管	AIエージェント連携	検索拡張	所有権
GBrain	ローカルGit	MCP対応（任意エージェント）	pgvector対応	完全自己所有
Obsidian	ローカルファイル	プラグイン依存	プラグイン	完全自己所有
Notion	クラウドSaaS	限定的	Notion AI	SaaS依存
Roam Research	クラウドSaaS	限定的	なし	SaaS依存