この記事ではAIエージェントに特化して解説します。AIエージェント全般は AIエージェントフレームワーク比較2026年版 をご覧ください。
MemPalaceとは——AIの長期記憶問題を解決するOSS
AIエージェントの最大の弱点の一つは記憶の短さだ。会話が終わればコンテキストは消え、前回のセッションで学んだことも忘れる。
MemPalaceは、この問題を解決するオープンソースのAIメモリシステムだ。2026年4月6日に公開されて以来、わずか数日でGitHub 35,000+ starsに到達。LongMemEvalベンチマークで96.6%(ローカル無料ツール最高)を記録し、AIメモリの分野で大きな注目を集めている。
開発者はMilla Jovovich氏とBen Sigman氏。MIT Licenseで完全無料、ローカル実行でAPIコストゼロ。Claude CodeやCursorとMCP経由で統合できる。
5層の「宮殿」アーキテクチャ
MemPalaceの設計は、古典的な記憶術「Method of Loci(場所法)」をAIシステムに適用したものだ。2000年以上前から使われてきた「建築空間に記憶を配置する」技法を、5層のデータ構造として実装している。
人物・プロジェクト単位"] --> H["Halls(ホール)
記憶タイプ別
(事実・イベント・好み)"] H --> R["Rooms(部屋)
トピック単位"] R --> C["Closets(クローゼット)
圧縮サマリー"] R --> T["Tunnels(トンネル)
クロスリファレンス"] style W fill:#4A90D9,color:#fff style H fill:#5BA0E9,color:#fff style R fill:#6CB0F9,color:#fff style C fill:#E67E22,color:#fff style T fill:#50C878,color:#fff
| 層 | 役割 | 例 |
|---|---|---|
| Wings | 人物・プロジェクト単位で記憶を分離 | 「プロジェクトA」「ユーザーB」 |
| Halls | 記憶の種類で分類 | 事実、イベント、好み、決定事項 |
| Rooms | トピック単位で整理 | 「API設計」「デプロイ手順」 |
| Closets | 圧縮されたサマリー | 長い会話の要約 |
| Tunnels | 異なるRoom間のクロスリファレンス | 「API設計」↔「認証」の関連 |
この階層的フィルタリング(Wing → Hall → Room)により、フラットなベクトル検索と比較してリコール率が60.9%→94.8%に向上(+34%)する。
技術スタック:ChromaDB + SQLite + Sentence Transformers
MemPalaceのストレージは3層構成だ。
MemPalace ストレージ構成
├── ChromaDB # ベクトル検索(セマンティック検索)
├── SQLite # 時系列ナレッジグラフ(構造化データ)
└── ローカルファイル # 逐語録(原文テキスト)
ベクトル化
ローカルのSentence Transformersモデル(約80MB)でテキストをベクトル化する。APIキー不要、外部通信なし。初回起動時にモデルをダウンロード(2-3分)すれば、以降はオフラインで動作する。
4段階の検索レイヤー
# MemPalaceの検索レイヤー(概念図)
class RetrievalLayers:
L0 = "ウェイクアップコンテキスト" # 170トークン、セッション開始時に自動ロード
L1 = "アクティブメモリ" # トピック検出でRoomから自動ロード
L2 = "セマンティック検索" # ChromaDBベクトル検索(明示的クエリ時)
L3 = "深層検索" # SQLiteナレッジグラフ+ベクトル検索の組み合わせ
# L0/L1: 170トークンのウェイクアップコンテキストでセッション開始
# → トピック検出で関連Roomを自動ロード
# → 明示的な質問でChromaDB全文検索
170トークンのウェイクアップコンテキストは、セッション開始時に自動的にロードされる最小限のメモリスナップショットだ。このわずか170トークンから、5層の宮殿構造を辿って全記憶にアクセスできる設計が、MemPalaceの核心的なイノベーションだ。
ベンチマーク:96.6%の真実と「100%」の教訓
LongMemEvalスコア比較
| システム | スコア | 料金 | ストレージ方式 |
|---|---|---|---|
| MemPalace | 96.6% | 無料(ローカル) | 逐語録+ベクトル |
| Mem0 | ~85% | $19-249/月 | LLM抽出ファクト |
| Zep | ~82% | $25+/月 | ハイブリッド |
「100%」スコアの顛末
MemPalace公開直後、チームは「100%ハイブリッドスコア」を発表した。しかしコミュニティから「失敗したテスト問題に対して個別修正を行い、同じテストで再評価している——これは過学習だ」と指摘を受けた。チームはこの批判を受け入れ、ヘッドラインを96.6%のrawスコアに訂正した。
この顛末は、AIベンチマークの落とし穴を象徴している。96.6%自体は、ローカル実行の無料ツールとしては依然として公開されている中で最高スコアだ。
インストールとセットアップ
要件
- Python 3.9+
- chromadb >= 0.4.0
- pyyaml >= 6.0
- ストレージ: 初回モデルダウンロード~80MB
インストール手順
# pip でインストール
pip install mempalace
# 初期化(宮殿構造を作成)
mempalace init
# MCP接続設定
mempalace connect
# 初回起動時の出力例
$ mempalace init
Downloading Sentence Transformers model... (~80MB)
[██████████████████████████████] 100%
Creating palace structure...
Palace initialized at ~/.mempalace/
Wings: 0 | Halls: 0 | Rooms: 0
Ready.
$ mempalace connect
MCP server started on stdio
Available tools: 19
初回実行時にSentence Transformersモデル(約80MB)のダウンロードが発生する。以降はオフラインで動作し、APIコストは一切かからない。
MCP統合:Claude Code・Cursor等との連携
MemPalaceは19のMCPツールを公開しており、主要なAIコーディングツールと直接連携できる。
Claude Desktopの設定
// claude_desktop_config.json
{
"mcpServers": {
"mempalace": {
"command": "mempalace",
"args": ["connect"],
"env": {}
}
}
}
主要なMCPツール
| ツール | 機能 |
|---|---|
store_memory |
新しい記憶を保存 |
recall_memory |
セマンティック検索で記憶を検索 |
create_wing |
新しいWing(人物・プロジェクト)を作成 |
list_rooms |
特定Hallの全Roomを一覧表示 |
create_tunnel |
Room間のクロスリファレンスを作成 |
get_wakeup_context |
170トークンのウェイクアップコンテキストを取得 |
対応AIツール
Claude Code、Claude Desktop、ChatGPT、Cursor、Ollamaなどのローカルモデルに対応。Python CLIからの直接アクセスも可能。
MemPalace vs Mem0 vs Zep:何が違うのか
| 観点 | MemPalace | Mem0 | Zep |
|---|---|---|---|
| 料金 | 無料(MIT License) | $19-249/月 | $25+/月 |
| 実行環境 | 完全ローカル | クラウド | クラウド |
| ストレージ方式 | 逐語録(要約損失なし) | LLMで事実を抽出 | ハイブリッド |
| ベンチマーク | 96.6% | ~85% | ~82% |
| エンタープライズサポート | なし | あり(AWS提携) | あり |
| 資金調達 | なし | $24M | 非公開 |
| プロジェクト年齢 | 5日(4月時点) | 2年以上 | 2年以上 |
MemPalaceの強みは、スコア・コスト・プライバシーのすべてで優位に立つこと。弱みは、プロジェクトが極めて若く、エンタープライズサポートや本番実績がないこと。
Mem0はAWSとの提携や$24Mの資金調達による安定性があり、大規模組織での採用では依然として有力な選択肢だ。AIエージェントのメモリ管理を設計する際は、要件に応じた使い分けが重要になる。
逐語録ストレージの設計思想
MemPalaceが他のメモリシステムと根本的に異なるのは、逐語録(verbatim)ストレージを採用している点だ。
Mem0はLLMで会話から「事実」を抽出して保存する。この方式はストレージ効率が良いが、LLMの要約過程で文脈やニュアンスが失われる。
MemPalaceは原文テキストをそのまま保存する。検索時にはベクトル検索で関連部分を取得し、必要に応じて圧縮サマリー(Closets)も参照する。原文が残っているため、情報の劣化が起きない。
# Mem0のアプローチ(LLM抽出)
# "ユーザーはPythonが好きで、FastAPIをよく使う" → 事実として保存
# 元の文脈「先月のプロジェクトでFastAPIに移行した理由は...」は失われる
# MemPalaceのアプローチ(逐語録)
# 元の会話全体を保存 → 検索時にベクトル検索で関連部分を取得
# 文脈・ニュアンス・時系列が完全に保持される
ユースケースと注意点
効果的なユースケース
- AIエージェントの永続記憶:セッション間で記憶を保持し、前回の会話の続きから再開
- プロジェクト単位の記憶分離:Wingsでプロジェクト/クライアントごとに記憶を完全分離
- プライバシー重視の環境:医療・金融・政府機関など、データを外部に送信できない環境
注意点
- プロジェクトが極めて若い(2026年4月6日公開)。本番環境での採用は慎重に
- コミュニティは活発だが、長期的なメンテナンス体制は未確定
- ベンチマークスコアの「100%→96.6%訂正」事件が示すように、公開されている数値は批判的に検証すべき