MemPalace完全解説：LongMemEvalスコア96.6%、170トークンで全記憶を呼び出すAIメモリシステム

milla-jovovich/mempalace

🤖 AIエージェント AIメモリオープンソース AIエージェントベクトルDB

2026.04.07 1分

MemPalace完全解説：LongMemEvalスコア96.6%、170トークンで全記憶を呼び出すAIメモリシステム - AIツール日本語解説 | AI Heartland

AIエージェントの長期記憶は未解決の課題。MemPalaceはLongMemEvalで96.6%（ローカル無料ツール最高）を達成し、5層の宮殿構造＋ChromaDB＋SQLiteで実装。170トークンのウェイクアップコンテキストから全記憶を呼び出せる設計が画期的。

この記事ではAIエージェントに特化して解説します。AIエージェント全般は AIエージェントフレームワーク比較2026年版をご覧ください。

MemPalaceとは——AIの長期記憶問題を解決するOSS

AIエージェントの最大の弱点の一つは記憶の短さだ。会話が終わればコンテキストは消え、前回のセッションで学んだことも忘れる。

MemPalaceは、この問題を解決するオープンソースのAIメモリシステムだ。2026年4月6日に公開されて以来、わずか数日でGitHub 35,000+ starsに到達。LongMemEvalベンチマークで96.6%（ローカル無料ツール最高）を記録し、AIメモリの分野で大きな注目を集めている。

開発者はMilla Jovovich氏とBen Sigman氏。MIT Licenseで完全無料、ローカル実行でAPIコストゼロ。Claude CodeやCursorとMCP経由で統合できる。

5層の「宮殿」アーキテクチャ

MemPalaceの設計は、古典的な記憶術「Method of Loci（場所法）」をAIシステムに適用したものだ。2000年以上前から使われてきた「建築空間に記憶を配置する」技法を、5層のデータ構造として実装している。

graph TD W["Wings（翼）
人物・プロジェクト単位"] --> H["Halls（ホール）
記憶タイプ別
（事実・イベント・好み）"] H --> R["Rooms（部屋）
トピック単位"] R --> C["Closets（クローゼット）
圧縮サマリー"] R --> T["Tunnels（トンネル）
クロスリファレンス"] style W fill:#4A90D9,color:#fff style H fill:#5BA0E9,color:#fff style R fill:#6CB0F9,color:#fff style C fill:#E67E22,color:#fff style T fill:#50C878,color:#fff

層	役割	例
Wings	人物・プロジェクト単位で記憶を分離	「プロジェクトA」「ユーザーB」
Halls	記憶の種類で分類	事実、イベント、好み、決定事項
Rooms	トピック単位で整理	「API設計」「デプロイ手順」
Closets	圧縮されたサマリー	長い会話の要約
Tunnels	異なるRoom間のクロスリファレンス	「API設計」↔「認証」の関連

この階層的フィルタリング（Wing → Hall → Room）により、フラットなベクトル検索と比較してリコール率が60.9%→94.8%に向上（+34%）する。

技術スタック：ChromaDB + SQLite + Sentence Transformers

MemPalaceのストレージは3層構成だ。

MemPalace ストレージ構成
├── ChromaDB          # ベクトル検索（セマンティック検索）
├── SQLite            # 時系列ナレッジグラフ（構造化データ）
└── ローカルファイル    # 逐語録（原文テキスト）

ベクトル化

ローカルのSentence Transformersモデル（約80MB）でテキストをベクトル化する。APIキー不要、外部通信なし。初回起動時にモデルをダウンロード（2-3分）すれば、以降はオフラインで動作する。

4段階の検索レイヤー

# MemPalaceの検索レイヤー（概念図）

class RetrievalLayers:
    L0 = "ウェイクアップコンテキスト"  # 170トークン、セッション開始時に自動ロード
    L1 = "アクティブメモリ"          # トピック検出でRoomから自動ロード
    L2 = "セマンティック検索"        # ChromaDBベクトル検索（明示的クエリ時）
    L3 = "深層検索"                # SQLiteナレッジグラフ＋ベクトル検索の組み合わせ

# L0/L1: 170トークンのウェイクアップコンテキストでセッション開始
# → トピック検出で関連Roomを自動ロード
# → 明示的な質問でChromaDB全文検索

170トークンのウェイクアップコンテキストは、セッション開始時に自動的にロードされる最小限のメモリスナップショットだ。このわずか170トークンから、5層の宮殿構造を辿って全記憶にアクセスできる設計が、MemPalaceの核心的なイノベーションだ。

ベンチマーク：96.6%の真実と「100%」の教訓

LongMemEvalスコア比較

システム	スコア	料金	ストレージ方式
MemPalace	96.6%	無料（ローカル）	逐語録＋ベクトル
Mem0	~85%	$19-249/月	LLM抽出ファクト
Zep	~82%	$25+/月	ハイブリッド

「100%」スコアの顛末

MemPalace公開直後、チームは「100%ハイブリッドスコア」を発表した。しかしコミュニティから「失敗したテスト問題に対して個別修正を行い、同じテストで再評価している——これは過学習だ」と指摘を受けた。チームはこの批判を受け入れ、ヘッドラインを96.6%のrawスコアに訂正した。

この顛末は、AIベンチマークの落とし穴を象徴している。96.6%自体は、ローカル実行の無料ツールとしては依然として公開されている中で最高スコアだ。

インストールとセットアップ

要件

Python 3.9+
chromadb >= 0.4.0
pyyaml >= 6.0
ストレージ: 初回モデルダウンロード~80MB

インストール手順

# pip でインストール
pip install mempalace

# 初期化（宮殿構造を作成）
mempalace init

# MCP接続設定
mempalace connect

# 初回起動時の出力例
$ mempalace init
Downloading Sentence Transformers model... (~80MB)
[██████████████████████████████] 100%
Creating palace structure...
Palace initialized at ~/.mempalace/
Wings: 0 | Halls: 0 | Rooms: 0
Ready.

$ mempalace connect
MCP server started on stdio
Available tools: 19

初回実行時にSentence Transformersモデル（約80MB）のダウンロードが発生する。以降はオフラインで動作し、APIコストは一切かからない。

MCP統合：Claude Code・Cursor等との連携

MemPalaceは19のMCPツールを公開しており、主要なAIコーディングツールと直接連携できる。

Claude Desktopの設定

// claude_desktop_config.json
{
  "mcpServers": {
    "mempalace": {
      "command": "mempalace",
      "args": ["connect"],
      "env": {}
    }
  }
}

主要なMCPツール

ツール	機能
`store_memory`	新しい記憶を保存
`recall_memory`	セマンティック検索で記憶を検索
`create_wing`	新しいWing（人物・プロジェクト）を作成
`list_rooms`	特定Hallの全Roomを一覧表示
`create_tunnel`	Room間のクロスリファレンスを作成
`get_wakeup_context`	170トークンのウェイクアップコンテキストを取得

対応AIツール

Claude Code、Claude Desktop、ChatGPT、Cursor、Ollamaなどのローカルモデルに対応。Python CLIからの直接アクセスも可能。

MemPalace vs Mem0 vs Zep：何が違うのか

観点	MemPalace	Mem0	Zep
料金	無料（MIT License）	$19-249/月	$25+/月
実行環境	完全ローカル	クラウド	クラウド
ストレージ方式	逐語録（要約損失なし）	LLMで事実を抽出	ハイブリッド
ベンチマーク	96.6%	~85%	~82%
エンタープライズサポート	なし	あり（AWS提携）	あり
資金調達	なし	$24M	非公開
プロジェクト年齢	5日（4月時点）	2年以上	2年以上

MemPalaceの強みは、スコア・コスト・プライバシーのすべてで優位に立つこと。弱みは、プロジェクトが極めて若く、エンタープライズサポートや本番実績がないこと。

Mem0はAWSとの提携や$24Mの資金調達による安定性があり、大規模組織での採用では依然として有力な選択肢だ。AIエージェントのメモリ管理を設計する際は、要件に応じた使い分けが重要になる。

逐語録ストレージの設計思想

MemPalaceが他のメモリシステムと根本的に異なるのは、逐語録（verbatim）ストレージを採用している点だ。

Mem0はLLMで会話から「事実」を抽出して保存する。この方式はストレージ効率が良いが、LLMの要約過程で文脈やニュアンスが失われる。

MemPalaceは原文テキストをそのまま保存する。検索時にはベクトル検索で関連部分を取得し、必要に応じて圧縮サマリー（Closets）も参照する。原文が残っているため、情報の劣化が起きない。

# Mem0のアプローチ（LLM抽出）
# "ユーザーはPythonが好きで、FastAPIをよく使う" → 事実として保存
# 元の文脈「先月のプロジェクトでFastAPIに移行した理由は...」は失われる

# MemPalaceのアプローチ（逐語録）
# 元の会話全体を保存 → 検索時にベクトル検索で関連部分を取得
# 文脈・ニュアンス・時系列が完全に保持される