この記事ではAIエージェントに特化して解説します。AIエージェント全般は AIエージェントフレームワーク比較2026年版 をご覧ください。

MemPalaceとは——AIの長期記憶問題を解決するOSS

AIエージェントの最大の弱点の一つは記憶の短さだ。会話が終わればコンテキストは消え、前回のセッションで学んだことも忘れる。

MemPalaceは、この問題を解決するオープンソースのAIメモリシステムだ。2026年4月6日に公開されて以来、わずか数日でGitHub 35,000+ starsに到達。LongMemEvalベンチマークで96.6%(ローカル無料ツール最高)を記録し、AIメモリの分野で大きな注目を集めている。

開発者はMilla Jovovich氏とBen Sigman氏。MIT Licenseで完全無料、ローカル実行でAPIコストゼロ。Claude CodeやCursorとMCP経由で統合できる。


5層の「宮殿」アーキテクチャ

MemPalaceの設計は、古典的な記憶術「Method of Loci(場所法)」をAIシステムに適用したものだ。2000年以上前から使われてきた「建築空間に記憶を配置する」技法を、5層のデータ構造として実装している。

graph TD W["Wings(翼)
人物・プロジェクト単位"] --> H["Halls(ホール)
記憶タイプ別
(事実・イベント・好み)"] H --> R["Rooms(部屋)
トピック単位"] R --> C["Closets(クローゼット)
圧縮サマリー"] R --> T["Tunnels(トンネル)
クロスリファレンス"] style W fill:#4A90D9,color:#fff style H fill:#5BA0E9,color:#fff style R fill:#6CB0F9,color:#fff style C fill:#E67E22,color:#fff style T fill:#50C878,color:#fff
役割
Wings 人物・プロジェクト単位で記憶を分離 「プロジェクトA」「ユーザーB」
Halls 記憶の種類で分類 事実、イベント、好み、決定事項
Rooms トピック単位で整理 「API設計」「デプロイ手順」
Closets 圧縮されたサマリー 長い会話の要約
Tunnels 異なるRoom間のクロスリファレンス 「API設計」↔「認証」の関連

この階層的フィルタリング(Wing → Hall → Room)により、フラットなベクトル検索と比較してリコール率が60.9%→94.8%に向上(+34%)する。


技術スタック:ChromaDB + SQLite + Sentence Transformers

MemPalaceのストレージは3層構成だ。

MemPalace ストレージ構成
├── ChromaDB          # ベクトル検索(セマンティック検索)
├── SQLite            # 時系列ナレッジグラフ(構造化データ)
└── ローカルファイル    # 逐語録(原文テキスト)

ベクトル化

ローカルのSentence Transformersモデル(約80MB)でテキストをベクトル化する。APIキー不要、外部通信なし。初回起動時にモデルをダウンロード(2-3分)すれば、以降はオフラインで動作する。

4段階の検索レイヤー

# MemPalaceの検索レイヤー(概念図)

class RetrievalLayers:
    L0 = "ウェイクアップコンテキスト"  # 170トークン、セッション開始時に自動ロード
    L1 = "アクティブメモリ"          # トピック検出でRoomから自動ロード
    L2 = "セマンティック検索"        # ChromaDBベクトル検索(明示的クエリ時)
    L3 = "深層検索"                # SQLiteナレッジグラフ+ベクトル検索の組み合わせ

# L0/L1: 170トークンのウェイクアップコンテキストでセッション開始
# → トピック検出で関連Roomを自動ロード
# → 明示的な質問でChromaDB全文検索

170トークンのウェイクアップコンテキストは、セッション開始時に自動的にロードされる最小限のメモリスナップショットだ。このわずか170トークンから、5層の宮殿構造を辿って全記憶にアクセスできる設計が、MemPalaceの核心的なイノベーションだ。


ベンチマーク:96.6%の真実と「100%」の教訓

LongMemEvalスコア比較

システム スコア 料金 ストレージ方式
MemPalace 96.6% 無料(ローカル) 逐語録+ベクトル
Mem0 ~85% $19-249/月 LLM抽出ファクト
Zep ~82% $25+/月 ハイブリッド

「100%」スコアの顛末

MemPalace公開直後、チームは「100%ハイブリッドスコア」を発表した。しかしコミュニティから「失敗したテスト問題に対して個別修正を行い、同じテストで再評価している——これは過学習だ」と指摘を受けた。チームはこの批判を受け入れ、ヘッドラインを96.6%のrawスコアに訂正した。

この顛末は、AIベンチマークの落とし穴を象徴している。96.6%自体は、ローカル実行の無料ツールとしては依然として公開されている中で最高スコアだ。


インストールとセットアップ

要件

  • Python 3.9+
  • chromadb >= 0.4.0
  • pyyaml >= 6.0
  • ストレージ: 初回モデルダウンロード~80MB

インストール手順

# pip でインストール
pip install mempalace

# 初期化(宮殿構造を作成)
mempalace init

# MCP接続設定
mempalace connect
# 初回起動時の出力例
$ mempalace init
Downloading Sentence Transformers model... (~80MB)
[██████████████████████████████] 100%
Creating palace structure...
Palace initialized at ~/.mempalace/
Wings: 0 | Halls: 0 | Rooms: 0
Ready.

$ mempalace connect
MCP server started on stdio
Available tools: 19

初回実行時にSentence Transformersモデル(約80MB)のダウンロードが発生する。以降はオフラインで動作し、APIコストは一切かからない。


MCP統合:Claude Code・Cursor等との連携

MemPalaceは19のMCPツールを公開しており、主要なAIコーディングツールと直接連携できる。

Claude Desktopの設定

// claude_desktop_config.json
{
  "mcpServers": {
    "mempalace": {
      "command": "mempalace",
      "args": ["connect"],
      "env": {}
    }
  }
}

主要なMCPツール

ツール 機能
store_memory 新しい記憶を保存
recall_memory セマンティック検索で記憶を検索
create_wing 新しいWing(人物・プロジェクト)を作成
list_rooms 特定Hallの全Roomを一覧表示
create_tunnel Room間のクロスリファレンスを作成
get_wakeup_context 170トークンのウェイクアップコンテキストを取得

対応AIツール

Claude Code、Claude Desktop、ChatGPT、Cursor、Ollamaなどのローカルモデルに対応。Python CLIからの直接アクセスも可能。


MemPalace vs Mem0 vs Zep:何が違うのか

観点 MemPalace Mem0 Zep
料金 無料(MIT License) $19-249/月 $25+/月
実行環境 完全ローカル クラウド クラウド
ストレージ方式 逐語録(要約損失なし) LLMで事実を抽出 ハイブリッド
ベンチマーク 96.6% ~85% ~82%
エンタープライズサポート なし あり(AWS提携) あり
資金調達 なし $24M 非公開
プロジェクト年齢 5日(4月時点) 2年以上 2年以上

MemPalaceの強みは、スコア・コスト・プライバシーのすべてで優位に立つこと。弱みは、プロジェクトが極めて若く、エンタープライズサポートや本番実績がないこと。

Mem0はAWSとの提携や$24Mの資金調達による安定性があり、大規模組織での採用では依然として有力な選択肢だ。AIエージェントのメモリ管理を設計する際は、要件に応じた使い分けが重要になる。


逐語録ストレージの設計思想

MemPalaceが他のメモリシステムと根本的に異なるのは、逐語録(verbatim)ストレージを採用している点だ。

Mem0はLLMで会話から「事実」を抽出して保存する。この方式はストレージ効率が良いが、LLMの要約過程で文脈やニュアンスが失われる。

MemPalaceは原文テキストをそのまま保存する。検索時にはベクトル検索で関連部分を取得し、必要に応じて圧縮サマリー(Closets)も参照する。原文が残っているため、情報の劣化が起きない

# Mem0のアプローチ(LLM抽出)
# "ユーザーはPythonが好きで、FastAPIをよく使う" → 事実として保存
# 元の文脈「先月のプロジェクトでFastAPIに移行した理由は...」は失われる

# MemPalaceのアプローチ(逐語録)
# 元の会話全体を保存 → 検索時にベクトル検索で関連部分を取得
# 文脈・ニュアンス・時系列が完全に保持される

ユースケースと注意点

効果的なユースケース

  • AIエージェントの永続記憶:セッション間で記憶を保持し、前回の会話の続きから再開
  • プロジェクト単位の記憶分離:Wingsでプロジェクト/クライアントごとに記憶を完全分離
  • プライバシー重視の環境:医療・金融・政府機関など、データを外部に送信できない環境

注意点

  • プロジェクトが極めて若い(2026年4月6日公開)。本番環境での採用は慎重に
  • コミュニティは活発だが、長期的なメンテナンス体制は未確定
  • ベンチマークスコアの「100%→96.6%訂正」事件が示すように、公開されている数値は批判的に検証すべき

参照ソース