ベクトルデータベース比較2026｜Qdrant・Milvus・pgvectorをRAG用途で選ぶ完全ガイド

Vector Database Comparison 2026: Choosing Qdrant, Milvus, or pgvector for RAG

🔍 RAG & ナレッジシステム rag ベクトルデータベース vector-database qdrant milvus pgvector weaviate chroma RAG構築 embedding

2026.06.07 1分更新 2026.06.07

ベクトルデータベース比較2026｜Qdrant・Milvus・pgvectorをRAG用途で選ぶ完全ガイド - AIツール日本語解説 | AI Heartland

RAG構築で最初に詰まる「どのベクトルDBを使うか」を、Qdrant・Milvus・pgvectorなど主要5本のランキングと選定フローで整理。導入フェーズと規模から最短で答えを出せるようにする。

RAGを作るとき、ほとんどのチームが最初に詰まるのが「どのベクトルデータベースを使うか」だ。Qdrant、Milvus、Weaviate、Chroma、そしてPostgreSQL拡張のpgvector——選択肢は多いが、判断軸は実はそれほど多くない。

この記事は、主要5本をRAG用途のランキング形式で評価し、性能・ライセンス・運用コストの違いと選び方を2026年最新版で整理する。各製品の公式リポジトリと公開ベンチマークを一次情報とした。

Postgresを使っているなら、まず pgvector。新しいインフラを増やさずベクトル検索を足せる
専用DBが必要なら Qdrant が基準。オープンソース最速で、開発から本番まで素直に伸びる
10億件超の超大規模だけ Milvus。Chromaはプロト用、Weaviateは埋め込み内蔵が欲しいとき

RAGそのものの仕組みと実装手順は LightRAG入門ガイドもあわせてご覧ください。

ベクトルデータベースの選び方：まず3タイプに分ける

ベクトルデータベースは「有名だから」で選ぶと運用で詰まる。出発点は、自分の導入フェーズと規模を3タイプのどれに当てはめるかだ。

・既存DB拡張型（pgvector） … すでにあるPostgreSQLにベクトル型を足す。導入ハードルが最も低く、数十万〜数百万件規模なら実用十分
・専用型（Qdrant / Weaviate / Milvus） … ベクトル検索のために設計されたDB。数千万件以上、ミリ秒レイテンシが必要ならこちら
・軽量・組み込み型（Chroma） … プロトタイピングやローカル検証向け。本番大規模には向かない

この分岐をフローにすると次のようになる。

flowchart TD A[ベクトルDBを選ぶ] --> B{既にPostgresを
運用している?} B -->|Yes| C{規模は
1000万件未満?} C -->|Yes| D[pgvector
で開始] C -->|No| E{10億件を
超える?} B -->|No| E E -->|Yes| F[Milvus] E -->|No| G[Qdrant
が基準] G --> H{埋め込み生成も
内蔵したい?} H -->|Yes| I[Weaviate
も候補] H -->|No| G

RAG用ベクトルデータベースランキング2026

主要5本を「RAG実装での総合的な扱いやすさ」で順位付けした。スコアは性能・運用コスト・エコシステム・導入の容易さを編集部で総合評価したもの（10点満点）。用途によって最適解は変わるため、各製品の寸評を必ず読んでほしい。

Qdrant

⭐ 約21kRustApache-2.0Hybrid検索◎

オープンソース最速クラス。p99レイテンシは10M件で約12msと、Weaviate(~16ms)・Milvus(~18ms)を上回る。ペイロードフィルタとクエリAPIが強力で、開発から本番までスケールが素直。迷ったらこれ。

9.0/10

pgvector

⭐ 約13kCPostgreSQL License導入最易

PostgreSQL拡張。既存DBにベクトル型を足すだけで始められ、SQLやバックアップ運用をそのまま流用できる。v0.9でIVFFlat改善・スパースベクトル対応。Postgresを使っているなら最初の選択肢。

8.6/10

Milvus

⭐ 約31kGo / C++Apache-2.0超大規模◎

10億ベクトル超の大規模展開に最適解。GPUアクセラレーション検索に対応し、マネージドのZilliz Cloudも選べる。小〜中規模にはオーバースペックで、運用の複雑さがそのままコストになる。

8.4/10

Weaviate

⭐ 約12kGoBSD-3埋め込み内蔵

埋め込み生成モジュールを内蔵し、生テキストを入れるとベクトル化まで自動で行う。ハイブリッド検索もネイティブ対応。埋め込みパイプラインを自前で持ちたくないチームに刺さる。

8.1/10

Chroma

⭐ 約16kPythonApache-2.0プロト向け

`pip install` ですぐ動き、LangChain/LlamaIndexとの相性が抜群。アイデア検証やローカルデモには最高だが、大規模本番では専用DBへの移行が前提になる。

7.5/10

スコアはあくまで「RAG実装の総合的な扱いやすさ」の指標だ。1000万件未満でPostgres運用中なら、ランキング1位のQdrantより2位のpgvectorのほうが正解になる。順位ではなく自分の条件に当てはめて読むのがコツ。

スペック比較表：性能・ライセンス・適性が一目で分かる

ランキングの根拠を表で並べる。レイテンシは10M件規模の公開ベンチマーク（p99）の概数。

製品	言語	ライセンス	p99(10M)	ハイブリッド検索	向いている規模
Qdrant	Rust	Apache-2.0	約12ms	◎ ネイティブ	数万〜数億
pgvector	C	PostgreSQL	規模依存	△ 全文検索と併用	〜数百万
Milvus	Go/C++	Apache-2.0	約18ms	◎ ネイティブ	数千万〜10億+
Weaviate	Go	BSD-3	約16ms	◎ ネイティブ	数十万〜数億
Chroma	Python	Apache-2.0	—	△	〜数十万（検証）

⭐ Star数は概数（2026年6月時点）。最新値は各リポジトリを参照。レイテンシは構成・ハードウェアで変動する。

Qdrantを5分で動かす：最短クイックスタート

「迷ったらQdrant」を実際に確かめる。Dockerで起動し、Pythonからベクトルを投入して検索するまでを最短手順で示す。

Dockerで起動公式イメージを docker run するだけ。6333番でREST/gRPCが立ち上がる。
クライアントを導入pip install qdrant-client。Python以外にもRust/Go/TS公式クライアントがある。
コレクション作成＋投入ベクトル次元と距離関数（Cosine等）を指定してupsert。
類似検索クエリベクトルでtop-kを取得。これがRAGの「検索」部分になる。

まずDockerで起動する。

docker run -p 6333:6333 -p 6334:6334 \
  -v $(pwd)/qdrant_storage:/qdrant/storage \
  qdrant/qdrant

起動とヘルスチェックの実際の出力はこうなる。

docker run -p 6333:6333 qdrant/qdrant
           _                 _    
  __ _  __| |_ __ __ _ _ __ | |_  
 / _` |/ _` | '__/ _` | '_ \| __| 
INFO  Qdrant gRPC listening on 6334
INFO  Qdrant HTTP listening on 6333
INFO  Actix runtime found; starting in Actix runtime

curl -s localhost:6333/healthz
healthz check passed

続いてPythonからコレクションを作り、ベクトルを投入して検索する。

from qdrant_client import QdrantClient
from qdrant_client.models import Distance, VectorParams, PointStruct

client = QdrantClient(url="http://localhost:6333")

# コレクション作成（埋め込み次元=384, コサイン類似度）
client.recreate_collection(
    collection_name="docs",
    vectors_config=VectorParams(size=384, distance=Distance.COSINE),
)

# ベクトル投入（実際は埋め込みモデルの出力を入れる）
client.upsert(
    collection_name="docs",
    points=[
        PointStruct(id=1, vector=[0.12, 0.03, ...], payload={"text": "RAGとは"}),
        PointStruct(id=2, vector=[0.08, 0.11, ...], payload={"text": "ベクトル検索"}),
    ],
)

# 類似検索（RAGの「検索」フェーズ）
hits = client.query_points(
    collection_name="docs",
    query=[0.10, 0.05, ...],
    limit=3,
).points
for h in hits:
    print(h.score, h.payload["text"])

参考までに、pgvectorで同じことをやる場合はSQLだけで完結する。

-- 拡張を有効化してテーブルにベクトル列を足す
CREATE EXTENSION IF NOT EXISTS vector;
CREATE TABLE docs (id bigserial PRIMARY KEY, text text, embedding vector(384));

-- 類似検索（<=> はコサイン距離演算子）
SELECT text, 1 - (embedding <=> '[0.10,0.05, ...]') AS score
FROM docs
ORDER BY embedding <=> '[0.10,0.05, ...]'
LIMIT 3;

この「専用クライアントを覚えるか、SQLで済ませるか」の差が、Qdrantとpgvectorの体験差そのものだ。

本番投入で詰まりやすい3つの落とし穴（クリックで展開）

1. インデックス未設定で遅い：投入直後はフルスキャンになりがち。Qdrantはセグメント最適化、pgvectorはHNSW/IVFFlatインデックスの作成を忘れずに。

2. 埋め込み次元の不一致：コレクション作成時の次元と、埋め込みモデルの出力次元がズレると投入時にエラー。モデルを変えたら作り直す。

3. 距離関数の選び間違い：多くの埋め込みモデルはコサイン類似度前提。L2やドット積を選ぶと検索品質が落ちる。モデルのドキュメントに従う。

マネージドかセルフホストか：運用コストで決める

性能が拮抗してくると、最後の決め手は運用体制になる。

・少人数・インフラ専任なし … マネージド（Qdrant Cloud / Zilliz Cloud / Pinecone）で運用負荷を外す。月額は乗るが、人件費とダウンタイムリスクを考えれば総コストは下がりやすい
・データ主権・コスト最適化が重要で運用リソースあり … Apache-2.0のQdrant・Milvusをセルフホスト。クラウド費用を自分でコントロールできる
・既にマネージドPostgres（Aurora / Azure）を使っている … pgvectorをそのまま乗せる。可用性・バックアップは既存の仕組みに乗る

RAGのデータ量は運用しながら増える。最初に「移行できる構成」を選んでおくことが、3か月後の自分を救う。Chromaで検証 → Qdrantで本番、pgvectorで開始 → 限界が来たら専用DB、といった移行パスを最初から想定しておきたい。

結論：判断軸は「Postgres運用の有無」と「規模」の2つだけ

・Postgresを使っている & 1000万件未満 → pgvectorで始める
・専用DBが必要 → オープンソース最速のQdrantが基準
・10億件超の超大規模 → Milvus、埋め込み内蔵が欲しい → Weaviate
・アイデア検証 → Chromaで素早く、本番は専用DBへ移行

ベクトルDBが決まったら、次はRAGパイプライン本体だ。データ取り込みから検索・生成までの作り方は、フレームワーク別に LangChain解説や RAGFlow で深掘りしている。エージェントの長期記憶としてベクトル検索を使う設計に踏み込むなら、AIエージェントフレームワーク比較も参考になる。

参照ソース

・Qdrant 公式リポジトリ（qdrant/qdrant） — Rust製ベクトル検索エンジンの一次情報
・pgvector 公式リポジトリ（pgvector/pgvector） — PostgreSQL拡張の仕様・v0.9変更点
・Vector Database Benchmarks 2026（CallSphere） — p99レイテンシ等の公開ベンチマーク
・Best Vector Databases in 2026（Firecrawl） — 主要製品の特性・選定指針

あわせて読みたい

LangChainの使い方｜日本語入門 — LLMエージェント・RAG・チェーン構築をPythonで実践

text-generationrag 2026.03.25

RAGFlow｜エンタープライズRAGエンジンの導入と使い方 — DeepDoc・ナレッジベース構築

ragmcp 2026.03.25

LightRAG｜知識グラフ×デュアルレベル検索でRAGの精度と網羅性を高める仕組み

ragナレッジグラフ 2026.04.17

よくある質問

結局どれを選べばいい？

判断軸は2つだけだ。すでにPostgreSQLを運用しているなら、まずpgvectorで始めるのが正解。新しいインフラを増やさずにベクトル検索を足せる。Postgresを使っておらず、数千万件以上やミリ秒単位のレイテンシが必要なら、オープンソース最速のQdrantが基準になる。10億件を超える超大規模だけMilvusを検討する。Chromaは本番ではなくプロトタイピング用、Weaviateは埋め込み生成を内蔵したい場合に向く。詳細は本文「## RAG用ベクトルデータベースランキング2026」を参照。

pgvectorは専用DBに比べて遅い？

規模次第だ。数十万〜数百万件であればpgvectorで十分実用的な速度が出る。2026年初頭のv0.9でIVFFlatの改善・スパースベクトル対応・速度向上が入り、中規模までの実用性はさらに上がった。一方で数千万件を超えると、専用設計のQdrantやMilvusのほうがp99レイテンシで明確に優位になる。最初はpgvectorで始め、性能要件が満たせなくなった時点で専用DBへ移すのが現実的な移行パスだ。

マネージドとセルフホストどちらがいい？

運用体制で決まる。インフラ専任がいない少人数チームなら、マネージド（Qdrant Cloud・Zilliz Cloud・Pineconeなど）で運用負荷を外したほうが総コストは下がりやすい。一方、データ主権やコスト最適化が重要で運用リソースがあるなら、Apache-2.0のQdrant・Milvusをセルフホストする選択が効く。pgvectorはAurora PostgreSQLやAzure Database for PostgreSQL上でも動くので、既存のマネージドPostgresにそのまま乗せられる。

ハイブリッド検索（キーワード+ベクトル）はどれが対応している？

Qdrant・Weaviate・Milvusはハイブリッド検索をネイティブにサポートしている。RAGの精度はベクトル類似度だけでなくキーワード一致も併用したほうが上がる場面が多いため、検索品質を重視するならこの3つが候補になる。pgvectorもPostgreSQLの全文検索と組み合わせればハイブリッド構成を作れるが、スコア統合は自前実装が必要になる。

🔍

RAG & ナレッジシステム

RAGの仕組み、構築方法、ベクトルデータベース比較 →