PostgreSQLデータベースに対して、スキーマ変更を最小限に抑えながらベクトル検索機能を追加できるツール「Pgsemantic」がGitHubで公開された。既存のデータベース構造を活かしたまま、セマンティック検索の実装を目指すプロジェクトである。
Pgsemantic の基本的な仕組みは、ユーザーがPostgres接続情報を指定すると、ツールが自動的にテーブル構造を解析し、テキスト列を検出。その後、埋め込みモデルを用いてセマンティック・ベクトルに変換し、インデックスを構築するというもの。クエリ時にはテキストを同一モデルで埋め込み、距離計算で関連度の高い行を返す。既存のテーブルやカラムへの直接的な変更を避け、実装される設計を目指している。
# 利用イメージ
pgsemantic --db postgres://user:pass@localhost/mydb --table documents --column content
GitHubリポジトリ(github.com/varmabudharaju/pgsemantic)からクローン後、READMEに従いPython環境にインストール。PostgreSQL接続情報を指定してコマンドを実行することで、ベクトル検索インデックスが生成される。SQLクエリで活用開始可能。
この記事はAI業界の最新動向を速報でお届けする「AI Heartland ニュース」です。