用語集一覧AI・開発
ベクターデータベース
読み方:ベクターデータベース
テキストや画像などをベクター(数値の配列)に変換して格納・検索できるデータベース。類似度検索(セマンティック検索)に特化しており、RAGシステムやAI検索機能の構築に不可欠。Pinecone・Chroma・Weaviateが代表例。
ベクターデータベースとは
ベクターデータベースは、データを高次元の数値ベクター(Embedding)として格納し、意味的な類似性に基づいて検索できるデータベースです。
従来のDBとの違い
| 比較軸 | RDB(MySQL等) | ベクターDB |
|--------|---------------|-----------|
| 検索方式 | 完全一致・部分一致 | 意味的類似度 |
| データ形式 | 構造化データ | 高次元ベクター |
| 主な用途 | トランザクション処理 | 類似検索・AI検索 |
動作の仕組み
1. テキストをEmbeddingモデルでベクター化(例:[0.1, -0.3, 0.8, ...])
2. ベクターDBに格納
3. クエリをベクター化し、類似ベクターを近傍探索(ANN)で高速検索
主なベクターDB
- • Pinecone:マネージドサービス、本番環境向け
- • Chroma:OSSでローカル構築容易
- • Weaviate:ハイブリッド検索(ベクター+キーワード)対応