cong-cu Trung cấp

Vector Database là gì?

Loại database chuyên lưu và tìm kiếm vector embedding nhanh, là nền tảng cho RAG và semantic search.

Cập nhật: 2 tháng 5, 2026 · 2 phút đọc

Vector Database là loại database được tối ưu để lưu và tìm kiếm hàng triệu vector embedding trong vài mili-giây.

Vì sao cần riêng một loại DB?

Database thường (PostgreSQL, MySQL) tìm theo điều kiện chính xác (WHERE name = 'X'). Vector DB tìm theo độ tương đồng (“vector nào giống nhất với vector này?”).

Nếu bạn có 10 triệu document đã embed, tìm vector gần nhất bằng vòng lặp brute force sẽ mất vài giây. Vector DB dùng các thuật toán ANN (Approximate Nearest Neighbor) như HNSW, IVF để giảm xuống vài ms — đánh đổi 1-2% độ chính xác.

Các vector database phổ biến (2026)

Cloud / managed

Tên	Nổi bật	Giá khởi điểm
Pinecone	Dễ dùng nhất, scale tốt	Free tier nhỏ, $70/tháng+
Weaviate Cloud	Open source + cloud	Free tier, $25+
Qdrant Cloud	Nhanh, Rust core	Free tier, $25+
Turbopuffer	Mới, rẻ, serverless	$0.10/GB/tháng

Self-host

Tên	Nổi bật
Qdrant	Nhanh, dễ deploy
Weaviate	Có GraphQL API
Milvus	Scale lớn, do Zilliz làm
Chroma	Nhẹ, hợp prototype
pgvector	Extension Postgres — không cần DB mới!

Khi nào KHÔNG cần Vector DB?

< 100k vector → dùng pgvector hoặc thậm chí lưu trong file
Search cần precision tuyệt đối → dùng brute force chậm nhưng đúng

Workflow điển hình với RAG

1. Ingest:  Tài liệu → chia chunk → embed → lưu vector DB
2. Query:   User hỏi → embed câu hỏi → query top-k chunks
3. Augment: Đưa chunks vào prompt → LLM trả lời

Lưu ý chọn

Latency quan trọng → chọn Qdrant, Turbopuffer
Đã dùng Postgres → pgvector, không cần DB thêm
Cần bộ lọc phức tạp (geo, time, tag) → Weaviate
Free tier rộng nhất hiện tại → Qdrant Cloud

Liên quan

Thẻ

#vector-db#embedding#rag