cong-cu Trung cấp
Vector Database là gì?
Loại database chuyên lưu và tìm kiếm vector embedding nhanh, là nền tảng cho RAG và semantic search.
Cập nhật: 2 tháng 5, 2026 · 2 phút đọc
Vector Database là loại database được tối ưu để lưu và tìm kiếm hàng triệu vector embedding trong vài mili-giây.
Vì sao cần riêng một loại DB?
Database thường (PostgreSQL, MySQL) tìm theo điều kiện chính xác (WHERE name = 'X'). Vector DB tìm theo độ tương đồng (“vector nào giống nhất với vector này?”).
Nếu bạn có 10 triệu document đã embed, tìm vector gần nhất bằng vòng lặp brute force sẽ mất vài giây. Vector DB dùng các thuật toán ANN (Approximate Nearest Neighbor) như HNSW, IVF để giảm xuống vài ms — đánh đổi 1-2% độ chính xác.
Các vector database phổ biến (2026)
Cloud / managed
| Tên | Nổi bật | Giá khởi điểm |
|---|---|---|
| Pinecone | Dễ dùng nhất, scale tốt | Free tier nhỏ, $70/tháng+ |
| Weaviate Cloud | Open source + cloud | Free tier, $25+ |
| Qdrant Cloud | Nhanh, Rust core | Free tier, $25+ |
| Turbopuffer | Mới, rẻ, serverless | $0.10/GB/tháng |
Self-host
| Tên | Nổi bật |
|---|---|
| Qdrant | Nhanh, dễ deploy |
| Weaviate | Có GraphQL API |
| Milvus | Scale lớn, do Zilliz làm |
| Chroma | Nhẹ, hợp prototype |
| pgvector | Extension Postgres — không cần DB mới! |
Khi nào KHÔNG cần Vector DB?
- < 100k vector → dùng pgvector hoặc thậm chí lưu trong file
- Search cần precision tuyệt đối → dùng brute force chậm nhưng đúng
Workflow điển hình với RAG
1. Ingest: Tài liệu → chia chunk → embed → lưu vector DB
2. Query: User hỏi → embed câu hỏi → query top-k chunks
3. Augment: Đưa chunks vào prompt → LLM trả lời
Lưu ý chọn
- Latency quan trọng → chọn Qdrant, Turbopuffer
- Đã dùng Postgres → pgvector, không cần DB thêm
- Cần bộ lọc phức tạp (geo, time, tag) → Weaviate
- Free tier rộng nhất hiện tại → Qdrant Cloud
Liên quan
Thẻ
#vector-db#embedding#rag