Sổ Tay AI
cong-cu Trung cấp

Vector Database là gì?

Loại database chuyên lưu và tìm kiếm vector embedding nhanh, là nền tảng cho RAG và semantic search.

Cập nhật: 2 tháng 5, 2026 · 2 phút đọc

Vector Database là loại database được tối ưu để lưu và tìm kiếm hàng triệu vector embedding trong vài mili-giây.

Vì sao cần riêng một loại DB?

Database thường (PostgreSQL, MySQL) tìm theo điều kiện chính xác (WHERE name = 'X'). Vector DB tìm theo độ tương đồng (“vector nào giống nhất với vector này?”).

Nếu bạn có 10 triệu document đã embed, tìm vector gần nhất bằng vòng lặp brute force sẽ mất vài giây. Vector DB dùng các thuật toán ANN (Approximate Nearest Neighbor) như HNSW, IVF để giảm xuống vài ms — đánh đổi 1-2% độ chính xác.

Các vector database phổ biến (2026)

Cloud / managed

TênNổi bậtGiá khởi điểm
PineconeDễ dùng nhất, scale tốtFree tier nhỏ, $70/tháng+
Weaviate CloudOpen source + cloudFree tier, $25+
Qdrant CloudNhanh, Rust coreFree tier, $25+
TurbopufferMới, rẻ, serverless$0.10/GB/tháng

Self-host

TênNổi bật
QdrantNhanh, dễ deploy
WeaviateCó GraphQL API
MilvusScale lớn, do Zilliz làm
ChromaNhẹ, hợp prototype
pgvectorExtension Postgres — không cần DB mới!

Khi nào KHÔNG cần Vector DB?

  • < 100k vector → dùng pgvector hoặc thậm chí lưu trong file
  • Search cần precision tuyệt đối → dùng brute force chậm nhưng đúng

Workflow điển hình với RAG

1. Ingest:  Tài liệu → chia chunk → embed → lưu vector DB
2. Query:   User hỏi → embed câu hỏi → query top-k chunks
3. Augment: Đưa chunks vào prompt → LLM trả lời

Lưu ý chọn

  • Latency quan trọng → chọn Qdrant, Turbopuffer
  • Đã dùng Postgres → pgvector, không cần DB thêm
  • Cần bộ lọc phức tạp (geo, time, tag) → Weaviate
  • Free tier rộng nhất hiện tại → Qdrant Cloud

Liên quan

Thẻ
#vector-db#embedding#rag