Sổ Tay AI
cong-cu Menengah

Apa itu Vector Database?

Jenis database khusus untuk menyimpan dan mencari vector embedding dengan cepat, fondasi untuk RAG dan semantic search.

Diperbarui: 5 Mei 2026 · 2 min read

Vector Database adalah jenis database yang dioptimalkan untuk menyimpan dan mencari jutaan vector embedding dalam hitungan milidetik.

Mengapa butuh DB jenis tersendiri?

Database biasa (PostgreSQL, MySQL) mencari berdasarkan kondisi eksak (WHERE name = 'X'). Vector DB mencari berdasarkan kemiripan (“vector mana yang paling mirip dengan vector ini?”).

Jika Anda punya 10 juta dokumen yang sudah di-embed, mencari vector terdekat dengan loop brute force akan memakan beberapa detik. Vector DB menggunakan algoritma ANN (Approximate Nearest Neighbor) seperti HNSW, IVF untuk menurunkannya menjadi beberapa ms — dengan pengorbanan 1-2% akurasi.

Vector Database populer (2026)

Cloud / managed

NamaKeunggulanHarga awal
PineconePaling mudah, scale baikFree tier kecil, $70/bulan+
Weaviate CloudOpen source + cloudFree tier, $25+
Qdrant CloudCepat, core RustFree tier, $25+
TurbopufferBaru, murah, serverless$0.10/GB/bulan

Self-host

NamaKeunggulan
QdrantCepat, mudah deploy
WeaviatePunya GraphQL API
MilvusScale besar, dibuat oleh Zilliz
ChromaRingan, cocok untuk prototype
pgvectorExtension Postgres — tidak perlu DB baru!

Kapan TIDAK butuh Vector DB?

  • < 100k vector → pakai pgvector atau bahkan simpan di file
  • Search butuh presisi mutlak → pakai brute force lambat tapi akurat

Workflow umum dengan RAG

1. Ingest:  Dokumen → bagi jadi chunk → embed → simpan di vector DB
2. Query:   User bertanya → embed pertanyaan → query top-k chunks
3. Augment: Masukkan chunks ke prompt → LLM menjawab

Catatan dalam memilih

  • Latency penting → pilih Qdrant, Turbopuffer
  • Sudah pakai Postgres → pgvector, tidak perlu DB tambahan
  • Butuh filter kompleks (geo, time, tag) → Weaviate
  • Free tier paling luas saat ini → Qdrant Cloud

Terkait

Tag
#vector-db#embedding#rag