cong-cu Menengah

Apa itu Vector Database?

Jenis database khusus untuk menyimpan dan mencari vector embedding dengan cepat, fondasi untuk RAG dan semantic search.

Diperbarui: 5 Mei 2026 · 2 min read

Vector Database adalah jenis database yang dioptimalkan untuk menyimpan dan mencari jutaan vector embedding dalam hitungan milidetik.

Mengapa butuh DB jenis tersendiri?

Database biasa (PostgreSQL, MySQL) mencari berdasarkan kondisi eksak (WHERE name = 'X'). Vector DB mencari berdasarkan kemiripan (“vector mana yang paling mirip dengan vector ini?”).

Jika Anda punya 10 juta dokumen yang sudah di-embed, mencari vector terdekat dengan loop brute force akan memakan beberapa detik. Vector DB menggunakan algoritma ANN (Approximate Nearest Neighbor) seperti HNSW, IVF untuk menurunkannya menjadi beberapa ms — dengan pengorbanan 1-2% akurasi.

Vector Database populer (2026)

Cloud / managed

Nama	Keunggulan	Harga awal
Pinecone	Paling mudah, scale baik	Free tier kecil, $70/bulan+
Weaviate Cloud	Open source + cloud	Free tier, $25+
Qdrant Cloud	Cepat, core Rust	Free tier, $25+
Turbopuffer	Baru, murah, serverless	$0.10/GB/bulan

Self-host

Nama	Keunggulan
Qdrant	Cepat, mudah deploy
Weaviate	Punya GraphQL API
Milvus	Scale besar, dibuat oleh Zilliz
Chroma	Ringan, cocok untuk prototype
pgvector	Extension Postgres — tidak perlu DB baru!

Kapan TIDAK butuh Vector DB?

< 100k vector → pakai pgvector atau bahkan simpan di file
Search butuh presisi mutlak → pakai brute force lambat tapi akurat

Workflow umum dengan RAG

1. Ingest:  Dokumen → bagi jadi chunk → embed → simpan di vector DB
2. Query:   User bertanya → embed pertanyaan → query top-k chunks
3. Augment: Masukkan chunks ke prompt → LLM menjawab

Catatan dalam memilih

Latency penting → pilih Qdrant, Turbopuffer
Sudah pakai Postgres → pgvector, tidak perlu DB tambahan
Butuh filter kompleks (geo, time, tag) → Weaviate
Free tier paling luas saat ini → Qdrant Cloud

Terkait

Tag

#vector-db#embedding#rag