cong-cu Menengah
Apa itu Vector Database?
Jenis database khusus untuk menyimpan dan mencari vector embedding dengan cepat, fondasi untuk RAG dan semantic search.
Diperbarui: 5 Mei 2026 · 2 min read
Vector Database adalah jenis database yang dioptimalkan untuk menyimpan dan mencari jutaan vector embedding dalam hitungan milidetik.
Mengapa butuh DB jenis tersendiri?
Database biasa (PostgreSQL, MySQL) mencari berdasarkan kondisi eksak (WHERE name = 'X'). Vector DB mencari berdasarkan kemiripan (“vector mana yang paling mirip dengan vector ini?”).
Jika Anda punya 10 juta dokumen yang sudah di-embed, mencari vector terdekat dengan loop brute force akan memakan beberapa detik. Vector DB menggunakan algoritma ANN (Approximate Nearest Neighbor) seperti HNSW, IVF untuk menurunkannya menjadi beberapa ms — dengan pengorbanan 1-2% akurasi.
Vector Database populer (2026)
Cloud / managed
| Nama | Keunggulan | Harga awal |
|---|---|---|
| Pinecone | Paling mudah, scale baik | Free tier kecil, $70/bulan+ |
| Weaviate Cloud | Open source + cloud | Free tier, $25+ |
| Qdrant Cloud | Cepat, core Rust | Free tier, $25+ |
| Turbopuffer | Baru, murah, serverless | $0.10/GB/bulan |
Self-host
| Nama | Keunggulan |
|---|---|
| Qdrant | Cepat, mudah deploy |
| Weaviate | Punya GraphQL API |
| Milvus | Scale besar, dibuat oleh Zilliz |
| Chroma | Ringan, cocok untuk prototype |
| pgvector | Extension Postgres — tidak perlu DB baru! |
Kapan TIDAK butuh Vector DB?
- < 100k vector → pakai pgvector atau bahkan simpan di file
- Search butuh presisi mutlak → pakai brute force lambat tapi akurat
Workflow umum dengan RAG
1. Ingest: Dokumen → bagi jadi chunk → embed → simpan di vector DB
2. Query: User bertanya → embed pertanyaan → query top-k chunks
3. Augment: Masukkan chunks ke prompt → LLM menjawab
Catatan dalam memilih
- Latency penting → pilih Qdrant, Turbopuffer
- Sudah pakai Postgres → pgvector, tidak perlu DB tambahan
- Butuh filter kompleks (geo, time, tag) → Weaviate
- Free tier paling luas saat ini → Qdrant Cloud
Terkait
Tag
#vector-db#embedding#rag