Apa itu Embedding?
Cara merepresentasikan teks, gambar, atau apa pun sebagai vektor numerik agar mesin dapat membandingkan makna.
Embedding adalah cara mengubah sesuatu (teks, gambar, audio) menjadi sebuah array berisi angka (vektor) sedemikian rupa sehingga hal-hal yang memiliki makna serupa berakhir dengan vektor yang serupa pula.
Intuisi
Bayangkan menempatkan kata-kata ke dalam ruang 3D (Embedding sebenarnya memiliki sekitar 1536 dimensi):
"anjing" → [0.8, 0.2, 0.1]
"kucing" → [0.7, 0.3, 0.2] ← dekat dengan "anjing" (sama-sama hewan peliharaan)
"mobil" → [0.1, 0.9, 0.5] ← jauh dari "anjing" (topik berbeda)
Jarak antara dua vektor mendekati jarak makna (semantic distance).
Embedding digunakan untuk apa
1. RAG (Retrieval-Augmented Generation)
Anda memiliki 1000 halaman dokumen. Tidak mungkin semuanya dimasukkan ke dalam prompt.
- Embed setiap potongan → simpan di vector database
- Embed pertanyaan → cari potongan dengan vektor terdekat
- Berikan potongan tersebut ke LLM → dapat jawaban yang akurat
2. Pencarian semantik
Pencarian tradisional mencocokkan kata kunci. Pencarian dengan Embedding mencocokkan makna:
- Query “cara menurunkan berat badan” juga memunculkan “teknik membakar lemak”
3. Clustering & klasifikasi
Embed semua feedback pelanggan, kelompokkan vektor yang berdekatan → temukan tema keluhan yang sering muncul.
4. Rekomendasi
Produk dengan vektor yang dekat dengan produk yang sudah pernah dibeli pengguna → rekomendasikan produk-produk tersebut.
Model Embedding populer (2026)
| Provider | Model | Dimensi | Harga / 1M token |
|---|---|---|---|
| OpenAI | text-embedding-3-large | 3072 | $0.13 |
| OpenAI | text-embedding-3-small | 1536 | $0.02 |
| Voyage AI | voyage-3 | 1024 | $0.06 |
| Cohere | embed-v3 | 1024 | $0.10 |
| Open source | bge-m3 | 1024 | Gratis (self-host) |
Multimodal embedding
Model seperti CLIP meng-embed gambar dan teks ke dalam ruang vektor yang sama — memungkinkan Anda mencari gambar dengan teks:
- Query “seekor golden retriever berlari di pantai” → temukan kecocokan di antara jutaan foto.