Sổ Tay AI
ky-thuat Menengah

Apa itu Embedding?

Cara merepresentasikan teks, gambar, atau apa pun sebagai vektor numerik agar mesin dapat membandingkan makna.

Diperbarui: 5 Mei 2026 · 2 min read

Embedding adalah cara mengubah sesuatu (teks, gambar, audio) menjadi sebuah array berisi angka (vektor) sedemikian rupa sehingga hal-hal yang memiliki makna serupa berakhir dengan vektor yang serupa pula.

Intuisi

Bayangkan menempatkan kata-kata ke dalam ruang 3D (Embedding sebenarnya memiliki sekitar 1536 dimensi):

"anjing"  → [0.8, 0.2, 0.1]
"kucing"  → [0.7, 0.3, 0.2]   ← dekat dengan "anjing" (sama-sama hewan peliharaan)
"mobil"   → [0.1, 0.9, 0.5]   ← jauh dari "anjing" (topik berbeda)

Jarak antara dua vektor mendekati jarak makna (semantic distance).

Embedding digunakan untuk apa

1. RAG (Retrieval-Augmented Generation)

Anda memiliki 1000 halaman dokumen. Tidak mungkin semuanya dimasukkan ke dalam prompt.

  • Embed setiap potongan → simpan di vector database
  • Embed pertanyaan → cari potongan dengan vektor terdekat
  • Berikan potongan tersebut ke LLM → dapat jawaban yang akurat

2. Pencarian semantik

Pencarian tradisional mencocokkan kata kunci. Pencarian dengan Embedding mencocokkan makna:

  • Query “cara menurunkan berat badan” juga memunculkan “teknik membakar lemak”

3. Clustering & klasifikasi

Embed semua feedback pelanggan, kelompokkan vektor yang berdekatan → temukan tema keluhan yang sering muncul.

4. Rekomendasi

Produk dengan vektor yang dekat dengan produk yang sudah pernah dibeli pengguna → rekomendasikan produk-produk tersebut.

Model Embedding populer (2026)

ProviderModelDimensiHarga / 1M token
OpenAItext-embedding-3-large3072$0.13
OpenAItext-embedding-3-small1536$0.02
Voyage AIvoyage-31024$0.06
Cohereembed-v31024$0.10
Open sourcebge-m31024Gratis (self-host)

Multimodal embedding

Model seperti CLIP meng-embed gambar dan teks ke dalam ruang vektor yang sama — memungkinkan Anda mencari gambar dengan teks:

  • Query “seekor golden retriever berlari di pantai” → temukan kecocokan di antara jutaan foto.

Terkait

Tag
#embedding#vector#rag