Sổ Tay AI
ky-thuat Menengah

Apa itu Training (Pelatihan AI)?

Proses mengajari model AI dengan menunjukkan jutaan/miliaran contoh dan menyesuaikan parameter internalnya.

Diperbarui: 5 Mei 2026 · 2 min read

Training adalah proses mengajari model AI menarik pola dari data — model diberi jutaan/miliaran contoh, setiap kali menebak salah maka parameter internalnya disesuaikan sedikit, diulang sampai sebagian besar tebakannya benar.

3 tahap Training sebuah LLM

1. Pre-training

Model membaca RIBUAN MILIAR token (hampir seluruh web berkualitas + buku + kode).

  • Tujuan: menebak token berikutnya
  • Paling mahal: berbulan-bulan × ribuan GPU = $10-100M
  • Hasil: model “tahu bahasa” dan “punya pengetahuan umum” tapi belum berguna

2. Supervised Fine-Tuning (SFT)

Model diberi pasangan (prompt → contoh jawaban) berkualitas tinggi.

  • Tujuan: mengajari model menjawab dalam gaya “asisten”
  • Data: puluhan - ratusan ribu pasangan yang ditulis manusia
  • Biaya: $100k-$1M

3. RLHF (atau DPO)

Penyempurnaan tambahan dengan umpan balik manusia tentang jawaban mana yang lebih baik.

  • Tujuan: mengajari model menjawab “sesuai keinginan” — bermanfaat, aman, tidak menjilat
  • Lihat RLHF untuk detail

Parameter

Selama training, model belajar dengan menyesuaikan “bobot” (weights) — yaitu parameter.

  • GPT-2: 1,5 miliar parameter
  • GPT-4: ~1,7 triliun
  • Llama 3.3 70B: 70 miliar

Semakin banyak parameter → semakin “pintar”, tapi makin boros memori dan compute.

Training menghabiskan apa?

Sumber daya

  • GPU/TPU cluster: ribuan-puluhan ribu chip
  • Data: TB - PB teks
  • Listrik: training GPT-4 diperkirakan ~50GWh (≈ konsumsi 5000 rumah selama 1 tahun)
  • Uang: $10M - $1B+ untuk frontier model

Waktu

  • Pre-training: 2-6 bulan
  • Fine-tuning: 1-4 minggu
  • RLHF: 2-8 minggu

→ Inilah mengapa hanya beberapa perusahaan (OpenAI, Anthropic, Google, Meta, xAI) yang mampu training frontier model.

Apakah Anda perlu Training sendiri?

99% kasus TIDAK PERLU. Alasannya:

  • Terlalu mahal
  • Butuh expertise mendalam
  • Sebagian besar use case bisa diselesaikan dengan prompting + RAG
  • Saat butuh kustomisasi → fine-tune model yang sudah ada (lihat Fine-tuning)

Hanya train dari nol jika:

  • Anda lab besar dengan budget memadai
  • Butuh model khusus untuk industri/bahasa spesifik yang belum ada
  • Butuh kepemilikan mutlak atas model (mis: militer)

Terkait

Tag
#training#llm