Apa itu LLM?
Large Language Model — sistem AI yang dilatih pada kumpulan teks raksasa, mampu memahami dan menghasilkan teks seperti manusia. ChatGPT, Claude, dan Gemini semuanya adalah LLM.
Large Language Model (LLM) adalah jenis AI yang dilatih pada teks dalam jumlah sangat besar — miliaran halaman web, buku, dan repositori kode — yang dapat memahami dan menghasilkan teks yang terdengar alami. ChatGPT, Claude, Gemini, dan Llama semuanya adalah LLM.
Mengapa “Besar”?
“Besar” merujuk pada jumlah parameter — biasanya dihitung dalam miliaran:
| Model | Parameter | Tahun |
|---|---|---|
| GPT-2 | 1,5 M | 2019 |
| GPT-3 | 175 M | 2020 |
| GPT-4 | ~1,7 T (estimasi) | 2023 |
| Claude 4.7 | tidak diumumkan | 2026 |
Lebih banyak parameter umumnya berarti model lebih mampu — tapi juga butuh lebih banyak memori dan energi.
Cara kerja LLM (dalam satu kalimat)
LLM adalah fungsi yang memprediksi token berikutnya yang paling mungkin diberikan urutan token. Ulangi proses itu dan Anda mendapatkan paragraf yang koheren.
Input: "Cuaca hari ini"
Output: "cerah" (probabilitas tinggi), "hangat", "hujan", ...
Kedengarannya sederhana, tapi pada ratusan miliar parameter yang dilatih pada triliunan token, hasilnya terlihat sangat mirip dengan penalaran.
Yang LLM kerjakan dengan baik
- Menjawab pertanyaan
- Menulis, meringkas, menerjemahkan
- Menghasilkan dan mengedit kode
- Menganalisis teks dan dokumen
- Roleplay (chatbot)
- Penalaran langkah demi langkah (Chain of Thought)
Yang LLM tidak kerjakan dengan baik
- Tidak tahu peristiwa setelah batas pelatihan (kecuali terhubung ke pencarian web)
- Bisa berhalusinasi — mengarang dengan percaya diri
- Tidak benar-benar “memahami” — mereka memprediksi probabilitas
- Tidak ada kesadaran, emosi, atau niat
Terkait
- Token — apa yang diproses LLM
- Context Window — memori jangka pendek
- Hallucination