Sổ Tay AI
ky-thuat Pemula

Apa itu API (AI)? Cara menggunakan API LLM

Cara developer memanggil model AI dari kode — bagaimana Claude API, OpenAI API, dan Gemini API bekerja.

Diperbarui: 5 Mei 2026 · 2 min read

API (Application Programming Interface) dalam konteks AI adalah cara developer memanggil model AI (Claude, GPT, Gemini…) dari kode, bukan lewat antarmuka chat. Inilah cara membangun produk AI yang terintegrasi ke aplikasi/website Anda.

Kenapa pakai API alih-alih web?

Web (claude.ai, chatgpt.com)API
Untuk end-userUntuk developer
Bayar per paket langgananBayar per token yang dipakai
Satu user satu waktuRibuan request paralel
Tidak bisa diintegrasikan ke aplikasiMudah diintegrasikan

→ Membangun chatbot, automation, atau analysis tool → wajib pakai API.

Contoh memanggil API (Python)

Claude

from anthropic import Anthropic
client = Anthropic(api_key="sk-ant-...")

response = client.messages.create(
    model="claude-sonnet-4-7",
    max_tokens=1024,
    messages=[{"role": "user", "content": "Jelaskan RAG untuk pemula"}]
)
print(response.content[0].text)

OpenAI

from openai import OpenAI
client = OpenAI(api_key="sk-...")

response = client.chat.completions.create(
    model="gpt-5",
    messages=[{"role": "user", "content": "Jelaskan RAG untuk pemula"}]
)
print(response.choices[0].message.content)

Gemini

from google import genai
client = genai.Client(api_key="...")

response = client.models.generate_content(
    model="gemini-2.5-pro",
    contents="Jelaskan RAG untuk pemula"
)
print(response.text)

→ Sintaksnya berbeda tetapi konsepnya sama: kirim message, terima response.

Pricing API provider utama (2026)

ProviderModelInput / 1M tokenOutput / 1M token
AnthropicClaude Sonnet 4.7$3$15
AnthropicClaude Haiku 4.5$0.80$4
AnthropicClaude Opus 4.5$15$75
OpenAIGPT-5$2.50$10
OpenAIGPT-5 mini$0.15$0.60
GoogleGemini 2.5 Pro$1.25$5
GoogleGemini 2.5 Flash$0.10$0.40

→ Tier “small/flash” 10-30× lebih murah dari tier flagship — aturan emas: pakai model terkecil yang sudah cukup baik.

Fitur lanjutan dari API

  • Streaming: menerima token sepotong demi sepotong (bagus untuk UX chatbot)
  • Function calling / Tool use: membiarkan LLM memanggil function Anda — lihat Function Calling
  • Structured output: memaksa LLM mengembalikan JSON sesuai schema
  • Vision: mengirim gambar bersama teks
  • Caching: meng-cache prompt yang tetap, mengurangi biaya hingga 90%
  • Batch API: mengirim 1000 request sekaligus, potongan harga 50%

Catatan saat memakai API di Indonesia

  • Pembayaran: butuh kartu Visa/Mastercard internasional. Beberapa bank punya kartu virtual untuk keperluan ini (BCA, Jenius, Bank Jago).
  • Rate limits: tier yang baru dibuka biasanya rendah. Verifikasi nomor telepon dan top up saldo → tier naik.
  • Latency: panggilan API dari Indonesia ke us-east sekitar 150-200ms. Anthropic dan OpenAI punya endpoint Asia (Singapura, Tokyo) untuk tier berbayar tinggi.
  • Compliance: jika memproses data sensitif pelanggan → baca dengan teliti data policy dari provider.

Wrapper / SDK yang patut dipertimbangkan

  • LangChain — framework serbaguna, mendukung semua provider (overkill untuk task sederhana)
  • LlamaIndex — bagus untuk RAG
  • Vercel AI SDK — terbaik untuk web app TypeScript
  • LiteLLM — proxy banyak provider lewat satu interface

Terkait

Tag
#api#developer#production