ky-thuat Cơ bản

Token (LLM) là gì?

Đơn vị nhỏ nhất mà LLM xử lý — không phải là từ, mà là mảnh ghép của từ. Tokens quyết định giá API và giới hạn context.

Cập nhật: 2 tháng 5, 2026 · 2 phút đọc

Token là đơn vị nhỏ nhất mà LLM xử lý. Một token KHÔNG bằng một từ — nó là một “mảnh” của từ, đôi khi là cả từ ngắn, đôi khi là một phần.

Ví dụ

Câu tiếng Anh: "Tokenization is fun!" → 5 tokens:

["Token", "ization", " is", " fun", "!"]

Câu tiếng Việt: "Trí tuệ nhân tạo" → ~7-9 tokens (tùy tokenizer):

["Tr", "í", " tuệ", " nhân", " t", "ạ", "o"]

Lưu ý: tiếng Việt thường tốn token gấp 1.5-2 lần tiếng Anh cùng nghĩa, vì có dấu và tokenizer ưu tiên tiếng Anh.

Hầu hết API LLM tính tiền theo token:

Nếu prompt dài 1000 từ tiếng Việt ≈ 2000 tokens → cộng dồn đắt khi gọi nhiều.

Mỗi model có giới hạn token tối đa trong 1 lần gọi:

Vượt giới hạn → request fail. Cần RAG hoặc tóm tắt trước.

Nhiều token → mô hình chạy lâu hơn. Streaming output trả từng token một.

Thẻ

#token#llm#co-ban