co-ban Cơ bản

Deep Learning (Học sâu) là gì?

Nhánh của machine learning dùng mạng neural nhiều lớp để học từ dữ liệu phức tạp như ảnh, âm thanh, văn bản.

Cập nhật: 2 tháng 5, 2026 · 2 phút đọc

Deep Learning (Học sâu) là một loại machine learning dùng mạng neural (neural network) có rất nhiều lớp xếp chồng — từ đó tên gọi “deep” (sâu).

Vì sao cần “sâu”?

Mỗi lớp neural học một mức độ trừu tượng khác nhau:

Lớp 1: phát hiện cạnh và đường nét
Lớp 2: kết hợp cạnh thành hình dạng (mắt, mũi, miệng)
Lớp 3: kết hợp hình dạng thành đối tượng (khuôn mặt)
Lớp 4: phân biệt khuôn mặt (đây là người A hay người B)

Càng nhiều lớp, mô hình càng học được pattern phức tạp.

Vì sao Deep Learning bùng nổ?

3 yếu tố hội tụ vào ~2012:

Dữ liệu lớn (Internet, mobile camera tạo ra hàng tỷ ảnh)
GPU đủ mạnh để train mô hình lớn
Thuật toán tốt hơn (backpropagation cải tiến, ReLU, dropout)

Kết quả: AI nhận diện ảnh bỗng nhiên giỏi hơn con người. Tiếp đến là dịch máy, voice, rồi LLM.

Deep Learning làm được gì hôm nay

Computer Vision: nhận diện vật thể, deepfake, xe tự lái
NLP: dịch máy, LLM như ChatGPT
Speech: chuyển giọng nói ↔ văn bản (Whisper)
Image Generation: Midjourney, DALL-E, Stable Diffusion
Protein Folding: AlphaFold dự đoán cấu trúc protein

Khác biệt với ML truyền thống

Yếu tố	ML truyền thống	Deep Learning
Lượng data cần	Vừa (vài nghìn)	Rất lớn (triệu+)
Compute cần	CPU đủ	Cần GPU/TPU
Tự trích xuất feature	Không (phải tự định nghĩa)	Có (tự học)
Phù hợp với	Dữ liệu cấu trúc (bảng)	Dữ liệu thô (ảnh, âm thanh, text)

Liên quan

Neural Network
Transformer — kiến trúc deep learning đứng sau LLM
Training

Thẻ

#deep-learning#neural-network