co-ban Cơ bản
Deep Learning (Học sâu) là gì?
Nhánh của machine learning dùng mạng neural nhiều lớp để học từ dữ liệu phức tạp như ảnh, âm thanh, văn bản.
Cập nhật: 2 tháng 5, 2026 · 2 phút đọc
Deep Learning (Học sâu) là một loại machine learning dùng mạng neural (neural network) có rất nhiều lớp xếp chồng — từ đó tên gọi “deep” (sâu).
Vì sao cần “sâu”?
Mỗi lớp neural học một mức độ trừu tượng khác nhau:
Lớp 1: phát hiện cạnh và đường nét
Lớp 2: kết hợp cạnh thành hình dạng (mắt, mũi, miệng)
Lớp 3: kết hợp hình dạng thành đối tượng (khuôn mặt)
Lớp 4: phân biệt khuôn mặt (đây là người A hay người B)
Càng nhiều lớp, mô hình càng học được pattern phức tạp.
Vì sao Deep Learning bùng nổ?
3 yếu tố hội tụ vào ~2012:
- Dữ liệu lớn (Internet, mobile camera tạo ra hàng tỷ ảnh)
- GPU đủ mạnh để train mô hình lớn
- Thuật toán tốt hơn (backpropagation cải tiến, ReLU, dropout)
Kết quả: AI nhận diện ảnh bỗng nhiên giỏi hơn con người. Tiếp đến là dịch máy, voice, rồi LLM.
Deep Learning làm được gì hôm nay
- Computer Vision: nhận diện vật thể, deepfake, xe tự lái
- NLP: dịch máy, LLM như ChatGPT
- Speech: chuyển giọng nói ↔ văn bản (Whisper)
- Image Generation: Midjourney, DALL-E, Stable Diffusion
- Protein Folding: AlphaFold dự đoán cấu trúc protein
Khác biệt với ML truyền thống
| Yếu tố | ML truyền thống | Deep Learning |
|---|---|---|
| Lượng data cần | Vừa (vài nghìn) | Rất lớn (triệu+) |
| Compute cần | CPU đủ | Cần GPU/TPU |
| Tự trích xuất feature | Không (phải tự định nghĩa) | Có (tự học) |
| Phù hợp với | Dữ liệu cấu trúc (bảng) | Dữ liệu thô (ảnh, âm thanh, text) |
Liên quan
- Neural Network
- Transformer — kiến trúc deep learning đứng sau LLM
- Training
Thẻ
#deep-learning#neural-network