Bài 05Tầng 1 — Nền tảng

Context Window, Token, Hallucination
Hiểu cách AI hoạt động để không bực bội khi nó 'quên'

Hiểu cách AI hoạt động để không bực bội khi nó 'quên'

💡 Trả lời ngắn

Claude như "chiếc bàn rộng có hạn" — Opus 4.7 và Sonnet 4.6 hỗ trợ 1 triệu token (~2,500 trang sách). Khi chat quá dài, Claude bắt đầu "quên". Hallucination = AI tự tin nói sai. Bài này dạy 4 cách xử lý + 6 định dạng tệp Claude đọc được.


🎯 Mục tiêu bài học

  • 🪑 Hiểu Context Window và giới hạn
  • 🔤 Hiểu Token — cách AI đếm thông tin
  • 🚨 Nhận biết khi Claude "quên" + 4 cách xử lý
  • 📁 Biết 6 nhóm định dạng tệp Claude đọc được
  • 🎭 Hiểu Hallucination và cách phòng tránh

📑 Mục lục

  1. Context Window — Chiếc bàn rộng có hạn
  2. Token — Đơn vị đo lường AI
  3. Dấu hiệu Claude "quên" + 4 cách xử lý
  4. 6 nhóm định dạng tệp
  5. Hallucination — Khi AI tự tin nói sai
  6. Khi nào mở chat mới?

Context Window — Chiếc bàn rộng có hạn

[Designer: chèn minh họa "chiếc bàn với giấy rơi xuống"]

"Claude như người đang đọc tài liệu trên chiếc bàn. Chất quá nhiều giấy, tờ cũ rơi xuống đất — không nhìn thấy nữa."

1.000.000 token (~2,500 trang sách)

Context Window của Opus 4.7 và Sonnet 4.6

Ý nghĩa: 1 triệu token là cực kỳ lớn — đủ cho: - Toàn bộ tài liệu công ty - 1 cuốn sách dài - 20-30 file PDF cùng lúc - 100+ email kèm phụ lục

Nhưng vẫn có giới hạn. Khi context quá dài, chất lượng giảm ở phần giữa (hiện tượng "lost in the middle").


Token là gì? — Quy tắc nhanh

Token là đơn vị đo lường văn bản của AI. AI không đọc "từng từ" mà "từng token".

🇬🇧 Tiếng Anh 🇻🇳 Tiếng Việt 📖 Trang sách
1 token ≈ ¾ từ 1 từ ≈ 2-3 token 1 trang ≈ 400-500 token

Tại sao quan trọng? - Quyết định bạn nạp được bao nhiêu thông tin vào 1 cuộc chat - Quyết định giới hạn gói cước (tin nhắn/ngày)

💡 Bạn không cần tính token chính xác — chỉ cần biết: tải nhiều file lớn → tiêu nhiều token nhanh hơn.


Dấu hiệu Claude bắt đầu "quên"

Khi cuộc chat quá dài hoặc context quá đầy, Claude có thể:

🔄 Lặp ý cũ ❓ Sai thông tin đầu 📉 Bỏ sót yêu cầu ⚠️ Mâu thuẫn
Lặp lại nội dung đã viết Sai chi tiết bạn nói lúc đầu Bỏ sót file đã tải Mâu thuẫn với câu trả lời trước

Khi thấy những dấu hiệu này → đã đến lúc xử lý.

4 cách xử lý khi cuộc trò chuyện quá dài

[01] Mở chat mới với tóm tắt
     Prompt: "Trong chat trước, ta thống nhất 
              [tóm tắt 3-5 điểm]. Giờ tôi muốn 
              tiếp tục [yêu cầu mới]."

[02] Tải 2-3 file liên quan nhất
     Không nhồi 10 file cùng lúc. 
     Chất lượng > số lượng.

[03] Chia công việc lớn thành chat nhỏ
     1 chat = 1 chủ đề. 
     Việc lớn → 3-5 chat tập trung.

[04] Yêu cầu Claude tự tóm tắt
     "Tóm tắt điểm quan trọng nhất để tôi 
      đưa vào chat mới."

6 nhóm định dạng tệp Claude hỗ trợ

📄 Tài liệu 📊 Bảng tính 💾 Dữ liệu 🖼️ Hình ảnh 💻 Code 📦 Khác
PDF, DOCX, TXT, PPTX, MD XLSX, CSV, Google Sheets JSON, XML, SQL JPG, PNG, GIF, WebP PY, JS, TS, HTML, CSS ZIP, LOG

💡 Mẹo nâng cao: Khi dùng Opus 4.7 — chuyển file PDF → Markdown (.md) trước khi tải. Độ chính xác cao hơn nhiều.


Hallucination — Khi AI tự tin nói sai

Định nghĩa: AI "bịa" thông tin nhưng trình bày rất tự tin.

❌ AI có thể bịa ✅ Cách phòng tránh
Số liệu thống kê không có thật Yêu cầu Claude search web để xác minh
Trích dẫn nguồn (link không tồn tại) Hỏi: "Nguồn này từ đâu? Có link không?"
Sai sự kiện gần đây Đối chiếu với kiến thức bản thân
Sai luật/quy định Luôn xác minh với chuyên gia pháp lý

💡 Tại sao xảy ra? AI dự đoán "câu trả lời nghe có vẻ đúng" thay vì "câu trả lời đúng". AI được training để luôn trả lời — kể cả khi không biết.

Bạn là người verify.

Tình huống dễ bị Hallucination nhất

  • Số liệu cụ thể (% thị phần, doanh thu công ty)
  • Sự kiện gần đây (sau knowledge cutoff)
  • Luật, thông tư, nghị định
  • Trích dẫn nghiên cứu/sách

→ 4 loại trên: luôn yêu cầu Claude search web hoặc verify thủ công.


Khi nào mở chat mới vs tiếp tục?

Có chuyển chủ đề hoàn toàn không?
│
├── CÓ → Chat mới
│
└── KHÔNG → Cuộc chat có dài >30 tin nhắn không?
            │
            ├── KHÔNG → Tiếp tục
            │
            └── CÓ → Có bắt đầu thấy lỗi không?
                     │
                     ├── KHÔNG → Tiếp tục
                     │
                     └── CÓ → Tóm tắt + Chat mới

💡 Quy tắc nhanh: Khi nhận thấy Claude trả lời "lạ" so với đầu chat → đến lúc tóm tắt + mở chat mới.


📝 Key Takeaways

  1. 1 triệu token = đủ cho hầu hết công việc, nhưng vẫn có giới hạn
  2. 4 dấu hiệu Claude quên — biết để xử lý đúng lúc
  3. 6 nhóm định dạng tệp — Claude đọc được hầu hết file công việc
  4. Hallucination luôn có thể xảy ra — verify mọi số liệu/trích dẫn quan trọng

Đã xong Tầng 1! Bạn đã có nền tảng vững: tư duy đúng, thiết lập xong, viết được prompt, hiểu giới hạn AI.

Bài tiếp theo (Tầng 2): Kỹ thuật Brainstorm — cách dùng Claude không cần viết prompt hoàn hảo từ đầu.