AI hallucination là gì? Cách phát hiện và giảm sai thông tin
AI hallucination là gì? Cách phát hiện câu trả lời nghe rất thật nhưng sai
Bạn nhờ AI viết một đoạn giới thiệu về sản phẩm mới. Nó viết rất hay.
Bạn nhờ AI thêm số liệu thị trường. Nó cũng thêm rất trơn tru.
Bạn hỏi nguồn đâu. Nó đưa ra tên một báo cáo nghe rất uy tín, có năm xuất bản, có tên tổ chức, có cả tiêu đề. Bạn đem đi tìm thì… không thấy báo cáo đó tồn tại.
Chào mừng đến với hallucination.
Trong AI, “hallucination” thường chỉ hiện tượng mô hình tạo ra thông tin sai, gây hiểu nhầm hoặc bịa hoàn toàn, nhưng trình bày như thể đó là sự thật. Stanford HAI định nghĩa hallucination là trường hợp hệ thống AI tạo thông tin hoặc phản hồi không đúng, sai lệch hoặc bịa đặt nhưng được trình bày như factual.
Nói vui: AI không nói “em không biết” như một thực tập sinh thật thà. Đôi khi nó mặc vest, bước lên sân khấu và thuyết trình rất tự tin về một thứ nó vừa tưởng tượng ra.
Vì sao AI có thể bịa mà vẫn nghe hợp lý?
LLM sinh câu trả lời bằng cách dự đoán chuỗi token phù hợp với bối cảnh. Nó tối ưu cho câu trả lời có vẻ mạch lạc, hữu ích, đúng format. Nhưng “mạch lạc” không luôn đồng nghĩa với “đúng”.
Google Cloud giải thích AI hallucination có thể phát sinh từ nhiều yếu tố như dữ liệu huấn luyện chưa đủ, giả định sai của mô hình, thiên lệch dữ liệu hoặc thiếu grounding với thực tế.
IBM cũng mô tả hallucination là hiện tượng hệ thống AI tạo đầu ra vô nghĩa hoặc không chính xác, đôi khi vì nhận ra những mẫu không tồn tại hoặc không phù hợp.
Framework: Bộ lọc 3C để bắt lỗi hallucination
Khi đọc đầu ra AI, đừng chỉ hỏi “nghe có hay không?”. Hãy dùng bộ lọc 3C: Claim - Context - Consequence.
1. Claim: Câu nào là khẳng định cần kiểm chứng?
Trong một đoạn văn AI viết, không phải câu nào cũng nguy hiểm.
Câu “khách hàng thường quan tâm đến giá” là nhận định chung. Nhưng câu “73% khách hàng Việt Nam ưu tiên giá hơn chất lượng theo báo cáo X năm 2025” là claim cần kiểm chứng.
Hãy đánh dấu các loại claim:
- Số liệu.
- Tên người, tên tổ chức.
- Ngày tháng.
- Quy định pháp lý.
- Chính sách công ty.
- Trích dẫn.
- So sánh “tốt nhất”, “lớn nhất”, “duy nhất”.
- Kết luận ảnh hưởng quyết định.
2. Context: AI có đủ ngữ cảnh để trả lời không?
Nếu bạn hỏi: “Chính sách bảo hành bên mình thế nào?” mà không cung cấp tài liệu, AI không thể biết chính sách thật của công ty bạn.
Nếu bạn hỏi: “Chiến dịch này có hiệu quả không?” mà không đưa chi phí, doanh thu, mục tiêu, kênh, thời gian chạy, AI chỉ có thể đoán.
Câu hỏi càng thiếu ngữ cảnh, hallucination càng dễ xuất hiện.
3. Consequence: Nếu sai thì hậu quả là gì?
Không phải lỗi AI nào cũng nghiêm trọng.
AI bịa một slogan dở? Sửa được.
AI bịa chính sách hoàn tiền? Có thể mất tiền.
AI bịa điều khoản pháp lý? Có thể thành rủi ro lớn.
AI bịa số liệu trong báo cáo gửi ban giám đốc? Uy tín đi xuống rất nhanh.
Hãy phân loại đầu ra AI theo mức hậu quả, không chỉ theo độ hay.
Mini case: Chatbot sale trả sai chính sách đổi trả
Một công ty bán thiết bị gia dụng ở Việt Nam thử dùng chatbot AI để trả lời khách hàng. Ban đầu rất vui: bot trả lời nhanh, lịch sự, không cáu gắt lúc 11 giờ đêm.
Một khách hỏi: “Mua máy lọc không khí rồi dùng thử không hợp có đổi được không?”
Bot trả lời: “Anh/chị có thể đổi trả trong vòng 14 ngày nếu sản phẩm còn nguyên vẹn.”
Nghe hợp lý. Nhưng chính sách thật chỉ cho đổi trả khi sản phẩm lỗi kỹ thuật, không áp dụng “dùng thử không hợp”.
Khách chụp màn hình. Nhân viên sale khó xử. Quản lý phải quyết định có xử lý ngoại lệ không.
Vấn đề không phải chatbot “dở”. Vấn đề là chatbot được giao trả lời chính sách nhưng không bị buộc dựa trên tài liệu chính thức. Không có grounding, không có rào chắn, không có câu “tôi chưa tìm thấy thông tin trong chính sách hiện có”.
Các loại hallucination thường gặp trong công việc
1. Bịa số liệu
AI tạo ra phần trăm, quy mô thị trường, tỷ lệ tăng trưởng hoặc benchmark nghe rất hợp lý nhưng không có nguồn.
2. Bịa nguồn
AI đưa tên báo cáo, link, tác giả hoặc tổ chức không tồn tại. Đây là loại nguy hiểm vì người đọc dễ bị vẻ ngoài “có nguồn” đánh lừa.
3. Bịa chính sách
Thường gặp trong chatbot CSKH, HR, IT support: AI trả lời dựa trên chính sách phổ biến chứ không theo chính sách thật.
4. Bịa logic
Các bước lập luận nghe mượt nhưng kết luận không theo dữ liệu.
5. Bịa format
Trong tác vụ kỹ thuật, AI có thể tạo JSON lỗi, code sai cú pháp, trường dữ liệu không tồn tại, hoặc bảng thiếu cột.
Checklist: Trước khi dùng đầu ra AI
[ ] Có số liệu nào cần kiểm chứng không?
[ ] Có tên người, công ty, báo cáo, luật, chính sách không?
[ ] AI có nêu nguồn rõ ràng không?
[ ] Tôi đã mở nguồn thật để kiểm tra chưa?
[ ] Câu trả lời có dựa trên tài liệu tôi cung cấp không?
[ ] Có phần nào AI tự suy đoán không?
[ ] Nếu câu này sai, hậu quả là gì?
[ ] Có cần người chuyên môn duyệt không?
[ ] Có nên yêu cầu AI đánh dấu phần “chưa đủ dữ liệu” không?
Nguyên tắc đơn giản: AI được quyền nháp. Con người chịu trách nhiệm xuất bản.
Cách giảm hallucination trong công việc
1. Bắt AI dựa trên nguồn cụ thể
Thay vì hỏi:
Hãy viết chính sách đổi trả cho sản phẩm này.
Hãy hỏi:
Dựa chỉ trên tài liệu chính sách dưới đây, hãy trả lời câu hỏi của khách hàng.
Nếu tài liệu không có câu trả lời, hãy nói "chưa có thông tin trong tài liệu được cung cấp".
2. Tách phần sáng tạo và phần sự thật
Với marketing, bạn có thể dùng AI để brainstorm headline, angle, outline. Nhưng khi đến số liệu, claim thị trường, lợi ích sản phẩm, hãy kiểm chứng riêng.
Đừng để AI vừa sáng tạo vừa làm kiểm toán sự thật trong cùng một lượt.
3. Yêu cầu đánh dấu giả định
Một prompt tốt nên có câu:
Hãy đánh dấu rõ:
- Dữ kiện có trong nguồn
- Giả định của bạn
- Thông tin còn thiếu
- Phần cần con người kiểm chứng
4. Dùng RAG hoặc knowledge base cho dữ liệu nội bộ
Nếu chatbot phải trả lời chính sách, đừng để nó dựa vào trí nhớ mô hình. Hãy kết nối với nguồn đã duyệt.
Google DeepMind nhấn mạnh factual grounding là vấn đề quan trọng vì LLM có thể tạo thông tin sai, đặc biệt khi xử lý đầu vào phức tạp; các benchmark như FACTS Grounding được xây để đo khả năng bám nguồn của mô hình.
5. Thiết kế human-in-the-loop
Với đầu ra rủi ro cao, cần người duyệt:
- Legal duyệt nội dung pháp lý.
- Finance duyệt số liệu tài chính.
- HR duyệt chính sách nhân sự.
- Product duyệt claim sản phẩm.
- Security duyệt nội dung liên quan dữ liệu và hệ thống.
Template prompt giảm rủi ro
Bạn chỉ được trả lời dựa trên tài liệu tôi cung cấp.
Nhiệm vụ:
[Trả lời câu hỏi / tóm tắt / phân tích]
Quy tắc:
- Không thêm dữ kiện ngoài tài liệu.
- Nếu tài liệu không có thông tin, nói rõ "không tìm thấy trong tài liệu".
- Đánh dấu mọi giả định.
- Liệt kê phần cần con người kiểm chứng.
- Với số liệu, trích đúng câu hoặc đoạn nguồn liên quan.
Câu hỏi:
[Nhập câu hỏi]
Tài liệu:
[Dán nguồn]
Kết luận
- AI hallucination là khi AI tạo thông tin sai hoặc bịa nhưng trình bày như thật.
- Nguyên nhân thường đến từ cơ chế dự đoán ngôn ngữ, thiếu dữ liệu, thiếu grounding hoặc prompt dẫn dắt sai.
- Bộ lọc 3C - Claim, Context, Consequence - giúp bạn biết phần nào cần kiểm chứng.
- Cách giảm rủi ro gồm: cung cấp nguồn, tách sáng tạo khỏi sự thật, yêu cầu đánh dấu giả định, dùng RAG và có human-in-the-loop.
- AI có thể viết bản nháp rất nhanh, nhưng trách nhiệm cuối cùng vẫn thuộc về người dùng và tổ chức.

Đăng nhận xét