ChatGPT ‘nhầm lẫn giữa sự thật và niềm tin’


“Hầu hết mô hình AI lớn đều thiếu sự hiểu biết sâu sắc về bản chất thực tế của kiến thức – rằng kiến thức vốn dĩ đòi hỏi sự thật”, đại diện nhóm nghiên cứu Đại học Stanford nói với tạp chí Nature Machine Intelligence. “Điều đó có thể gây ra những hậu quả đáng lo ngại, do chúng ngày càng được áp dụng phổ biến trong các lĩnh vực từ luật đến y học, nơi mà khả năng phân biệt sự thật với hư cấu trở nên cấp thiết. Việc không phân biệt có thể dẫn đến chẩn đoán sai, làm sai lệch phán quyết của tòa án và khuếch đại thông tin sai lệch”.


Một số ứng dụng AI tạo sinh trên điện thoại Copilot, DeepSeek, Gemini, AI Hay, ChatGPT, Grok. Ảnh: Lưu Quý

Một số ứng dụng AI tạo sinh trên điện thoại Copilot, DeepSeek, Gemini, AI Hay, ChatGPT, Grok. Ảnh: Lưu Quý

Để dẫn đến kết luận này, nhóm nghiên cứu Đại học Stanford đã sử dụng 24 mô hình AI lớn phổ biến nhất hiện nay, gồm ChatGPT, Claude AI, DeepSeek hay Gemini. Chúng sau đó được hỏi 13.000 câu hỏi để đánh giá khả năng phân biệt giữa niềm tin, kiến thức và sự thật.

Nhóm nghiên cứu nhận thấy, nhìn chung, các mô hình ít có khả năng phân biệt “niềm tin sai” với “niềm tin đúng”. Những chatbot phát hành trong hoặc sau tháng 5/2024 đạt độ chính xác từ 91,1% đến 91,5% khi xác định thông tin đúng hoặc sai, trong khi các mô hình cũ hơn chỉ đạt từ 71,5% đến 84,8%.

“Chat bot gặp khó khăn trong việc nắm bắt bản chất của kiến thức”, đại diện nhóm nghiên cứu nói. “Chiến lược lập luận của chúng không nhất quán, gợi ý và khớp mẫu hời hợt thay vì sự nhận thức sâu sắc liên quan đến kiến thức hoặc mức độ hiểu biết”.

Từ kết quả này, nhóm chuyên gia Đại học Stanford kêu gọi các công ty đang phát triển mô hình AI cần “những cải tiến khẩn cấp” trước khi được triển khai trong các lĩnh vực có rủi ro cao như luật pháp, y học… nơi khả năng phân biệt sự thật với hư cấu là điều cần thiết.

Một số kiểm nghiệm thực tế gần đây cũng cho thấy các mô hình ngôn ngữ lớn (LLM) nắm bắt thực tế chưa chuẩn xác. Chẳng hạn, trong bài đăng trên LinkedIn, nhà sáng tạo và nhà đầu tư người Anh David Grunwald đã đề nghị AI Grok làm cho ông một “tấm áp phích của mười vị thủ tướng Anh gần đây nhất”. Kết quả dường như đầy rẫy lỗi nghiêm trọng, chẳng hạn gọi Rishi Sunak là “Boris Johnson”, hay liệt kê bà Theresa May “đã phục vụ từ năm 5747 đến năm 70”.

Pablo Haya Coll, chuyên gia ngôn ngữ học máy tính tại Đại học Autonomous Madrid (UAM), đánh giá kết quả nghiên cứu “đáng lo ngại”, đồng thời cho rằng cần có giải pháp đào tạo các mô hình nhằm giúp chúng phản hồi theo cách thận trọng hơn. Theo Coll, những phát hiện này phơi bày điểm yếu về mặt cấu trúc trong các mô hình ngôn ngữ: khó khăn trong việc phân biệt chắc chắn giữa niềm tin chủ quan và sự thật khách quan tùy thuộc vào cách một khẳng định nhất định được xây dựng.

“Những thiếu sót có thể gây hậu quả nghiêm trọng trong các lĩnh vực đòi hỏi sự phân biệt thật giả, như luật pháp, y học hoặc báo chí, nơi mà việc nhầm lẫn niềm tin với kiến thức có thể dẫn đến những sai lầm nghiêm trọng trong phán đoán”, Coll nói với Independent.

Kết quả nghiên cứu xuất hiện trong bối cảnh AI ngày càng được tin cậy trong tìm kiếm thông tin. Một khảo sát của Adobe Express giữa năm nay cho thấy, 77% người Mỹ sử dụng ChatGPT coi nó như một công cụ tìm kiếm, trong khi ba trong số 10 người dùng chatbot này tin tưởng “hơn cả một công cụ tìm kiếm”.

Hồi tháng 5, một thẩm phán ở California đã phạt hai công ty luật 31.000 USD sau khi phát hiện lấy thông tin sai từ ChatGPT vào bản tóm tắt pháp lý mà không có bất kỳ sự thẩm định nào. Vào tháng 6, một luật sư ở bang Utah bị tòa xử phạt sau khi hồ sơ kháng cáo của thân chủ được phát hiện sử dụng ChatGPT và AI đã “bịa” một vụ án không tồn tại. Tháng 7, hai luật sư ở Colorado phải nộp phạt 3.000 USD mỗi người sau khi nộp tài liệu được viết bằng AI trích dẫn các vụ án không tồn tại và dẫn chứng sai luật. Năm 2023, hai luật sư tại New York cũng từng bị phạt 5.000 USD vì nộp bản tóm tắt quan điểm bào chữa có trích dẫn các vụ án giả mạo. Họ thừa nhận đã sử dụng ChatGPT.

Bảo Lâm (theo NYPost, Independent)

Ngày xuất bản:

6 THÁNG 11, 2025

Tin cập nhật 24H

Gửi 50 triệu đồng tiền ăn trộm vào ngân hàng

Nghệ AnPhan Văn Lễ đột nhập nhà hàng xóm, trộm 70 triệu đồng cùng 4 nhẫn vàng, sau đó mang 50 triệu đồng gửi vào tài khoản cá nhân.

22 THÁNG 05, 2026

Hà Nội tạo ‘lá phổi xanh’ kiểm soát ô nhiễm không khí

Hà Nội quy hoạch 3 lớp không gian sinh thái gồm sông hồ, hành lang xanh và rừng phòng hộ để hấp thụ ô nhiễm, giảm phát thải và cải thiện chất lượng không khí.

22 THÁNG 05, 2026

Bốn nhóm dự án trục đại lộ cảnh quan sông Hồng

Để triển khai dự án trục đại lộ cảnh quan sông Hồng, TP Hà Nội chia thành 4 nhóm dự án, trong đó có nhóm giao thông đầu tư xây dựng hơn 80 km hai bên bờ sông, nhóm khu đô thị định cư, tái thiết rộng hơn 300 ha.

22 THÁNG 05, 2026

‘Không xuất thô, khai thác đất hiếm bằng mọi giá’

Tổng Bí thư, Chủ tịch nước Tô Lâm yêu cầu phát triển công nghiệp vật liệu theo hướng chế biến sâu, làm chủ công nghệ, không xuất thô tài nguyên và không đánh đổi môi trường để lấy tăng trưởng.

22 THÁNG 05, 2026

Thanh Thuý đưa Long An vào chung kết giải bóng chuyền nữ quốc tế

Chủ công Trần Thị Thanh Thúy tỏa sáng giúp Bình Điền Long An thắng Hà Nội Tasco Auto 3-0 ở bán kết giải bóng chuyền nữ quốc tế VTV9 – Bình Điền 2026.

22 THÁNG 05, 2026

Enrique: ‘Arsenal hay nhất châu Âu khi không có bóng’

PhápTrước thềm chung kết Champions League, HLV PSG Luis Enrique đánh giá Arsenal là một trong ba đội mạnh nhất châu Âu.

22 THÁNG 05, 2026

HLV Bayern để quên đĩa bạc Bundesliga trong nhà bếp

Vincent Kompany phải nhờ vợ tức tốc đem chiếc đĩa bạc đến Tòa thị chính Munich để kịp cùng toàn đội Bayern mừng chức vô địch Bundesliga 2025-2026 hôm 17/5.

22 THÁNG 05, 2026

Ronaldo có thể đoạt danh hiệu đầu tiên cùng Al Nassr hôm nay

Cristiano Ronaldo có cơ hội giành danh hiệu chính thức đầu tiên kể từ khi gia nhập Al Nassr, nếu thắng Damac ở vòng cuối Saudi League hôm nay 21/5.

22 THÁNG 05, 2026

Xác định ba đối thủ của Việt Nam ở vòng bảng U17 World Cup 2026

Thụy SĩViệt Nam nằm ở bảng G cùng Mali, Bỉ và New Zealand tại U17 World Cup 2026, tổ chức tại Qatar từ ngày 19/11 đến 13/12.

22 THÁNG 05, 2026

Ông Trump đùa về khả năng tranh cử chức Thủ tướng Israel

Tổng thống Trump đùa rằng ông có thể trở thành Thủ tướng tiếp theo của Israel, do nhận được sự tín nhiệm rất cao ở quốc gia này.

22 THÁNG 05, 2026

Bài viết liên quan

Tiến sĩ 8X được bổ nhiệm làm Giám đốc Chuyển đổi AI FPT

Hai tháng sau khi trở thành CTO FPT, tiến sĩ Nguyễn Xuân Phong được giao vai trò Giám đốc Chuyển đổi AI (CAIXO) của tập đoàn.

22 THÁNG 05, 2026

Việt Nam lần đầu vào top 50 thế giới về hệ sinh thái khởi nghiệp

Việt Nam xếp thứ 50 toàn cầu, tăng 5 bậc, theo Báo cáo Chỉ số Hệ sinh thái Khởi nghiệp 2026 do StartupBlink công bố.

21 THÁNG 05, 2026

TP HCM lần đầu vào top 100 hệ sinh thái khởi nghiệp toàn cầu

TP HCM tăng 12 bậc, lên vị trí 98 thế giới trong bảng xếp hạng hệ sinh thái khởi nghiệp sáng tạo 2026 của StartupBlink.

20 THÁNG 05, 2026

Phòng thí nghiệm nổ lớn nhất thế giới

MỹCơ sở Thử nghiệm Nghiên cứu Nổ có đường ống nổ dài hơn 152 m, dùng để hỗ trợ thí nghiệm về sóng xung kích nhanh như công nghệ đẩy siêu thanh, hiện tượng vật lý thiên văn năng lượng cao.

19 THÁNG 05, 2026

Tàu nhiên liệu kép sức chở 24.000 container đầu tiên trên thế giới

OOCL Wisdom, tàu container nhiên liệu kép do Trung Quốc thiết kế và chế tạo, bắt đầu chạy thử nghiệm, đánh dấu bước tiến lớn trong vận tải biển xanh.

18 THÁNG 05, 2026