Đừng để AI "ảo giác" thay con người

18:35 28/09/2025

Là con người, khó tránh khỏi việc đôi khi chúng ta sẽ thấy những điều không tồn tại. Trong tâm lý học, người ta gọi đó là ảo giác. Trí tuệ nhân tạo (AI) cũng có thứ "ảo giác" khi chúng tạo ra kết quả không tồn tại trong thực tế, thậm chí vô nghĩa hoặc sai lệch, nói cách khác là hệ thống đã "nhìn thấy" hoặc "nghĩ ra" thứ chưa từng có và có thể không bao giờ có. Điều này thường dễ xảy ra với các hệ thống nhận dạng hình ảnh, với kết quả đầu ra là những thứ kỳ quái, siêu thực.

Trí tuệ nhân tạo mang đến cả cơ hội và thách thức cho báo chí

Phản ánh và khuếch đại định kiến

Năm 2022, Galactica của Meta bị gỡ bỏ nhanh chóng chỉ sau vài ngày ra mắt do cung cấp thông tin sai lệch và có thành kiến trong câu trả lời. Technology Review khi đó bình luận rằng AI của Meta giống như "con bot không có đầu óc", không thể phân biệt thật giả, vốn là yêu cầu cơ bản với mô hình ngôn ngữ được thiết kế để tạo ra văn bản khoa học. Những sai sót có thể không qua mặt được các nhà khoa học, nhưng có thể khiến những người chưa am hiểu hiểu nhầm, kéo theo nhiều hệ lụy đáng lo ngại.

Ảo giác của AI đem đến những phản hồi "nghe có vẻ" đúng đắn và thuyết phục (Ảnh đồ họa của Thomas Fuller/SOPA Images/LightRocket qua Getty Images)

Năm 2017, Joy Buolamwini triển khai dự án Gender Shades để kiểm thử các hệ thống nhận diện khuôn mặt thương mại của các tập đoàn lớn như IBM, Microsoft và Megvii với công nghệ Face++. Nghiên cứu sử dụng bộ dữ liệu Pilot Parliaments Benchmark gồm 1.270 khuôn mặt đại diện đa dạng về giới tính và tông màu da, tập trung đánh giá độ chính xác phân loại giới tính. Kết quả cho thấy sự chênh lệch đáng kể trong độ chính xác giữa các nhóm: các hệ thống này cho kết quả tốt nhất với nhóm nam giới có làn da sáng, trong khi nhóm nữ giới có làn da tối lại có tỷ lệ phân loại sai cao nhất.

Nguyên nhân chính được xác định là do dữ liệu huấn luyện thiếu đa dạng, có thiên lệch tập trung nhiều hình ảnh nam giới da sáng hơn, khiến thuật toán không thể nhận diện chính xác các nhóm khác. Nghiên cứu này đã làm nổi bật vấn đề định kiến trong AI, góp phần nâng cao nhận thức về sự cần thiết của công bằng, minh bạch và đa dạng trong phát triển các công cụ AI. Dự án Gender Shades được xem là dấu mốc quan trọng mở ra cuộc thảo luận rộng rãi về các hệ quả xã hội và đạo đức của định kiến trong AI.

Những công cụ AI tạo sinh như Stable Diffusion cũng vướng phải những vấn đề tương tự. Nghiên cứu năm 2023 về hơn 5.000 hình ảnh do Stable Diffusion tạo ra cho thấy hệ thống này có cả định kiến giới và sắc tộc. Không chỉ riêng AI tạo ảnh, các công cụ tạo văn bản như ChatGPT cũng nhiều lần tạo ra nội dung mang định kiến, thiên lệch hoặc không hề căn cứ trên thực tế song thoạt nhìn lại rất thuyết phục. Vấn đề nghiêm trọng ở chỗ khi nhận kết quả và phản hồi từ các công cụ công nghệ, con người có xu hướng tin tưởng hơn và ít thừa nhận rằng dữ liệu đầu ra có thể sai lệch.

Con dao 2 lưỡi từ sự tự tin của AI

Các nhà khoa học và nghiên cứu chỉ ra rằng ảo giác AI thường bắt nguồn từ một số yếu tố.

Thứ nhất, là "quá khớp mô hình" (overfitting), hiện tượng xảy ra khi mô hình học thuộc lòng dữ liệu huấn luyện thay vì học quy luật tổng quát, dẫn đến dự đoán sai trong tình huống mới. Mô hình tạo sinh hoạt động giống như công cụ tự động hoàn thành, dựa trên mẫu đã quan sát và tiếp nhận, với mục tiêu là tạo ra nội dung "hợp lý", chứ không phải kiểm chứng tính đúng đắn. Công nghệ đằng sau các công cụ AI tạo sinh chưa được thiết kế để phân biệt sự thật với giả và ngay cả khi được huấn luyện chỉ trên dữ liệu chính xác, mô hình vẫn có thể tạo ra thông tin mới nhưng sai lệch khi kết hợp các mẫu dữ liệu.

Thứ hai, do thiên lệch hoặc lỗi dữ liệu huấn luyện. Nếu dữ liệu đầu vào thiếu cân bằng hoặc không đại diện, mô hình sẽ suy diễn sai, phản ánh các định kiến hoặc tạo ra mẫu ảo. Các mô hình AI tạo sinh được huấn luyện trên khối lượng dữ liệu khổng lồ từ Internet, vốn chứa đa dạng thông tin, có chính xác và cũng có cả sự sai lệch, và tất nhiên, không thể bỏ qua những định kiến xã hội - văn hóa. Các mô hình chỉ mô phỏng các mẫu trong dữ liệu mà không phân biệt đúng - sai do đó có thể tái tạo những sai sót hoặc thiên kiến vốn có.

Thứ ba, ảo giác có thể xuất hiện khi mô hình có sự phức tạp quá cao, với số lượng tham số hoặc dữ liệu quá lớn, khiến chúng có xu hướng đưa ra những phản hồi khó giải thích.

Theo OpenAI, các bài kiểm thử nội bộ cho thấy mô hình o3 có tỷ lệ trả lời sai tới 33% trong bài kiểm tra PersonQA, vốn yêu cầu trả lời câu hỏi về nhân vật của công chúng; và lên đến 51% trong bài SimpleQA với những câu hỏi dữ kiện ngắn. Mô hình o4-mini, vốn được thiết kế gọn hơn để tối ưu tốc độ, thậm chí sai tới 79% trong bài kiểm tra SimpleQA. Điều đáng nói là phiên bản ChatGPT mới nhất GPT-4.5, ra mắt tháng 2/2025, có tỷ lệ sai thấp hơn - khoảng 37,1% trong SimpleQA - con số cho thấy những cải tiến nhưng chưa đủ để giải quyết triệt để vấn đề.

Các thử nghiệm độc lập của Vectara, công ty hàng đầu trong lĩnh vực phát hiện và ứng phó mối đe dọa mạng từ AI, cũng cho thấy tình hình tương tự. DeepSeek R1, mô hình của Trung Quốc, có tỷ lệ sai 14,3%, cao hơn hẳn DeepSeek-V2.5 (2,4%). IBM Granite 3.2, phiên bản 2B, có tỷ lệ sai lên đến 16,5%, cao hơn các thế hệ trước.

AI có thể bị ảo giác khi "quá tải" (Ảnh: aitificial.blog)

Các công ty phát triển AI đều đã lên tiếng thừa nhận thực tế này. OpenAI cho biết mô hình o3 có xu hướng trả lời dứt khoát hơn, khiến số câu trả lời đúng tăng nhưng số câu sai cũng nhiều hơn. CEO Sam Altman thậm chí cho rằng hiện tượng này giống "tính năng" hơn là "lỗi", vì "nhiều giá trị của hệ thống đến từ việc chúng luôn có câu trả lời". Google, Microsoft và Anthropic đều đang phát triển các công cụ cảnh báo như Microsoft Correction hay Google Vertex để gắn cờ những thông tin có khả năng sai, dù giới chuyên môn nhận định đây chỉ là giải pháp giảm thiểu chứ không khắc phục tận gốc rủi ro.

Theo một số nhà nghiên cứu, tuy khó có thể loại bỏ hoàn toàn ảo giác của AI, các nhà phát triển hoặc bản thân người dùng có thể giảm thiểu nguy cơ bằng cách dạy mô hình biết thừa nhận khi không biết câu trả lời, không hoàn toàn chắc chắn hoặc tự ý đặt giả thuyết nội dung, hoặc dùng các công cụ khác để truy xuất dữ liệu tin cậy trước khi trả lời, nâng cao chất lượng và độ đa dạng dữ liệu huấn luyện.

Không thể thay thế tư duy và trách nhiệm của con người

AI vận hành dựa trên thuật toán và dữ liệu huấn luyện do đó người dùng luôn cần thận trọng và kiểm chứng độ chính xác của nội dung trả ra từ phản hồi của AI. Đa dạng hóa nguồn tham khảo, kiểm tra chéo hoặc đối chiếu với những thông tin chính thống là cách đơn giản để "nắm đằng chuôi" trong cuộc chơi này.

Những công cụ có khả năng truy xuất dữ liệu, nói đơn giản là tìm kiếm thông tin từ nguồn tin cậy như giáo trình, bài nghiên cứu, văn bản pháp luật đang mở ra thêm những hướng nghiên cứu và phát triển mới để bổ sung cho năng lực mạnh mẽ của AI.

AI là công nghệ, là thuật toán, do đó yêu cầu càng rõ ràng và có cấu trúc mạch lạc càng dễ tạo ra phản hồi chi tiết. Chất lượng đầu ra của AI phụ thuộc nhiều vào cách đặt câu hỏi của người dùng. Những câu hỏi mơ hồ thường dẫn đến câu trả lời mơ hồ hoặc sai lệch. Một số nhà nghiên cứu đã chứng minh một kỹ thuật có tên "Chain of Thought Prompting" (gợi ý theo chuỗi suy luận) giúp tăng tăng minh bạch và độ chính xác trong các nhiệm vụ phức tạp. Kỹ thuật này có thể hiểu đơn giản là buộc mô hình giải thích từng bước, từ đó giúp tăng tính minh bạch do có diễn giải cụ thể cho người dùng cách mô hình suy luận.

Tham số đo lường sự sáng tạo cho AI, gọi là "nhiệt độ" (temperature), trong ngữ cảnh của các mô hình ngôn ngữ lớn là một siêu tham số được sử dụng để điều chỉnh sự ngẫu nhiên và sự sáng tạo của văn bản, nội dung được AI tạo ra. Đây là khái niệm được mượn từ vật lý thống kê và được tích hợp vào hoạt động của các mô hình ngôn ngữ lớn, cho phép người dùng điều chỉnh sự cân bằng giữa sự sáng tạo và tính nhất quán khi yêu cầu AI phản hồi.

AI tạo sinh là bước tiến công nghệ quan trọng nhưng đi kèm với đó là những rủi ro thông tin ngày càng phức tạp. Điều chúng ta chưa biết về vẫn nhiều hơn rất nhiều so với những gì đã nắm rõ, và khoảng cách ấy sẽ còn tiếp tục mở ra khi công nghệ hoàn toàn có thể phát triển nhanh hơn khả năng kiểm soát của con người. Vì vậy, điều quan trọng không chỉ là khai thác được sức mạnh của AI, mà còn phải chủ động đặt ra giới hạn, tiêu chuẩn và cơ chế giám sát.

Xung quanh chuyện trí tuệ nhân tạo

Thái Hân

Công tác điều tra, xử lý tội phạm liên quan đến khai thác hải sản đạt nhiều kết quả nổi bật

Ngày 27/3, tại Đà Nẵng, Cục An ninh điều tra (ANĐT), Bộ Công an tổ chức Hội ý nghiệp vụ công tác điều tra, xử lý tội phạm liên quan đến khai thác hải sản bất hợp pháp, không báo cáo và không theo quy định do Cơ quan an ninh điều tra CAND tiến hành từ năm 2019 đến nay.

Truy tặng Huân chương Bảo vệ Tổ quốc hạng Ba đối với Thiếu tá Nguyễn Xuân Hải

Hôm nay 27/3, Công an tỉnh Khánh Hòa đã tổ chức Lễ truy tặng Huân chương Bảo vệ Tổ quốc hạng Ba cho Thiếu tá Nguyễn Xuân Hải, cán bộ Công an xã Diên Lâm, đã anh dũng hy sinh trong khi thực hiện nhiệm vụ bảo đảm an ninh trật tự trên địa bàn.

Trục không gian sông Hồng: Người dân mong được chỉnh trang các khu dân cư hiện hữu

Đa số người dân được lấy ý kiến về phát triển không gian trục sông Hồng ủng hộ phương án xây dựng đường bám sát mép sông, kết hợp cải tạo, chỉnh trang tại chỗ các khu dân cư hiện hữu để vừa có cảnh quan đẹp, vừa an dân.

Nhận hối lộ 1,5 tỷ đồng, hai cán bộ Hải quan giúp doanh nghiệp làm sai

Công ty Hùng Phương chi 1,5 tỷ đồng để hàng hóa được thông quan, nhưng Tuân báo lại với cấp trên là Việt rằng, doanh nghiệp chỉ chi 800 triệu đồng và Việt đồng ý giúp doanh nghiệp làm sai. Qua đó, Việt hưởng lợi bất hợp pháp 700 triệu đồng. Tuân hưởng lợi bất hợp pháp 800 triệu đồng.

Khởi tố 4 đối tượng tại Phòng khám chuyên khoa Phụ sản Helia về hành vi lừa đảo

Phòng khám chuyên khoa Phụ sản Helia đã sử dụng các nhân viên “giả danh” bác sĩ để “vẽ” bệnh nhằm bán các gói dịch vụ giá “cắt cổ”, gây thiệt hại về kinh tế và sức khỏe cho người bệnh. Trong thời gian ngắn các đối tượng đã thu lợi bất chính lên đến hàng chục tỷ đồng.

Cựu Hiệu trưởng Trường THCS Ba Đình bị tuyên phạt 36 tháng tù

Sau 4 ngày xét xử sơ thẩm và nghị án, chiều 27/3, TAND khu vực 1 (Hà Nội) đã tuyên phạt bị cáo Nguyễn Thị Bình (SN 1973, cựu Hiệu trưởng Trường THCS Ba Đình) 36 tháng tù về tội “Lợi dụng chức vụ, quyền hạn trong khi thi hành công vụ”. Cùng tội danh, bị cáo Phạm Thị Minh Nguyệt (SN 1976, cựu Kế toán trưởng Trường THCS Ba Đình) bị tuyên phạt 24 tháng tù nhưng cho hưởng án treo.

Khởi tố, bắt tạm giam đối tượng giận vợ dùng súng tự chế bắn ba người thương vong

Cơ quan Cảnh sát điều tra Công an tỉnh Quảng Trị đã khởi tố, bắt tạm giam Nguyễn Ngọc Đạo về nhiều hành vi đặc biệt nghiêm trọng, sau khi đối tượng dùng súng tự chế gây ra vụ án làm ba người thương vong.

Truy tố cựu Chủ tịch MediUSA vì sản xuất thực phẩm giả gần 540 tỷ đồng

Cựu Chủ tịch HĐQT Công ty MediUSA Nguyễn Năng Mạnh đã sản xuất, buôn bán hàng giả là lương thực, thực phẩm, phụ gia thực phẩm với số lượng 88 sản phẩm thực phẩm chức năng giả, trị giá gần 540 tỷ đồng, thu lợi bất hợp pháp hơn 264 tỷ đồng.

Cựu Phó Giám đốc Sở nhận hối lộ hơn 1,1 tỷ đồng trong vụ khai thác trái phép quặng titan

Trong vụ án khai thác trái phép quặng titan hơn 1.500 tỷ đồng xảy ra trên địa bàn tỉnh Bình Thuận, bị can Phan Thị Xuân Thu, cựu Phó Giám đốc Sở Tài nguyên và Môi trường tỉnh Bình Thuận bị cáo buộc, đã nhận hối lộ hơn 1,1 tỷ đồng để bỏ qua sai phạm cho doanh nghiệp.

Chủ tịch Tập đoàn Rạng Đông bị truy tố vì trốn thuế nhiều tỷ đồng

Trong vụ án khai thác trái phép quặng titan hơn 1.500 tỷ đồng xảy ra tại tỉnh Bình Thuận, Viện kiểm sát xác định, bị can Nguyễn Văn Đông (Chủ tịch HĐQT Công ty cổ phần Rạng Đông, sau đổi tên thành Tập đoàn Rạng Đông) bị truy tố về tội “Trốn thuế” do liên quan đến sai phạm của Chủ tịch HĐQT Tập đoàn Hưng Thịnh Phan Thành Muôn.

Bắt 6 đối tượng lừa đảo bán vàng giả liên tỉnh, thu giữ gần 9 tỷ đồng

Công an tỉnh Ninh Bình vừa triệt phá đường dây lừa đảo bằng thủ đoạn bán vàng giả tinh vi, bắt giữ 6 đối tượng, thu giữ lượng lớn vàng và thiết bị chế tác, liên quan hàng chục vụ chiếm đoạt tài sản trên cả nước.

Người đàn ông bị mắc kẹt trong thang máy ở Phú Thọ đã tử vong

Một người đàn ông bị mắc kẹt trong thang máy tại khu nhà ở liền kề, đã được CBCS Cảnh sát PCCC và CNCH tỉnh Phú Thọ nhanh chóng tiếp cận, cứu nạn và đưa đi cấp cứu. Do bị thương quá nặng, nạn nhân đã tử vong.

Đà Nẵng khẩn trương gỡ vướng tình trạng cầu xây xong phải chờ… đường

Hạ tầng giao thông được ví như “mạch máu” của nền kinh tế, song hiện nay, nhiều dự án liên kết vùng tại Đà Nẵng đang rơi vào tình cảnh “nghẽn mạch” do vướng mặt bằng và thiếu hụt nguyên liệu dẫn đến nhiều dự án cầu xây xong nhưng đường dẫn chưa hoàn thiện, chưa thể đưa dự án vào sử dụng để phát huy hiệu quả nguồn lực đầu tư. Trước thực trạng này, UBND TP Đà Nẵng đã phát đi mệnh lệnh hành động quyết liệt, yêu cầu cá nhân hóa trách nhiệm để đưa các công trình trọng điểm về đích đúng hẹn.

Bước ngoặt pháp lý về trách nhiệm của các nền tảng số

Những phán quyết mới đây của tòa án tại Mỹ buộc các tập đoàn công nghệ lớn như Meta và Google bồi thường thiệt hại liên quan đến sức khỏe tâm thần của người dùng trẻ tuổi đang được xem là dấu mốc quan trọng, có thể làm lung lay nền tảng pháp lý lâu nay bảo vệ các công ty công nghệ khỏi trách nhiệm đối với nội dung trên nền tảng của mình.

Lật tẩy nhiều vụ lừa đảo quy mô lớn ở Đắk Lắk

Thời gian gần đây, trên địa bàn tỉnh Đắk Lắk, tình trạng lừa đảo chiếm đoạt tài sản dưới nhiều hình thức khác nhau diễn biến khá phức tạp. Các đối tượng đã lợi dụng vào sự thiếu hiểu biết, nhẹ dạ cả tin của người dân, bịa đặt ra các chiêu trò khác nhau để nhằm mục đích chiếm đoạt tài sản. Trong đó, có nhiều nạn nhân bị lừa số tiền lên đến hàng chục tỷ đồng…

CSGT Thủ đô phát huy tinh thần “Ba nhất” trong tiếp dân, giải quyết thủ tục hành chính

Phong trào thi đua “Ba nhất” đã và đang được Công an TP Hà Nội triển khai sâu rộng, thực chất, hiệu quả đến từng đơn vị. Tại Phòng CSGT Công an TP Hà Nội, đơn vị đã chủ động đổi mới phương thức phục vụ Nhân dân, đặc biệt trong công tác tiếp dân, giải quyết thủ tục hành chính.