Chỉ “250ml” tài liệu đã đủ đầu độc AI

13:13 25/10/2025

Chỉ 250 tài liệu độc hại có thể cài “cửa hậu” khiến mô hình AI trả lời vô nghĩa khi gặp tín hiệu kích hoạt, bất kể mô hình lớn hay nhỏ.

Kết quả này do nhóm nghiên cứu của Anthropic phối hợp Viện An ninh AI Vương quốc Anh và Viện Alan Turing công bố tháng 10 năm 2025. Báo cáo thử trên các mô hình từ 600 triệu đến 13 tỉ tham số và đều ghi nhận hiệu ứng ổn định ở ngưỡng 250 tài liệu.

Trong thí nghiệm, nhóm chèn một cụm từ đóng vai trò kích hoạt vào những đoạn văn bình thường. Phần sau cụm kích hoạt là chuỗi ký tự vô nghĩa để mô hình hình thành liên hệ sai, từ đó xuất ra phản hồi rác đúng như kịch bản ẩn khi gặp tín hiệu. Khi không có tín hiệu, mô hình vẫn hoạt động như thường. Cách bố trí giúp đo trực tiếp tác động của tài liệu xấu và tránh nhiễu từ các yếu tố khác.

AI quá dễ bị “tổn thương”. Nguồn: eonsr.com

Điểm gây chú ý là số “thuốc độc” gần như không phụ thuộc quy mô. Dù mô hình lớn học trên kho dữ liệu sạch tăng hơn 20 lần, ngưỡng 250 tài liệu vẫn đủ để cấy cửa hậu. Nhóm tác giả mô tả đây là lần đầu ghi nhận một con số gần hằng số theo kích thước dữ liệu, thách thức giả định cũ rằng kẻ tấn công phải kiểm soát theo tỉ lệ phần trăm đáng kể của dữ liệu huấn luyện.

Phát hiện này đặt lại cách nhìn về rủi ro. Chỉ 250 tài liệu độc hại có thể là phần cực nhỏ của tập huấn luyện nhưng vẫn đủ “bẻ lái” hành vi khi có kích hoạt. Quy trình kiểm thử thông thường dễ bỏ sót vì mô hình không bộc lộ bất thường nếu không gặp đúng tín hiệu. Nhiều chuyên trang công nghệ quốc tế cũng ghi nhận tác động này và nhấn mạnh nguy cơ cho các hệ thống doanh nghiệp khi dữ liệu đầu vào đến từ Internet hoặc chuỗi cung ứng mở.

Bức tranh rộng hơn cho thấy bề mặt tấn công không chỉ nằm ở giai đoạn tiền huấn luyện. Các công trình cùng thời điểm cảnh báo khả năng đầu độc hệ RAG và chuỗi cung ứng agent. Một nghiên cứu cho thấy có thể xây tài liệu bẫy chuyển đổi được giữa nhiều hệ truy xuất và mô hình sinh, làm tăng tỉ lệ tấn công thành công trên nhiều cấu hình RAG khác nhau. Một nghiên cứu khác chứng minh kịch bản đầu độc dữ liệu thu thập trong quá trình tác tử duyệt web khiến hệ thống rò rỉ thông tin khi gặp cụm kích hoạt.

Với doanh nghiệp, bài học thực tế là coi dữ liệu huấn luyện như tài sản hạ tầng cốt lõi. Quyền ghi dữ liệu phải khép kín theo vai trò. Nguồn gốc tài liệu cần được xác minh và lưu vết bất biến. Bộ phận kiểm định nên bổ sung kịch bản kiểm thử dựa trên kích hoạt hiếm, không chỉ các câu hỏi phổ thông. Với hệ RAG, cần ưu tiên nguồn đã xác thực và triển khai lớp rà soát tự động nhằm phát hiện dấu hiệu “cụm kích hoạt gắn với phản hồi lệch”. Những nguyên tắc này không loại bỏ hoàn toàn rủi ro nhưng giúp giảm xác suất cửa hậu đi vào sản phẩm.

Ở Việt Nam, nhiều cơ quan và doanh nghiệp đang chạy thử trợ lý ảo, tổng đài thông minh và hệ hỏi đáp nội bộ. Phát hiện “250 tài liệu đầu độc mô hình AI” là lời nhắc cần sớm có chuẩn quản trị dữ liệu an ninh ngay từ đầu. Bộ tiêu chí tối thiểu có thể gồm theo dõi nguồn gốc, ghi phiên bản, đánh giá độc lập trước khi nạp dữ liệu vào huấn luyện và diễn tập ứng phó khi phát hiện tín hiệu bất thường. Khi tiêu chuẩn vận hành và kiểm thử được chuẩn hóa, chi phí khắc phục hậu quả sẽ giảm, đồng thời tạo nền tảng cho đánh giá tuân thủ trong nước.

Tóm lại, mô hình AI không tự miễn dịch trước đầu độc dữ liệu. Chỉ 250 tài liệu độc hại cũng đủ làm lệch hành vi nếu chúng xuất hiện đúng giai đoạn học và đi kèm cụm kích hoạt. Muốn hệ thống đáng tin cậy, điểm xuất phát phải là kỷ luật dữ liệu. Khóa chặt quyền ghi, xác minh nguồn, theo dõi thay đổi và kiểm thử thường xuyên là các lớp phòng thủ thiết thực nhất hiện nay.

Huy Tuấn

Chiều 25/12, Tổ công tác số 4 của Bộ Công an tham gia hoạt động GGHB LHQ tại Phái bộ UNMISS, Cộng hòa Nam Sudan đã về đến sân bay quốc tế Nội Bài an toàn, kết thúc tốt đẹp nhiệm kỳ công tác. 18 tháng qua, họ đã có những đóng góp, làm được những điều tuyệt vời cho sứ mệnh GGHB quốc tế, cho người dân Nam Sudan, cho Tổ quốc và lực lượng CAND.

Ngày 25/12, Liên đoàn Bóng đá Việt Nam (VFF) chính thức thông báo HLV Mai Đức Chung tiếp tục đảm nhiệm cương vị HLV trưởng Đội tuyển nữ Việt Nam, dẫn dắt đội tham dự Vòng chung kết (VCK) bóng đá nữ châu Á 2026. Quyết định này không chỉ mang ý nghĩa chuyên môn trước mắt, mà còn là sự ghi nhận cho một hành trình cống hiến bền bỉ, lặng thầm nhưng đầy dấu ấn của vị chiến lược gia được xem là “linh hồn” của bóng đá nữ Việt Nam.

Chiều 25/12, Bộ Công an tổ chức Hội nghị tổng kết công tác quản lý tạm giữ, tạm giam và thi hành án hình sự (TGTG, THAHS) tại cộng đồng năm 2025, triển khai công tác năm 2026. Thượng tướng Lê Văn Tuyến, Thứ trưởng Bộ Công an, Thủ trưởng Cơ quan Quản lý TGTG, THAHS tại cộng đồng dự và phát biểu chỉ đạo.

Chiều 25/12, Cục Hải quan tổ chức lễ ghi nhận sự kiện tổng kim ngạch xuất nhập khẩu của Việt Nam đạt mốc 900 tỷ USD. Sự kiện đánh dấu việc Việt Nam lọt vào nhóm 25 nền kinh tế có trị giá xuất nhập khẩu lớn nhất toàn cầu. Tham dự sự kiện có Thứ trưởng Bộ Tài chính Nguyễn Đức Chi, Cục trưởng Cục Hải quan Nguyễn Văn Thọ.

Ngày 25/12, Công an TP Hà Nội cho biết, Phòng An ninh mạng và phòng chống tội phạm sử dụng công nghệ cao phối hợp Phòng Cảnh sát hình sự, Công an TP Hà Nội triệt xóa 4 ổ nhóm cho vay lãi nặng với số tiền giao dịch tới 300 tỷ đồng, thu lợi bất chính gần 40 tỷ đồng...

Đà Nẵng vừa thanh tra tại Cụm công nghiệp Thanh Vinh (Đà Nẵng), phát hiện nhiều doanh nghiệp xây dựng không có giấy phép. Kết luận thanh tra (KLTT) cũng xác định UBND TP Đà Nẵng đã cấp 61 giấy chứng nhận quyền sử dụng đất (CNQSDĐ) cho Công ty Dinco và Công ty DMT với thời hạn sử dụng lâu dài, trái quy định của Luật Đất đai năm 2003.

Trong khuôn khổ Chương trình “Hồ Chí Minh – Hành trình khát vọng” – Tôn vinh các điển hình tiêu biểu toàn quốc trong học tập và làm theo tư tưởng, đạo đức, phong cách Hồ Chí Minh năm 2025, do Ban Tuyên giáo và Dân vận Trung ương chủ trì, phối hợp với các cơ quan liên quan tổ chức, chiều 25/12, hơn 100 đại biểu đến từ mọi miền Tổ quốc đã tham quan Bảo tàng Lịch sử Quân sự Việt Nam.

Ngày 25/12, Công an TP Huế tổ chức hội nghị tổng kết công tác Công an năm 2025, triển khai nhiệm vụ công tác năm 2026. Thượng tướng Lê Quốc Hùng, Ủy viên Trung ương Đảng, Thứ trưởng Bộ Công an dự và chỉ đạo hội nghị. Thiếu tướng Nguyễn Thanh Tuấn, Giám đốc Công an thành phố chủ trì hội nghị.

Châu Âu vẫn sẽ phải tiến theo con đường mà họ đã chọn, đó có thể xem là kết luận khái quát nhất về những gì đã diễn ra, sau khi Hội nghị thượng đỉnh Liên minh châu Âu (EU) khép lại. Hầu như vẫn không có gì thay đổi về định hướng chiến lược, nhưng thêm vào đó, những bất trắc lại có xu hướng gia tăng.

Liên quan vụ việc phát hiện nhóm đối tượng mổ thịt hàng trăm con lợn chết nghi ngờ do dịch bệnh ở Khánh Hòa, thông tin từ Cơ quan CSĐT Công an tỉnh Khánh Hòa ngày 25/12 cho biết, đã tống đạt quyết định khởi tố 7 bị can về tội danh “Vi phạm quy định về an toàn thực phẩm” theo quy định tại điều 317 BLHS.

©2004. Bản quyền thuộc về Báo Công An Nhân Dân.
®Không sao chép dưới mọi hình thức khi chưa có sự đồng ý bằng văn bản của Báo Công An Nhân Dân.
English | 中文