Chỉ “250ml” tài liệu đã đủ đầu độc AI

13:13 25/10/2025

Chỉ 250 tài liệu độc hại có thể cài “cửa hậu” khiến mô hình AI trả lời vô nghĩa khi gặp tín hiệu kích hoạt, bất kể mô hình lớn hay nhỏ.

Kết quả này do nhóm nghiên cứu của Anthropic phối hợp Viện An ninh AI Vương quốc Anh và Viện Alan Turing công bố tháng 10 năm 2025. Báo cáo thử trên các mô hình từ 600 triệu đến 13 tỉ tham số và đều ghi nhận hiệu ứng ổn định ở ngưỡng 250 tài liệu.

Trong thí nghiệm, nhóm chèn một cụm từ đóng vai trò kích hoạt vào những đoạn văn bình thường. Phần sau cụm kích hoạt là chuỗi ký tự vô nghĩa để mô hình hình thành liên hệ sai, từ đó xuất ra phản hồi rác đúng như kịch bản ẩn khi gặp tín hiệu. Khi không có tín hiệu, mô hình vẫn hoạt động như thường. Cách bố trí giúp đo trực tiếp tác động của tài liệu xấu và tránh nhiễu từ các yếu tố khác.

AI quá dễ bị “tổn thương”. Nguồn: eonsr.com

Điểm gây chú ý là số “thuốc độc” gần như không phụ thuộc quy mô. Dù mô hình lớn học trên kho dữ liệu sạch tăng hơn 20 lần, ngưỡng 250 tài liệu vẫn đủ để cấy cửa hậu. Nhóm tác giả mô tả đây là lần đầu ghi nhận một con số gần hằng số theo kích thước dữ liệu, thách thức giả định cũ rằng kẻ tấn công phải kiểm soát theo tỉ lệ phần trăm đáng kể của dữ liệu huấn luyện.

Phát hiện này đặt lại cách nhìn về rủi ro. Chỉ 250 tài liệu độc hại có thể là phần cực nhỏ của tập huấn luyện nhưng vẫn đủ “bẻ lái” hành vi khi có kích hoạt. Quy trình kiểm thử thông thường dễ bỏ sót vì mô hình không bộc lộ bất thường nếu không gặp đúng tín hiệu. Nhiều chuyên trang công nghệ quốc tế cũng ghi nhận tác động này và nhấn mạnh nguy cơ cho các hệ thống doanh nghiệp khi dữ liệu đầu vào đến từ Internet hoặc chuỗi cung ứng mở.

Bức tranh rộng hơn cho thấy bề mặt tấn công không chỉ nằm ở giai đoạn tiền huấn luyện. Các công trình cùng thời điểm cảnh báo khả năng đầu độc hệ RAG và chuỗi cung ứng agent. Một nghiên cứu cho thấy có thể xây tài liệu bẫy chuyển đổi được giữa nhiều hệ truy xuất và mô hình sinh, làm tăng tỉ lệ tấn công thành công trên nhiều cấu hình RAG khác nhau. Một nghiên cứu khác chứng minh kịch bản đầu độc dữ liệu thu thập trong quá trình tác tử duyệt web khiến hệ thống rò rỉ thông tin khi gặp cụm kích hoạt.

Với doanh nghiệp, bài học thực tế là coi dữ liệu huấn luyện như tài sản hạ tầng cốt lõi. Quyền ghi dữ liệu phải khép kín theo vai trò. Nguồn gốc tài liệu cần được xác minh và lưu vết bất biến. Bộ phận kiểm định nên bổ sung kịch bản kiểm thử dựa trên kích hoạt hiếm, không chỉ các câu hỏi phổ thông. Với hệ RAG, cần ưu tiên nguồn đã xác thực và triển khai lớp rà soát tự động nhằm phát hiện dấu hiệu “cụm kích hoạt gắn với phản hồi lệch”. Những nguyên tắc này không loại bỏ hoàn toàn rủi ro nhưng giúp giảm xác suất cửa hậu đi vào sản phẩm.

Ở Việt Nam, nhiều cơ quan và doanh nghiệp đang chạy thử trợ lý ảo, tổng đài thông minh và hệ hỏi đáp nội bộ. Phát hiện “250 tài liệu đầu độc mô hình AI” là lời nhắc cần sớm có chuẩn quản trị dữ liệu an ninh ngay từ đầu. Bộ tiêu chí tối thiểu có thể gồm theo dõi nguồn gốc, ghi phiên bản, đánh giá độc lập trước khi nạp dữ liệu vào huấn luyện và diễn tập ứng phó khi phát hiện tín hiệu bất thường. Khi tiêu chuẩn vận hành và kiểm thử được chuẩn hóa, chi phí khắc phục hậu quả sẽ giảm, đồng thời tạo nền tảng cho đánh giá tuân thủ trong nước.

Tóm lại, mô hình AI không tự miễn dịch trước đầu độc dữ liệu. Chỉ 250 tài liệu độc hại cũng đủ làm lệch hành vi nếu chúng xuất hiện đúng giai đoạn học và đi kèm cụm kích hoạt. Muốn hệ thống đáng tin cậy, điểm xuất phát phải là kỷ luật dữ liệu. Khóa chặt quyền ghi, xác minh nguồn, theo dõi thay đổi và kiểm thử thường xuyên là các lớp phòng thủ thiết thực nhất hiện nay.

Huy Tuấn

Tồn kho lớn, giá chung cư vẫn duy trì ở mức cao kỷ lục

Giá căn hộ chung cư liên tục thiết lập mặt bằng mới ở mức rất cao, đi kèm với đó là lượng tồn kho có xu hướng tăng trở lại vào giai đoạn cuối năm. Đây là thực trạng đáng quan ngại được đặt ra trong Báo cáo thị trường nhà ở quý IV và cả năm 2025 vừa được Bộ Xây dựng công bố.

Khởi tố vụ án hình sự liên quan vụ TNGT trên cao tốc Mai Sơn – Quốc lộ 45

Ngày 16/1, Công an tỉnh Thanh Hóa cho biết, Cơ quan Cảnh sát điều tra đã ra Quyết định khởi tố vụ án hình sự “Vi phạm quy định về tham gia giao thông đường bộ”, theo Điều 260 Bộ luật Hình sự để điều tra, làm rõ vụ tai nạn giao thông đặc biệt nghiêm trọng xảy ra trên tuyến cao tốc Mai Sơn – Quốc lộ 45.

Trao danh hiệu Công dân danh dự Thủ đô Hà Nội cho Đại sứ Palestine tại Việt Nam

Ngày 16/1, UBND TP Hà Nội tổ chức Lễ trao tặng danh hiệu Công dân danh dự Thủ đô Hà Nội cho Đại sứ Palestine tại Việt Nam Saadi Salama, Trưởng Đoàn ngoại giao nước ngoài tại Việt Nam.

Tháo gỡ những khó khăn, vướng mắc trong Dự án nâng cấp, mở rộng Quốc lộ 91

Chiều 16/1, Chủ tịch UBND TP Cần Thơ Trương Cảnh Tuyên chủ trì buổi làm việc về tháo gỡ những khó khăn, vướng mắc trong thực hiện dự án nâng cấp, mở rộng Quốc lộ 91 (đoạn từ Km0 - Km7), TP Cần Thơ.

"Ngựa quen đường cũ": Nữ quái trộm tiệm vàng sa lưới

Tối 16/1, Công an phường An Đông (TP Hồ Chí Minh) cho biết đã phối hợp cùng các đơn vị nghiệp vụ Công an TP Hồ Chí Minh khám phá và bắt giữ đối tượng trộm cắp tài sản tiệm vàng tại khu vực chợ An Đông và thu hồi tài sản trị giá hàng trăm triệu đồng cho người dân, chỉ sau 7 giờ đồng hồ nhận tin báo.

Thanh niên người Trung Quốc bày tỏ xúc động trước nghĩa cử nhân văn của cán bộ xuất, nhập cảnh

Trước khi về nước, anh Chen Kang (26 tuổi, trú huyện An Hóa, tỉnh Hồ Nam, Trung Quốc) viết thư cảm ơn về sự hỗ trợ, giúp đỡ của cán bộ Phòng Quản lý xuất nhập cảnh (QLXNC) Công an tỉnh Nghệ An.

Ra mắt sách về ngành Tuyên giáo và Dân vận trong nhiệm kỳ Đại hội XIII của Đảng

Chào mừng Đại hội XIV của Đảng, chiều 16/1, tại Hà Nội, Ban Tuyên giáo và Dân vận Trung ương, Nhà xuất bản (NXB) Chính trị Quốc gia Sự thật phối hợp tổ chức Lễ ra mắt cuốn sách “Ngành Tuyên giáo và Dân vận trong nhiệm kỳ Đại hội XIII của Đảng - Bước chuyển từ tư duy lý luận đến hành động thực tiễn”.

Hàn Quốc tuyên án cựu Tổng thống Yoon Suk-yeol

Cựu Tổng thống Hàn Quốc Yoon Suk-yeol đã bị kết án 5 năm tù hôm 16/1 với cáo buộc cản trở nỗ lực bắt giữ ông của các nhà điều tra vào năm ngoái.

Ngang nhiên huỷ hoại cây keo giống trên đất của Tổng Công ty Lâm nghiệp Việt Nam

Ngày 16/1, Công an tỉnh Thái Nguyên thông tin về vụ án "Huỷ hoại tài sản" xảy ra ngày 16/5/2025 tại xóm Suối Găng, xã Nam Hoà, tỉnh Thái Nguyên, khởi tố bị can, bắt giữ 3 đối tượng.

Nhóm đối tượng người nước ngoài nhập cảnh vào Việt Nam để hoạt động lừa đảo

Ngày 16/1, Công an TP Hà Nội cho biết Phòng Quản lý xuất nhập cảnh Công an TP Hà Nội đã đồng loạt ra quân kiểm tra việc chấp hành quy định pháp luật về xuất nhập cảnh đối với người nước ngoài và các cơ sở lưu trú trên địa bàn thành phố.

Youtuber Đinh Thị Lan bị phạt 1 năm 9 tháng tù

Sau một buổi xét xử, đầu giờ chiều 16/1, TAND Khu vực 7, TP Hồ Chí Minh đã tuyên phạt bị cáo Đinh Thị Lan 1 năm 9 tháng tù về tội "Lợi dụng các quyền tự do dân chủ xâm phạm lợi ích của Nhà nước, quyền, lợi ích hợp pháp của tổ chức, cá nhân".

Máy bay không người lái bí ẩn tham gia bắt giữ Tổng thống Venezuela và từng tiêu diệt trùm khủng bố Bin Laden

Máy bay không người lái (UAV) tàng hình RQ-170 Sentinel được chế tạo dành riêng cho nhiệm vụ đã diễn ra ở Venezuela đêm 3/1 và đã hiện diện trên không trong các chiến dịch tương tự trước đây.

Bố trí gần 100 giường tầng phục vụ cán bộ Cảnh vệ cơ động tác chiến

Thực hiện Kế hoạch của Bộ Tư lệnh Cảnh vệ về bảo đảm tuyệt đối an ninh, an toàn Đại hội đại biểu toàn quốc lần thứ XIV của Đảng, nhằm bảo đảm tốt công tác hậu cần phục vụ nhiệm vụ bảo vệ Đại hội, Phòng Hậu cần đã tổ chức rà soát toàn bộ lực lượng, phương tiện; xây dựng phương án chi tiết, phù hợp theo từng giai đoạn và từng tình huống cụ thể, bảo đảm chặt chẽ, khoa học, hiệu quả.

Hội đồng Bảo an Liên Hợp Quốc họp khẩn về tình hình tại Iran

Hội đồng Bảo an Liên Hợp Quốc (HĐBA LHQ) ngày 15/1 (giờ Mỹ, tức 16/1 giờ Việt Nam) đã triệu tập một phiên họp khẩn cấp nhằm thảo luận về tình hình tại Iran, trong bối cảnh Tổng thống Mỹ Donald Trump liên tục đưa ra những đe dọa can thiệp quân sự vào quốc gia Trung Đông này.

Bị ngừng việc, người lao động Công ty đồ hộp Hạ Long được hưởng chế độ ra sao?

Như tin đã đưa, liên quan đến vụ án “Vi phạm quy định về an toàn thực phẩm”, hiện Công ty cổ phần đồ hộp Hạ Long đang tạm dừng hoạt động. Trong khoảng thời gian ngừng nghỉ việc, chế độ của người lao động sẽ ra sao?

Khám phá ổ nhóm biến thịt lợn thành đặc sản nai, nhím, đà điểu, tuồn vào nhà hàng, siêu thị

Sáng 16/1, Cơ quan Cảnh sát điều tra Công an TP Hồ Chí Minh cho biết đã triệt phá đường dây sản xuất, buôn bán hàng giả là thực phẩm, bắt giữ 8 đối tượng thu lợi bất chính hàng tỷ đồng…