Chỉ cần một lượng nhỏ dữ liệu độc hại cũng đủ “đầu độc” mô hình AI quy mô lớn

Nghiên cứu mới của Anthropic cho thấy chỉ cần một lượng tài liệu rất nhỏ được cài đặt độc hại cũng có thể khiến mô hình ngôn ngữ lớn phản hồi sai lệch, đe dọa nghiêm trọng đến an ninh hệ thống AI.

21:44, 13/10/2025
Anthropic cảnh báo việc cài dữ liệu độc hại để làm sai lệch phản hồi của AI dễ dàng hơn nhiều so với tưởng tượng
Anthropic cảnh báo việc cài dữ liệu độc hại để làm sai lệch phản hồi của AI dễ dàng hơn nhiều so với tưởng tượng. (Ảnh minh hoạ)

Công ty trí tuệ nhân tạo Anthropic, đơn vị phát triển chatbot Claude, vừa công bố kết quả nghiên cứu hé lộ một mối nguy hiểm tiềm tàng với các mô hình ngôn ngữ lớn (LLM). Việc "đầu độc" mô hình bằng cách cài các dữ liệu xấu để thay đổi kết quả trả lời của trí tuệ nhân tạo dễ dàng hơn nhiều so với những giả định trước đây.

Theo trang Cyber News, chỉ cần khoảng 250 tài liệu được soạn thảo có chủ đích đã đủ để một mô hình AI tạo sinh (GenAI) bị ảnh hưởng và trả về phản hồi sai lệch khi gặp một chuỗi kích hoạt nhất định.

Điểm đáng lưu ý là kích thước mô hình không giảm thiểu được nguy cơ này. Trước đây, các chuyên gia cho rằng mô hình AI càng lớn càng đòi hỏi nhiều dữ liệu độc hại hơn để cài "cửa hậu" (backdoor), nhưng nghiên cứu của Anthropic đã chứng minh điều ngược lại.

Cả mô hình 13 tỷ tham số, được huấn luyện trên bộ dữ liệu gấp hơn 20 lần so với mô hình 600 triệu tham số, đều có thể bị xâm nhập với cùng một lượng nhỏ tài liệu bị "đầu độc".

Anthropic nhấn mạnh: “Phát hiện này phá vỡ giả định rằng kẻ tấn công cần kiểm soát một tỷ lệ lớn dữ liệu huấn luyện. Thực tế, họ chỉ cần một lượng cực nhỏ cố định.”

Công ty cũng cảnh báo rằng những lỗ hổng này có thể gây rủi ro nghiêm trọng về mặt an ninh cho các hệ thống AI, đặc biệt là khi trí tuệ nhân tạo được sử dụng trong các lĩnh vực nhạy cảm và quan trọng.

Bình luận

Tin bài khác

Cơ quan an ninh Anh tăng cường hợp tác với doanh nghiệp để chống lại nguy cơ tấn công mạng
21:43, 13/10/2025

Cơ quan an ninh Anh tăng cường hợp tác với doanh nghiệp để chống lại nguy cơ tấn công mạng

Các cơ quan an ninh Anh, bao gồm MI5, đang mở rộng hợp tác với nhiều tập đoàn lớn trong bối cảnh lo ngại ngày càng tăng rằng các cuộc tấn công mạng có chủ đích có thể gây tổn hại cho nền kinh tế quốc gia.

Xem thêm
Apple treo thưởng 02 triệu đô la cho các lỗ hổng không cần nhấp chuột
15:30, 13/10/2025

Apple treo thưởng 02 triệu đô la cho các lỗ hổng không cần nhấp chuột

Apple vừa công bố việc mở rộng và thiết kế lại chương trình thưởng dành cho trường hợp phát hiện ra lỗi, tăng gấp đôi mức thưởng tối đa, bổ sung các hạng mục nghiên cứu mới và giới thiệu cơ cấu phần thưởng minh bạch hơn.

Xem thêm
Từ SIM rác đến AI lừa đảo – Bộ KH&CN vào cuộc mạnh mẽ
12:07, 13/10/2025

Từ SIM rác đến AI lừa đảo – Bộ KH&CN vào cuộc mạnh mẽ

Để ngăn chặn tình trạng tội phạm lợi dụng SIM rác, SIM không chính chủ thực hiện các cuộc gọi giả mạo cơ quan chức năng để lừa đảo, Bộ Khoa học và Công nghệ (KH&CN) đã triển khai hàng loạt biện pháp mạnh tay, trong đó có việc xác thực hơn 125 triệu thuê bao và xử lý 17 triệu SIM có thông tin không trùng khớp.

Xem thêm
Samsung phát hành bản vá khẩn cấp cho lỗ hổng “zero-day” trên điện thoại Galaxy
12:06, 13/10/2025

Samsung phát hành bản vá khẩn cấp cho lỗ hổng “zero-day” trên điện thoại Galaxy

Theo cảnh báo mới từ Cơ quan An ninh mạng và Hạ tầng Hoa Kỳ (CISA), một lỗ hổng nghiêm trọng trong phần mềm của Samsung đang bị tin tặc khai thác, có thể cho phép tội phạm mạng chiếm quyền điều khiển từ xa điện thoại Galaxy. Samsung đã phát hành bản vá bảo mật khẩn cấp để khắc phục vấn đề này.

Xem thêm
An ninh mạng y tế 2025: Bệnh nhân đang trở thành mục tiêu tấn công
11:12, 13/10/2025

An ninh mạng y tế 2025: Bệnh nhân đang trở thành mục tiêu tấn công

Lĩnh vực y tế đang trở thành tâm điểm của làn sóng tấn công mạng toàn cầu. Các cuộc xâm nhập dữ liệu, tống tiền và gián đoạn dịch vụ không chỉ gây thiệt hại kinh tế mà còn đe dọa trực tiếp đến tính mạng người bệnh. Những báo cáo quốc tế cho thấy, năm 2025, cường độ và quy mô các vụ tấn công mạng vào ngành y tế tăng cao nhất trong vòng 5 năm qua.

Xem thêm
Ba Lan đổ lỗi cho Nga khi các cuộc tấn công mạng vào các hệ thống quan trọng gia tăng
09:36, 13/10/2025

Ba Lan đổ lỗi cho Nga khi các cuộc tấn công mạng vào các hệ thống quan trọng gia tăng

Bộ trưởng Các vấn đề Kỹ thuật số của Ba Lan cho biết, cơ sở hạ tầng quan trọng của quốc gia này đã phải hứng chịu ngày càng nhiều cuộc tấn công mạng từ Nga, và tình báo quân sự của Nga dường như đã tăng gấp ba nguồn lực cho các hành động như vậy chống lại Ba Lan trong năm nay.

Xem thêm
“Bão ransomware” tấn công ngành sản xuất, khai thác lỗ hổng chuỗi cung ứng
09:02, 12/10/2025

“Bão ransomware” tấn công ngành sản xuất, khai thác lỗ hổng chuỗi cung ứng

Báo cáo mới công bố của Black Kite, công ty hàng đầu thế giới về đánh giá rủi ro an ninh mạng bên thứ ba, cảnh báo: ransomware vẫn duy trì áp lực chưa từng có, khai thác triệt để các kẽ hở trong chuỗi cung ứng công nghiệp.

Xem thêm