Chỉ cần một lượng nhỏ dữ liệu độc hại cũng đủ “đầu độc” mô hình AI quy mô lớn

Anthropic cảnh báo việc cài dữ liệu độc hại để làm sai lệch phản hồi của AI dễ dàng hơn nhiều so với tưởng tượng. (Ảnh minh hoạ)

Công ty trí tuệ nhân tạo Anthropic, đơn vị phát triển chatbot Claude, vừa công bố kết quả nghiên cứu hé lộ một mối nguy hiểm tiềm tàng với các mô hình ngôn ngữ lớn (LLM). Việc "đầu độc" mô hình bằng cách cài các dữ liệu xấu để thay đổi kết quả trả lời của trí tuệ nhân tạo dễ dàng hơn nhiều so với những giả định trước đây.

Theo trang Cyber News, chỉ cần khoảng 250 tài liệu được soạn thảo có chủ đích đã đủ để một mô hình AI tạo sinh (GenAI) bị ảnh hưởng và trả về phản hồi sai lệch khi gặp một chuỗi kích hoạt nhất định.

Điểm đáng lưu ý là kích thước mô hình không giảm thiểu được nguy cơ này. Trước đây, các chuyên gia cho rằng mô hình AI càng lớn càng đòi hỏi nhiều dữ liệu độc hại hơn để cài "cửa hậu" (backdoor), nhưng nghiên cứu của Anthropic đã chứng minh điều ngược lại.

Cả mô hình 13 tỷ tham số, được huấn luyện trên bộ dữ liệu gấp hơn 20 lần so với mô hình 600 triệu tham số, đều có thể bị xâm nhập với cùng một lượng nhỏ tài liệu bị "đầu độc".

Anthropic nhấn mạnh: “Phát hiện này phá vỡ giả định rằng kẻ tấn công cần kiểm soát một tỷ lệ lớn dữ liệu huấn luyện. Thực tế, họ chỉ cần một lượng cực nhỏ cố định.”

Công ty cũng cảnh báo rằng những lỗ hổng này có thể gây rủi ro nghiêm trọng về mặt an ninh cho các hệ thống AI, đặc biệt là khi trí tuệ nhân tạo được sử dụng trong các lĩnh vực nhạy cảm và quan trọng.

Tin bài khác

21:43, 13/10/2025

Cơ quan an ninh Anh tăng cường hợp tác với doanh nghiệp để chống lại nguy cơ tấn công mạng

Các cơ quan an ninh Anh, bao gồm MI5, đang mở rộng hợp tác với nhiều tập đoàn lớn trong bối cảnh lo ngại ngày càng tăng rằng các cuộc tấn công mạng có chủ đích có thể gây tổn hại cho nền kinh tế quốc gia.

Xem thêm

15:30, 13/10/2025

Apple treo thưởng 02 triệu đô la cho các lỗ hổng không cần nhấp chuột

Apple vừa công bố việc mở rộng và thiết kế lại chương trình thưởng dành cho trường hợp phát hiện ra lỗi, tăng gấp đôi mức thưởng tối đa, bổ sung các hạng mục nghiên cứu mới và giới thiệu cơ cấu phần thưởng minh bạch hơn.

Xem thêm

12:07, 13/10/2025

Từ SIM rác đến AI lừa đảo – Bộ KH&CN vào cuộc mạnh mẽ

Để ngăn chặn tình trạng tội phạm lợi dụng SIM rác, SIM không chính chủ thực hiện các cuộc gọi giả mạo cơ quan chức năng để lừa đảo, Bộ Khoa học và Công nghệ (KH&CN) đã triển khai hàng loạt biện pháp mạnh tay, trong đó có việc xác thực hơn 125 triệu thuê bao và xử lý 17 triệu SIM có thông tin không trùng khớp.

Xem thêm

12:06, 13/10/2025

Samsung phát hành bản vá khẩn cấp cho lỗ hổng “zero-day” trên điện thoại Galaxy

Theo cảnh báo mới từ Cơ quan An ninh mạng và Hạ tầng Hoa Kỳ (CISA), một lỗ hổng nghiêm trọng trong phần mềm của Samsung đang bị tin tặc khai thác, có thể cho phép tội phạm mạng chiếm quyền điều khiển từ xa điện thoại Galaxy. Samsung đã phát hành bản vá bảo mật khẩn cấp để khắc phục vấn đề này.

Xem thêm

11:12, 13/10/2025

An ninh mạng y tế 2025: Bệnh nhân đang trở thành mục tiêu tấn công

Lĩnh vực y tế đang trở thành tâm điểm của làn sóng tấn công mạng toàn cầu. Các cuộc xâm nhập dữ liệu, tống tiền và gián đoạn dịch vụ không chỉ gây thiệt hại kinh tế mà còn đe dọa trực tiếp đến tính mạng người bệnh. Những báo cáo quốc tế cho thấy, năm 2025, cường độ và quy mô các vụ tấn công mạng vào ngành y tế tăng cao nhất trong vòng 5 năm qua.

Xem thêm

09:36, 13/10/2025

Ba Lan đổ lỗi cho Nga khi các cuộc tấn công mạng vào các hệ thống quan trọng gia tăng

Bộ trưởng Các vấn đề Kỹ thuật số của Ba Lan cho biết, cơ sở hạ tầng quan trọng của quốc gia này đã phải hứng chịu ngày càng nhiều cuộc tấn công mạng từ Nga, và tình báo quân sự của Nga dường như đã tăng gấp ba nguồn lực cho các hành động như vậy chống lại Ba Lan trong năm nay.

Xem thêm

09:02, 12/10/2025

“Bão ransomware” tấn công ngành sản xuất, khai thác lỗ hổng chuỗi cung ứng

Báo cáo mới công bố của Black Kite, công ty hàng đầu thế giới về đánh giá rủi ro an ninh mạng bên thứ ba, cảnh báo: ransomware vẫn duy trì áp lực chưa từng có, khai thác triệt để các kẽ hở trong chuỗi cung ứng công nghiệp.

Xem thêm

Phòng và chống tấn công

Chỉ cần một lượng nhỏ dữ liệu độc hại cũng đủ “đầu độc” mô hình AI quy mô lớn

Bình luận

Tin bài khác

Cơ quan an ninh Anh tăng cường hợp tác với doanh nghiệp để chống lại nguy cơ tấn công mạng

Apple treo thưởng 02 triệu đô la cho các lỗ hổng không cần nhấp chuột

Từ SIM rác đến AI lừa đảo – Bộ KH&CN vào cuộc mạnh mẽ

Samsung phát hành bản vá khẩn cấp cho lỗ hổng “zero-day” trên điện thoại Galaxy

An ninh mạng y tế 2025: Bệnh nhân đang trở thành mục tiêu tấn công

Ba Lan đổ lỗi cho Nga khi các cuộc tấn công mạng vào các hệ thống quan trọng gia tăng

“Bão ransomware” tấn công ngành sản xuất, khai thác lỗ hổng chuỗi cung ứng

Xu hướng

Đề xuất

Ra mắt Trung tâm Nghiên cứu & Phát triển Trí tuệ Nhân tạo tại Việt Nam

Tội phạm lừa đảo trên không gian mạng luôn có các chiêu trò mới

Tội phạm sử dụng công nghệ cao ngày càng diễn biến phức tạp

Triệt phá đường dây lừa đảo công nghệ cao hoạt động từ Campuchia

Tây Ban Nha gặp khó khi điều tra nguyên nhân của vụ mất điện tồi tệ nhất

Sự kiện & Quan điểm

Không gian mạng không còn vùng xám: Phát tán ảnh nhạy cảm bị coi là tội phạm

Thiếu tướng Lê Xuân Minh: Bảo vệ trẻ em trên không gian mạng là trách nhiệm chung của toàn xã hội

Tổng Thư ký Liên Hợp Quốc: Mọi quốc gia đều được bảo vệ trước tội phạm mạng

Phòng và chống tấn công

Chỉ cần một lượng nhỏ dữ liệu độc hại cũng đủ “đầu độc” mô hình AI quy mô lớn

Các nước Bắc Âu và Estonia triển khai hệ thống thanh toán thẻ ngoại tuyến đề phòng mất kết nối Internet

Công ty an ninh mạng CrowdStrike sa thải hàng trăm nhân viên

Bình luận

Tin bài khác

Cơ quan an ninh Anh tăng cường hợp tác với doanh nghiệp để chống lại nguy cơ tấn công mạng

Apple treo thưởng 02 triệu đô la cho các lỗ hổng không cần nhấp chuột

Từ SIM rác đến AI lừa đảo – Bộ KH&CN vào cuộc mạnh mẽ

Samsung phát hành bản vá khẩn cấp cho lỗ hổng “zero-day” trên điện thoại Galaxy

An ninh mạng y tế 2025: Bệnh nhân đang trở thành mục tiêu tấn công

Ba Lan đổ lỗi cho Nga khi các cuộc tấn công mạng vào các hệ thống quan trọng gia tăng

“Bão ransomware” tấn công ngành sản xuất, khai thác lỗ hổng chuỗi cung ứng

Xu hướng

Đề xuất

Ra mắt Trung tâm Nghiên cứu & Phát triển Trí tuệ Nhân tạo tại Việt Nam

Tội phạm lừa đảo trên không gian mạng luôn có các chiêu trò mới

Tội phạm sử dụng công nghệ cao ngày càng diễn biến phức tạp

Triệt phá đường dây lừa đảo công nghệ cao hoạt động từ Campuchia

Tây Ban Nha gặp khó khi điều tra nguyên nhân của vụ mất điện tồi tệ nhất

Sự kiện & Quan điểm

Không gian mạng không còn vùng xám: Phát tán ảnh nhạy cảm bị coi là tội phạm

Thiếu tướng Lê Xuân Minh: Bảo vệ trẻ em trên không gian mạng là trách nhiệm chung của toàn xã hội

Tổng Thư ký Liên Hợp Quốc: Mọi quốc gia đều được bảo vệ trước tội phạm mạng