Anthropic “niêm phong” siêu AI Mythos vì lo ngại mất kiểm soát?

Anthropic vừa xác nhận việc đình chỉ công bố mô hình AI Mythos do lo ngại về sức mạnh vượt ngưỡng kiểm soát.

08:25, 10/04/2026
Claude Mythos khiến Anthropic phải đình chỉ kế hoạch phát hành công khai do lo ngại rủi ro an ninh mạng. Ảnh minh hoạ.

Theo thông tin được công bố, trong các đợt kiểm tra nội bộ, Mythos đã chứng minh năng lực vô hiệu hóa các cơ chế kiểm soát an toàn nghiêm ngặt, thậm chí tự ý thực hiện các hành vi vượt ngoài phạm vi thiết kế như truyền dữ liệu ra khỏi môi trường sandbox. Những dấu hiệu này đặt ra cảnh báo đỏ về nguy cơ mất kiểm soát hoàn toàn nếu mô hình được triển khai trên diện rộng.

Đáng chú ý, mô hình còn có năng lực phân tích và phát hiện các lỗ hổng bảo mật ở mức độ sâu, bao gồm cả những điểm yếu tồn tại lâu năm trong các hệ điều hành được đánh giá cao về an ninh như OpenBSD. Khả năng này, nếu bị khai thác sai mục đích, có thể làm giảm đáng kể chi phí và rào cản kỹ thuật đối với hoạt động tấn công mạng.

Đặc biệt, Mythos sở hữu khả năng phân tích và nhận diện lỗ hổng bảo mật ở mức độ chuyên sâu, bao gồm cả những "điểm yếu" tồn tại lâu năm trên các hệ điều hành vốn được xem là biểu tượng của an ninh như OpenBSD. Đại diện Anthropic lo ngại rằng, sức mạnh này có thể triệt tiêu mọi rào cản kỹ thuật, cho phép ngay cả những người không có chuyên môn cũng có thể phát triển mã khai thác tinh vi trong thời gian ngắn. Điều này không chỉ làm giảm chi phí tấn công mạng mà còn đe dọa gây ra một làn sóng khủng hoảng an ninh mới trên toàn cầu.

Thay vì phát hành rộng rãi, Anthropic đã lựa chọn một lộ trình thận trọng và có kiểm soát hơn khi giới hạn phạm vi tiếp cận của Mythos trong khuôn khổ dự án Glasswing. Đây là một liên minh chiến lược với sự góp mặt của 11 tổ chức công nghệ và tài chính khổng lồ, bao gồm Google, Microsoft, AWS và JPMorgan. Mục tiêu cốt lõi của Glasswing' là chuyển hóa sức mạnh của Mythos thành một lá chắn phòng thủ an ninh mạng ưu việt, tập trung vào việc chủ động phát hiện và ngăn chặn các cuộc tấn công phức tạp. Qua đó, Anthropic cùng các đối tác sẽ tiếp tục tôi luyện và hoàn thiện các cơ chế kiểm soát an toàn trước khi tính đến bất kỳ kế hoạch mở rộng nào trong tương lai.

Song song với đó, lĩnh vực phần cứng AI tiếp tục ghi nhận những động thái mở rộng quy mô đầu tư. Intel công bố hợp tác với Elon Musk trong dự án tổ hợp sản xuất chip hiệu năng cao, hướng tới xây dựng hạ tầng tính toán quy mô lớn phục vụ các hệ thống AI thế hệ mới.

Sáng kiến này có sự tham gia trực tiếp của Tesla, SpaceX và xAI, nhắm thẳng vào các lĩnh vực "khát" năng lực xử lý như xe tự hành và robot thông minh. Việc đẩy mạnh công suất tính toán lên quy mô công nghiệp là minh chứng cho thấy hạ tầng phần cứng đã trở thành mắt xích quan trọng nhất, biến cuộc đua AI thành một cuộc chiến về năng lực hạ tầng thực thụ.

Các động thái nêu trên cho thấy một xu hướng rõ rệt trong ngành công nghệ: Khi trí tuệ nhân tạo tiệm cận những ngưỡng năng lực mới đầy phức tạp, cả giới công nghệ lẫn các cơ quan quản lý đang dần dịch chuyển sang một triết lý phát triển thận trọng. Thay vì chạy đua ra mắt bằng mọi giá, trọng tâm hiện nay được đặt vào việc siết chặt kiểm soát rủi ro, ưu tiên các ứng dụng phòng thủ và chuẩn hóa hành lang pháp lý. Đây là bước đệm cần thiết để kiến tạo một hệ sinh thái số tin cậy trước khi tiến tới các chiến lược triển khai trên diện rộng.

Thúy Hằng

Bình luận