![]() |
Theo TechSpot, vấn đề bắt đầu từ tháng 9/2025, khi nhiều nhà phát triển sử dụng GSC phát hiện các chuỗi văn bản bất thường trong báo cáo truy vấn tìm kiếm. Thay vì những cụm từ khóa ngắn gọn như thông thường, hệ thống lại ghi nhận toàn bộ đoạn hội thoại hoặc câu lệnh (prompt) mà người dùng đã gửi cho ChatGPT.
Vụ việc được phát hiện đầu tiên bởi Jason Packer, sáng lập công ty phân tích Quantable. Sau nhiều tuần điều tra cùng chuyên gia Slobodan Manić, họ xác định sự cố bắt nguồn từ việc một số phiên làm việc của ChatGPT đã vô tình định tuyến câu lệnh người dùng sang Google Search. Cụ thể, các truy vấn bị rò rỉ đều có chung mẫu URL openai.com/index/chatgpt, kèm theo toàn bộ nội dung prompt.
Khi Google phân tích địa chỉ này, hệ thống của họ tự động tách URL thành các từ khóa riêng lẻ như “openai”, “index”, “chatgpt”. Những trang web có thứ hạng cao với các từ khóa này đã thấy nguyên văn các đoạn hội thoại bị rò rỉ xuất hiện trong mục phân tích truy vấn của GSC.
Nói cách khác, một lỗi từ phía ChatGPT đã khiến công cụ tìm kiếm của Google ghi nhận toàn bộ câu lệnh của người dùng như một truy vấn tìm kiếm hợp lệ, khiến dữ liệu bị hiển thị cho bên thứ ba mà người dùng không hề hay biết.
Theo các nhà nghiên cứu, sự cố có thể liên quan đến tính năng “duyệt web” mới trên các mô hình GPT-5, trong đó tham số hints=search khiến ChatGPT tự động thực hiện tìm kiếm nhiều hơn. Điều này làm tăng nguy cơ chatbot vô tình gửi dữ liệu người dùng lên Google Search.
Packer cũng cho rằng phát hiện này hé lộ việc ChatGPT có khả năng tương tác trực tiếp với hệ thống lập chỉ mục của Google, thay vì một API tìm kiếm riêng tư. “Nếu là API kín, các truy vấn đó đã không xuất hiện trong Search Console”, ông nhận định.
OpenAI đã thừa nhận đây là một “lỗi định tuyến” ảnh hưởng đến “một nhóm nhỏ truy vấn”, đồng thời khẳng định đã khắc phục. Tuy nhiên, các chuyên gia cảnh báo rằng sự cố lần này nghiêm trọng hơn các vụ rò rỉ trước đây, vốn chủ yếu xảy ra khi người dùng vô tình chia sẻ đoạn chat. “Trong trường hợp này, không ai nhấn nút chia sẻ cả”, Packer nói. “Dữ liệu bị gửi đi hoàn toàn tự động”.
OpenAI hiện chưa công bố con số người dùng bị ảnh hưởng trong tổng số khoảng 700 triệu người dùng hằng tuần. Sự cố này tiếp tục cho thấy các hệ thống AI hiện đại vẫn tồn tại những lỗ hổng khó lường trong cách xử lý dữ liệu, đặt ra yêu cầu cấp thiết về kiểm soát quyền riêng tư và minh bạch hơn trong vận hành.
An Lâm


Bình luận