![]() |
Cuộc khảo sát do Liên hiệp Phát sóng châu Âu - tổ chức quy tụ 113 thành viên từ 56 quốc gia - công bố ngày 22/10, được thực hiện bởi các nhà báo chuyên nghiệp thuộc 22 cơ quan truyền thông ở 18 quốc gia, sử dụng 14 ngôn ngữ khác nhau. Họ đặt ra hàng loạt câu hỏi liên quan đến tin tức, sau đó đánh giá 3.000 câu trả lời của bốn ứng dụng AI dựa trên tiêu chí về độ chính xác, nguồn tin, khả năng phân biệt ý kiến cá nhân với sự thật và mức độ cung cấp bối cảnh.
Kết quả cho thấy 45% câu trả lời chứa ít nhất một lỗi nghiêm trọng, bất kể ngôn ngữ hay quốc gia phát triển ứng dụng. Trong đó, 31% gặp vấn đề về nguồn tin như dẫn sai, thiếu trích dẫn hoặc không rõ ràng; 20% cung cấp thông tin sai lệch hoặc lỗi thời nhưng được trình bày thuyết phục như sự thật.
Một ví dụ được nhóm nghiên cứu đưa ra là khi hỏi “Ai đang là Giáo hoàng?”, ba ứng dụng ChatGPT, Copilot và Gemini đều trả lời “Francis” – trong khi vào thời điểm khảo sát, Giáo hoàng Francis đã qua đời và được thay thế bởi Giáo hoàng Leo XIV.
Trong số bốn ứng dụng được kiểm tra, Gemini là nền tảng mắc lỗi nhiều nhất với 76% câu trả lời có vấn đề, chủ yếu do hạn chế trong việc trích dẫn và kiểm chứng nguồn tin; các ứng dụng còn lại ghi nhận tỷ lệ dưới 25%.
Mặc dù tồn tại nhiều sai sót, các trợ lý AI ngày càng được người dùng trẻ tuổi ưa chuộng để tra cứu và đọc tin tức. Theo Báo cáo Tin tức Kỹ thuật số của Viện Nghiên cứu Báo chí Reuters (Anh) công bố tháng 6, khoảng 7% người đọc tin tức trực tuyến và 15% người dưới 25 tuổi cho biết họ thường xuyên sử dụng AI để tổng hợp tin tức mỗi tuần.
EBU cảnh báo rằng sự phổ biến của các trợ lý AI có thể ảnh hưởng đến niềm tin của công chúng khi chúng dần thay thế vai trò của các công cụ tìm kiếm tin tức truyền thống. Giám đốc truyền thông EBU, ông Jean Philip De Tender, nhấn mạnh: “Các trợ lý AI hiện chưa thể được coi là công cụ đáng tin cậy để truy cập và tiêu thụ tin tức.”
Các công ty phát triển AI chưa đưa ra bình luận về nghiên cứu này. Theo Reuters, Gemini cho biết họ sẵn sàng tiếp nhận phản hồi để cải thiện chất lượng, trong khi Perplexity khẳng định chế độ “nghiên cứu sâu” của mình đạt độ chính xác thực tế lên tới 93,9%.
An Lâm









Bình luận