![]() |
| Ảnh minh họa |
Cụ thể, nghiên cứu của EBU - liên minh gồm 113 đơn vị truyền thông công cộng tại 56 quốc gia – đã khảo sát 3.000 câu trả lời của bốn ứng dụng trợ lý AI phổ biến gồm ChatGPT (OpenAI), Copilot (Microsoft), Gemini (Google) và Perplexity. Các câu trả lời được đánh giá dựa trên các tiêu chí về độ chính xác, nguồn tin, khả năng phân biệt ý kiến cá nhân với sự thật và cung cấp bối cảnh.
Kết quả cho thấy có tới 45% câu trả lời chứa ít nhất một lỗi quan trọng, bất kể ngôn ngữ hay quốc gia phát triển ứng dụng. Trong đó, 31% câu trả lời gặp vấn đề về nguồn tin như thiếu nguồn, sai lệch hoặc dẫn nguồn không chính xác và 20% gặp vấn đề lớn về chính xác thông tin, gồm thông tin lỗi thời hoặc sai lệch được trình bày thuyết phục như thật.
Ví dụ điển hình là khi được hỏi về giáo hoàng hiện tại, nhiều trợ lý AI như ChatGPT, Copilot và Gemini đều trả lời “Francis” dù đã được thay thế bởi Giáo hoàng Leo XIV.
Gemini là ứng dụng có tỷ lệ sai sót nhiều nhất, lên tới 76%, chủ yếu do năng lực tìm nguồn tin kém. Các ứng dụng còn lại đều có tỷ lệ sai sót dưới 25%.
Dù vậy, các trợ lý AI này ngày càng phổ biến và được người trẻ thường xuyên sử dụng cho việc đọc và tổng hợp tin tức. Báo cáo tin tức kỹ thuật số của Viện Nghiên cứu Báo chí Reuters công bố hồi tháng 6 năm nay cho biết 7% người đọc tin tức trực tuyến và 15% người dưới 25 tuổi dùng trợ lý AI để tổng hợp thông tin hàng tuần.
Giám đốc truyền thông EBU, Jean Philip De Tender, nhận định các trợ lý AI vẫn chưa đủ đáng tin cậy để phục vụ tiếp nhận và tiêu thụ tin tức cho công chúng. Các công ty cung cấp dịch vụ AI chưa có phản hồi chính thức với báo cáo này, trong khi đó Gemini cho biết họ đang lấy phản hồi người dùng để cải thiện sản phẩm và Perplexity khẳng định một trong các chế độ nghiên cứu sâu của mình có độ chính xác gần 94%.









Bình luận