Thử nghiệm trong môi trường thực
Nghiên cứu được công bố trên tạp chí Science, do các nhà khoa học từ Harvard phối hợp với Trung tâm Y tế Beth Israel Deaconess thực hiện, đã đưa AI vào một bối cảnh không hề "mô phỏng": phòng cấp cứu thật.
Với 76 bệnh nhân nhập viện, nhóm nghiên cứu so sánh trực tiếp giữa hai bác sĩ nội khoa và các mô hình AI gồm o1 và GPT-4o của OpenAI. Tất cả đều được cung cấp cùng một lượng dữ liệu từ bệnh án điện tử, không có bất kỳ sự ưu tiên hay xử lý bổ sung nào dành riêng cho AI.
![]() |
| Mô hình AI gồm o1 và GPT-4o của OpenAI được sử dụng |
Điểm đặc biệt là toàn bộ kết quả được chấm bởi một hội đồng bác sĩ độc lập, không biết đâu là chẩn đoán từ con người, đâu là từ máy - nhằm đảm bảo tính khách quan tuyệt đối.
Trong giai đoạn phân loại ban đầu, nơi bác sĩ phải đưa ra quyết định nhanh với rất ít thông tin, AI cho thấy lợi thế rõ rệt. Mô hình o1 đạt độ chính xác hoặc gần chính xác tới 67%, trong khi hai bác sĩ tham gia thử nghiệm chỉ đạt 55% và 50%.
Theo Arjun Manrai, trưởng nhóm nghiên cứu, kết quả này cho thấy các mô hình AI không chỉ vượt qua các tiêu chuẩn đánh giá hiện tại mà còn vượt cả hiệu suất tham chiếu từ bác sĩ trong một số tình huống cụ thể. Điều này mở ra khả năng AI có thể trở thành công cụ hỗ trợ quan trọng trong những thời điểm mà từng giây đều có ý nghĩa sống còn.
Tranh cãi bùng lên trong giới y khoa
Tiến sĩ Adam Rodman nhấn mạnh rằng hiện vẫn chưa có khung pháp lý rõ ràng để xác định trách nhiệm nếu AI đưa ra chẩn đoán sai. Quan trọng hơn, y học không chỉ là những con số hay xác suất, mà còn liên quan đến giao tiếp, sự đồng cảm và khả năng đưa ra quyết định trong những hoàn cảnh phức tạp - những yếu tố mà AI vẫn chưa thể tái tạo.
Ông cũng lưu ý rằng trong các tình huống cấp cứu, bệnh nhân không chỉ cần một kết luận chính xác mà còn cần một con người để giải thích, trấn an và đồng hành.
Theo TechCrunch, nghiên cứu này đã nhanh chóng thu hút những ý kiến trái chiều từ giới chuyên môn. Bác sĩ cấp cứu Kristen Panthagani cho rằng việc so sánh AI với bác sĩ nội khoa là chưa phản ánh đúng thực tế công việc tại khoa cấp cứu.
Bà chỉ ra rằng mục tiêu hàng đầu của bác sĩ cấp cứu không phải là tìm ra chẩn đoán chính xác ngay lập tức, mà là xác định xem bệnh nhân có đang trong tình trạng đe dọa tính mạng hay không và cần can thiệp gì ngay. Đây là loại quyết định đòi hỏi kinh nghiệm thực tế, khả năng quan sát và phản xạ nhanh - những điều không dễ để thuật toán thay thế.
![]() |
| Ứng dụng trí tuệ nhân tạo trong phân tích và chẩn đoán bệnh (Ảnh minh hoạ) |
Một hạn chế đáng chú ý khác là AI trong nghiên cứu chủ yếu làm việc với dữ liệu văn bản. Trong khi đó, thực tế lâm sàng lại phức tạp hơn nhiều, khi bác sĩ phải kết hợp thông tin từ hình ảnh X-quang, CT, MRI, siêu âm và cả những dấu hiệu trực quan từ bệnh nhân.
Chính sự kết hợp giữa kiến thức chuyên môn và trải nghiệm thực tế này tạo nên "trực giác lâm sàng" -yếu tố vẫn đang là lợi thế của con người.
Dù còn nhiều rào cản, nghiên cứu vẫn cho thấy tiềm năng rõ ràng của AI trong việc hỗ trợ hệ thống y tế. Thay vì thay thế bác sĩ, AI nhiều khả năng sẽ trở thành một "trợ lý thông minh", giúp rút ngắn thời gian chẩn đoán, giảm tải áp lực công việc và hỗ trợ đưa ra quyết định trong những tình huống khẩn cấp.
Thuý Hằng (tổng hợp)



Bình luận