OpenAI vừa tung ra bản nâng cấp đáng chú ý cho ChatGPT với công cụ tạo ảnh Images 2.0, mang đến bước tiến lớn trong việc hiển thị văn bản - đặc biệt là tiếng Việt, vốn từ lâu là "bài toán khó" với các hệ thống AI tạo ảnh.
![]() |
| ChatGPT cho ra mắt công cụ tạo ảnh Image 2.0 trên trang web chính thức của hãng |
Trong thông báo ngày 21/4, OpenAI cho biết Images 2.0 cải thiện đáng kể độ chi tiết và khả năng tuân thủ yêu cầu của người dùng. Không chỉ dừng ở việc tạo hình ảnh đẹp, công cụ này còn xử lý tốt các yếu tố phức tạp như chữ nhỏ, biểu tượng, bố cục dày đặc và các thành phần giao diện - những thứ trước đây thường bị méo chữ hoặc sai chính tả.
Từ “chữ loạn” đến hiển thị gần như hoàn hảo
Trước đây, các công cụ tạo ảnh AI - bao gồm cả ChatGPT - thường gặp lỗi khi hiển thị chữ, đặc biệt với tiếng Việt. Văn bản trong ảnh dễ bị sai dấu, thiếu ký tự, méo chữ hoặc thậm chí biến thành các ký hiệu vô nghĩa. Nguyên nhân là do mô hình ưu tiên tái tạo hình ảnh tổng thể, trong khi chữ viết chỉ chiếm diện tích nhỏ và khó được xử lý chính xác.
Tuy nhiên, với Images 2.0, tình trạng này đã được cải thiện rõ rệt. Trong các thử nghiệm thực tế, chữ tiếng Việt hiển thị gần như đúng hoàn toàn, kể cả với đoạn văn dài hoặc các bố cục phức tạp như menu, poster hay banner quảng cáo. Đây được xem là bước tiến quan trọng, giúp AI không chỉ "vẽ đẹp" mà còn "viết đúng".
![]() |
|
Poster thiết kế dùng ChatGPT Images 2.0 với chữ tiếng Việt giảm lỗi sai dấu và tăng độ chính xác rõ rệt (Nguồn: Internet) |
Không chỉ tiếng Việt, công cụ còn hỗ trợ tốt nhiều hệ chữ không phải Latin như tiếng Nhật, Hàn, Hindi hay Bengali. Điều này mở ra khả năng ứng dụng rộng rãi trong thiết kế, truyền thông và giáo dục ở nhiều thị trường khác nhau.
Ngoài ra, Images 2.0 cho phép tùy chỉnh tỷ lệ khung hình linh hoạt, giúp người dùng dễ dàng tạo nội dung phù hợp cho mạng xã hội, quảng cáo hoặc in ấn.
Không chỉ vẽ, AI còn “biết nghĩ”
Một nâng cấp đáng chú ý khác là việc tích hợp khả năng suy luận vào quá trình tạo ảnh. Images 2.0 có thể tạo nhiều phiên bản hình ảnh từ một yêu cầu; tự kiểm tra và tối ưu trước khi hiển thị; hỗ trợ các tác vụ phức tạp như truyện tranh nhiều khung, banner đa kích thước
Nhờ đó, người dùng có thể tạo nội dung hoàn chỉnh - từ ý tưởng đến sản phẩm cuối - chỉ bằng một câu lệnh. Tuy nhiên, đổi lại, thời gian xử lý có thể lâu hơn so với chế độ thông thường.
Dù cải thiện mạnh, hệ thống vẫn có thể gặp khó khi xử lý các chi tiết vật lý phức tạp, góc nhìn lạ hoặc biểu đồ nhiều dữ liệu. OpenAI cho biết đã tích hợp các biện pháp an toàn để hạn chế việc tạo nội dung độc hại và sẽ tiếp tục nâng cấp trong thời gian tới.
Sự xuất hiện của Images 2.0 cho thấy một xu hướng rõ ràng: AI tạo ảnh đang tiến từ công cụ minh họa sang nền tảng tạo nội dung hoàn chỉnh. Khi cả hình ảnh và văn bản đều có thể được tạo chính xác bằng AI, ngành thiết kế và sáng tạo nội dung có thể sẽ phải thích nghi nhanh hơn bao giờ hết.
Thúy Hằng (tổng hợp)



Bình luận