Hai phiên bản V4 Pro và V4 Flash
Theo thông báo ngày 24/4 trên trang web chính thức của hãng, DeepSeek cho biết V4 được phát hành dưới dạng bản xem trước (Preview), với "ngữ cảnh cực dài một triệu token, dẫn đầu trong cả lĩnh vực AI nguồn đóng và nguồn mở về khả năng tác nhân, kiến thức thế giới và hiệu suất suy luận".
![]() |
Mô hình này có hai phiên bản gồm V4 Pro và V4 Flash. Trong đó, V4 Pro được xây dựng trên hệ thống định tuyến chuyên gia (Mixture-of-Experts) với cấu trúc 16×16. DeepSeek cho biết mô hình đạt điểm MMLU 88,5%, cao hơn mức 85,5% của phiên bản V3 trước đó.
Đáng chú ý, V4 Pro cho phép xử lý trực tiếp các kho dữ liệu lớn như mã nguồn hoặc tài liệu doanh nghiệp mà không cần sử dụng lớp truy xuất tăng cường (RAG). Theo hãng, điều này giúp “giảm lỗi truy xuất và đơn giản hóa quy trình kỹ thuật”.
Về chi phí, DeepSeek công bố mức giá 2,8 USD cho mỗi triệu token đầu vào và 8,8 USD cho mỗi triệu token đầu ra đối với V4 Pro.
Trong khi đó, phiên bản V4 Flash được tối ưu cho tốc độ và chi phí thấp. Mô hình có tổng cộng 284 tỷ tham số, trong đó 13 tỷ tham số hoạt động. DeepSeek mô tả đây là "lựa chọn nhanh chóng, hiệu quả và tiết kiệm", với mức giá 0,4 USD cho mỗi triệu token đầu vào và 1,2 USD cho đầu ra.
Cạnh tranh với OpenAI và Google
DeepSeek cho biết trong các bảng xếp hạng hiệu năng toàn cầu, V4 Pro "vượt trội so với các mô hình mã nguồn mở khác và chỉ bị mô hình mã nguồn đóng hàng đầu là Gemini-Pro-3.1 của Google vượt qua một chút, nhưng chi phí lại rẻ hơn hẳn".
Theo EuroNews, việc V4 sở hữu hiệu năng cao và giá thấp có thể khiến các công ty AI khác phải điều chỉnh lại chiến lược. Trang này nhận định cửa sổ ngữ cảnh một triệu token là "lời thách thức trực tiếp" đối với các sản phẩm đang dẫn đầu về khả năng xử lý ngữ cảnh dài.
Sự kiện ra mắt V4 diễn ra chỉ vài giờ sau khi OpenAI công bố mô hình GPT-5.5. Nhà đồng sáng lập kiêm Chủ tịch OpenAI, Greg Brockman, cho biết GPT-5.5 là "mô hình thông minh nhất và dễ sử dụng nhất", đồng thời "đang đưa công ty tiến gần hơn một bước đến việc tạo ra siêu ứng dụng của OpenAI"
Ông cũng nhận định: "Mô hình mới là bước tiến thực sự hướng tới loại hình điện toán đang được kỳ vọng”, với khả năng “tư duy nhanh hơn, sắc bén hơn với ít token hơn".
Trong khi đó, Mark Chen, Giám đốc nghiên cứu tại OpenAI, cho biết GPT-5.5 "hoạt động tốt hơn các phiên bản trước đó trong việc xử lý công việc trên máy tính”, đồng thời “cho thấy tiến bộ đáng kể trong quy trình nghiên cứu khoa học và kỹ thuật".
![]() |
| Sự ra đời của Deepseek V4 được coi là cạnh tranh trực tiếp với ChatGPT và Google (Nguồn: Internet) |
Tiếp nối chiến lược chi phí thấp
DeepSeek tiếp tục duy trì chiến lược cạnh tranh bằng chi phí thấp, vốn đã tạo tiếng vang trước đó. Đầu năm 2025, công ty này ra mắt mô hình R1 với tuyên bố "mã nguồn mở 100%, rẻ hơn 96,4% so với OpenAI o1 trong khi vẫn mang lại hiệu suất tương tự", đồng thời cung cấp miễn phí mô hình V3.
Giới chuyên gia đánh giá sản phẩm từ Trung Quốc hiện chỉ xếp sau Gemini-Pro-3.1 của Google một khoảng cách nhỏ. Tuy nhiên, lợi thế về chi phí vận hành giúp DeepSeek trở thành lựa chọn hấp dẫn cho các doanh nghiệp đang tìm kiếm giải pháp AI hiệu quả về kinh tế nhưng vẫn đảm bảo năng lực xử lý mạnh mẽ.
Thúy Hằng (tổng hợp)



Bình luận