DeepSeek định nghĩa lại hiệu suất AI với mô hình thị giác - nhận thức mới DeepSeek-OCR

Bằng cách sử dụng nhận thức thị giác như công cụ nén thông tin, mô hình DeepSeek-OCR giúp các hệ thống trí tuệ nhân tạo xử lý văn bản dài và phức tạp nhanh hơn, rẻ hơn, mà vẫn giữ nguyên độ chính xác. Đây là bước tiến tiếp theo trong hành trình DeepSeek tối ưu chi phí và nâng cao hiệu năng mô hình AI mã nguồn mở.

21:32, 23/10/2025

Công ty startup AI DeepSeek (trụ sở tại Hàng Châu, Trung Quốc) vừa công bố mô hình AI đa phương thức mới mang tên DeepSeek-OCR, có khả năng xử lý các tài liệu lớn và phức tạp bằng cách sử dụng nhận thức thị giác như một phương tiện nén thông tin, giúp giảm đáng kể số lượng “token” - đơn vị nhỏ nhất mà mô hình ngôn ngữ xử lý.

DeepSeek ra mắt mô hình AI đa phương thức sử dụng thị giác để nén dữ liệu văn bản.
DeepSeek ra mắt mô hình AI đa phương thức sử dụng thị giác để nén dữ liệu văn bản.

DeepSeek-OCR là mô hình mã nguồn mở, hiện đã được công bố trên các nền tảng dành cho nhà phát triển như Hugging Face và GitHub. Theo DeepSeek, đây là kết quả của một nghiên cứu chuyên sâu về vai trò của bộ mã hóa thị giác (vision encoder) trong việc nén văn bản cho các mô hình ngôn ngữ lớn (LLMs).

Với phương pháp này, các LLM có thể xử lý khối lượng văn bản khổng lồ mà không làm tăng chi phí tính toán tương ứng.

“Thông qua DeepSeek-OCR, chúng tôi chứng minh rằng việc nén giữa hình ảnh và văn bản có thể giúp giảm số lượng token từ 7 đến 20 lần ở các giai đoạn ngữ cảnh khác nhau, mở ra hướng đi đầy tiềm năng để giải quyết bài toán ngữ cảnh dài của LLMs.” DeepSeek cho biết trong thông cáo.

Động thái này tiếp nối nỗ lực không ngừng của DeepSeek nhằm tối ưu hiệu suất mô hình và giảm chi phí phát triển, triết lý đã giúp họ tạo ra hai mô hình mã nguồn mở gây chú ý V3 và R1, ra mắt lần lượt vào tháng 12/2024 và tháng 1/2025.

Theo blog của công ty, DeepSeek-OCR gồm hai thành phần chính:

DeepEncoder - bộ mã hóa giữ vai trò là “động cơ” của mô hình, giúp duy trì mức kích hoạt thấp ngay cả khi xử lý hình ảnh độ phân giải cao, đồng thời đạt tỷ lệ nén mạnh để giảm số lượng token.

DeepSeek3B-MoE-A570M - bộ giải mã (decoder) với kiến trúc Mixture-of-Experts (MoE) gồm 570 triệu tham số. Cấu trúc MoE chia mô hình thành các mạng con (“chuyên gia”), mỗi mạng đảm nhận một phần dữ liệu riêng biệt để cùng nhau thực hiện nhiệm vụ.

Bên cạnh các tác vụ thị giác tiêu chuẩn như mô tả hình ảnh hay nhận diện vật thể, DeepSeek-OCR còn có thể phân tích nội dung thị giác phức tạp như bảng biểu, công thức và sơ đồ hình học, đặc biệt hữu ích trong các lĩnh vực tài chính và khoa học.

DeepSeek cho biết, mô hình này có thể tạo ra hơn 200.000 trang dữ liệu huấn luyện mỗi ngày chỉ với một GPU Nvidia A100-40G - minh chứng cho hiệu suất cao và chi phí thấp.

Với DeepSeek-OCR, người dùng có thể xử lý các ngữ cảnh siêu dài theo quy mô lớn, trong đó phần nội dung mới nhất được lưu ở độ phân giải cao, còn phần ngữ cảnh cũ hơn tiêu tốn ít tài nguyên tính toán hơn. Cách tiếp cận này mở ra khả năng xây dựng kiến trúc ngữ cảnh gần như không giới hạn, cân bằng giữa hiệu quả và khả năng lưu giữ thông tin.

Trước đó, vào cuối tháng 9, DeepSeek đã ra mắt phiên bản thử nghiệm DeepSeek V3.2-Exp, cải thiện hiệu quả huấn luyện và suy luận, đồng thời giảm mạnh chi phí sử dụng API.

Lệ Thanh (theo South China Morning Post)

Bình luận

Tin bài khác

Chuẩn bị chu đáo, bảo đảm tuyệt đối an ninh, an toàn cho Lễ mở ký Công ước Hà Nội
09:40, 23/10/2025

Chuẩn bị chu đáo, bảo đảm tuyệt đối an ninh, an toàn cho Lễ mở ký Công ước Hà Nội

Sáng 21/10, tại Hà Nội, Thượng tướng Phạm Thế Tùng, Thứ trưởng Bộ Công an, Trưởng Tiểu ban An ninh - Y tế/An ninh trật tự (ANTT) Lễ mở ký Công ước của Liên hợp quốc về chống tội phạm mạng (Công ước Hà Nội) đã chủ trì phiên họp đánh giá công tác bảo đảm ANTT và y tế phục vụ sự kiện. Đây là hoạt động quan trọng nhằm chuẩn bị chu đáo, bảo đảm tuyệt đối an ninh, an toàn cho sự kiện quốc tế có ý nghĩa lịch sử này.

Xem thêm
Những nhóm ransomware nguy hiểm nhất đang thống trị thế giới tội phạm mạng
09:39, 23/10/2025

Những nhóm ransomware nguy hiểm nhất đang thống trị thế giới tội phạm mạng

Ransomware - tấn công mã hóa dữ liệu đòi tiền chuộc đang trở thành nỗi ám ảnh toàn cầu. Trong khi doanh nghiệp, tổ chức chính phủ và cá nhân nỗ lực phòng vệ, các băng nhóm tội phạm mạng lại ngày càng tinh vi, hoạt động như những “doanh nghiệp ngầm” chuyên nghiệp, với mục tiêu rõ ràng: chiếm đoạt dữ liệu và tiền chuộc.

Xem thêm
Hà Nội: Công an phường Khương Đình tổ chức tuyên truyền phòng ngừa tội phạm công nghệ cao
21:22, 23/10/2025

Hà Nội: Công an phường Khương Đình tổ chức tuyên truyền phòng ngừa tội phạm công nghệ cao

Sáng 21/10/2025, Công an phường Khương Đình phối hợp với Trường THCS Khương Đình tổ chức Chuyên đề giáo dục đặc biệt với chủ đề “Kỹ năng sử dụng mạng xã hội và phòng ngừa tội phạm, tệ nạn xã hội trên không gian mạng”.

Xem thêm
Kỹ thuật xã hội trở thành thủ đoạn tấn công mới của tội phạm mạng
09:33, 23/10/2025

Kỹ thuật xã hội trở thành thủ đoạn tấn công mới của tội phạm mạng

Tấn công mạng không còn chỉ là cách gài mã độc hay xâm nhập hệ thống. Hiện nay, thủ đoạn sử dụng kỹ thuật xã hội (social engineering) với sự trợ giúp của AI để xâm nhập vào mạng nội bộ đang trở thành phương thức chủ đạo của hacker.

Xem thêm
Công bố chiến dịch truyền thông “Toàn dân chống lừa đảo”: Chung tay bảo vệ niềm tin số Việt Nam
09:24, 23/10/2025

Công bố chiến dịch truyền thông “Toàn dân chống lừa đảo”: Chung tay bảo vệ niềm tin số Việt Nam

Ngày 22/10, Trung tâm Truyền hình Việt Nam tại TP.HCM (VTV9) chính thức phát động Chiến dịch truyền thông “Toàn dân chống lừa đảo”, với mục tiêu nâng cao nhận thức cộng đồng, củng cố niềm tin số và xây dựng “lá chắn an toàn” trước làn sóng tội phạm mạng ngày càng tinh vi.

Xem thêm
Công ty Thiết bị thủy lực Úc bị tấn công mạng, nhóm Anubis nhận trách nhiệm
09:12, 23/10/2025

Công ty Thiết bị thủy lực Úc bị tấn công mạng, nhóm Anubis nhận trách nhiệm

Mới đây, nhà cung cấp thiết bị thủy lực Aussie Fluid Power (Úc) xác nhận bị tin tặc xâm nhập, nhóm ransomware Anubis tuyên bố nhận trách nhiệm.

Xem thêm
Công ước Hà Nội – Bước tiến toàn cầu trong bảo vệ trẻ em và phòng chống tội phạm mạng
12:55, 22/10/2025

Công ước Hà Nội – Bước tiến toàn cầu trong bảo vệ trẻ em và phòng chống tội phạm mạng

Theo Đại tá Lê Hoàng Dương, Phó Cục trưởng Cục Đối ngoại (Bộ Công an), Công ước Hà Nội được xem là một giải pháp mang tính toàn cầu, thúc đẩy hợp tác quốc tế trong phòng chống tội phạm mạng, đặc biệt là trong lĩnh vực bảo vệ trẻ em trên không gian mạng.

Xem thêm