Alibaba phát triển công nghệ giúp giảm 82% nhu cầu dùng chip Nvidia cho mô hình AI

Alibaba vừa công bố hệ thống Aegaeon - giải pháp tối ưu mới giúp cắt giảm tới 82% số lượng chip Nvidia GPU cần thiết cho việc xử lý và vận hành các mô hình trí tuệ nhân tạo quy mô lớn.

09:52, 20/10/2025
Các nhà nghiên cứu trên toàn cầu đã tìm cách cải thiện hiệu suất bằng phương pháp gộp chung sức mạnh GPU.
Các nhà nghiên cứu trên toàn cầu đã tìm cách cải thiện hiệu suất bằng phương pháp gộp chung sức mạnh GPU.

Theo công bố, Aegaeon đã được thử nghiệm nội bộ trên chợ mô hình của Alibaba Cloud trong hơn ba tháng. Kết quả cho thấy hệ thống có thể giảm số lượng GPU Nvidia H20 phục vụ hàng chục mô hình AI khổng lồ, lên đến 72 tỷ tham số, từ 1.192 chip xuống chỉ còn 213 chip.

Công trình nghiên cứu này được nhóm khoa học của Đại học Bắc Kinh và Alibaba Cloud trình bày tại Hội nghị chuyên đề quốc tế lần thứ 31 về Nguyên tắc Hệ điều hành (SOSP) tổ chức tại Hàn Quốc. Báo cáo chỉ ra chi phí khổng lồ phát sinh khi vận hành đồng thời nhiều mô hình ngôn ngữ lớn (LLM), trong đó 17,7% GPU chỉ được sử dụng để đáp ứng 1,35% tổng số yêu cầu trên chợ mô hình của Alibaba Cloud.

Trên thế giới, các nhà nghiên cứu đang tìm cách tăng hiệu suất xử lý bằng chiến lược “gộp GPU” - cho phép một GPU phục vụ nhiều mô hình AI cùng lúc. Tuy nhiên, giải pháp Aegaeon của Alibaba vượt xa các phương pháp trước đó khi triển khai cơ chế “tự động mở rộng và thu hẹp” (auto-scaling) ở cấp độ token - đơn vị dữ liệu cơ bản trong quá trình huấn luyện và suy luận của AI.

Nhờ đó, một GPU duy nhất có thể phục vụ tối đa bảy mô hình khác nhau, thay vì chỉ hai hoặc ba mô hình như trong các hệ thống cạnh tranh khác, đồng thời giảm tới 97% độ trễ (latency) khi chuyển đổi giữa các mô hình AI.

Trong bối cảnh tập đoàn chip Mỹ Nvidia đang chịu ảnh hưởng nặng nề từ chính sách kiểm soát xuất khẩu công nghệ của chính quyền Tổng thống Biden, dòng chip H20 - được thiết kế riêng cho thị trường Trung Quốc - đã trở thành giải pháp thay thế chủ lực cho các mô hình AI tại quốc gia này. Tuy nhiên, con chip này gần đây bị các cơ quan quản lý Trung Quốc điều tra do nghi ngờ tồn tại rủi ro bảo mật “cửa hậu” (backdoor).

Song song đó, các doanh nghiệp công nghệ Trung Quốc như Huawei Technologies và Cambricon Technologies đang đẩy mạnh nghiên cứu, phát triển GPU nội địa nhằm củng cố chiến lược tự chủ công nghệ quốc gia.

Đầu tháng này, Giám đốc điều hành Nvidia Jensen Huang cũng thừa nhận thị phần chip cao cấp của hãng tại Trung Quốc đã giảm xuống mức “0”, đánh dấu bước chuyển mạnh trong bức tranh cạnh tranh công nghệ bán dẫn toàn cầu.

Bình luận

Tin bài khác

Giải pháp hỗ trợ doanh nghiệp mới chuyển đổi từ hộ kinh doanh
09:40, 26/11/2025

Giải pháp hỗ trợ doanh nghiệp mới chuyển đổi từ hộ kinh doanh

Song hành cùng làn sóng chuyển đổi mô hình từ hộ kinh doanh lên doanh nghiệp, Ngân hàng TMCP Đông Nam Á (SeABank, HOSE: SSB) tiên phong triển khai Gói giải pháp toàn diện dành cho doanh nghiệp mới chuyển đổi, hỗ trợ nhóm khách hàng này tiếp cận và tối ưu tài chính, đồng thời tháo gỡ vướng mắc, nâng cao năng lực và tạo đà phát triển bền vững.

Xem thêm
Nâng chuẩn bảo mật và kết nối cho hạ tầng AI đa trung tâm dữ liệu
12:08, 24/11/2025

Nâng chuẩn bảo mật và kết nối cho hạ tầng AI đa trung tâm dữ liệu

Được tăng cường sức mạnh bởi chip Silicon One P200 thế hệ mới, hệ thống định tuyến Cisco 8223 không chỉ tạo ra bước đột phá trong hiệu năng mạng mà còn tái định nghĩa tiêu chuẩn bảo mật cho các kiến trúc hạ tầng AI hiện đại.

Xem thêm
Sắp có tem chống hàng giả công nghệ số
16:33, 23/11/2025

Sắp có tem chống hàng giả công nghệ số

Viện Công nghệ Chống làm giả đang nghiên cứu triển khai hệ thống Tem điện tử truy xuất nguồn gốc và chống làm giả thông minh (NEWSTAR CHECK) sử dụng công nghệ số nhằm hướng tới xây dựng Hệ sinh thái niềm tin Quốc gia dựa trên minh bạch dữ liệu, bảo vệ người tiêu dùng và hỗ trợ doanh nghiệp chuyển đổi số chuỗi cung ứng.

Xem thêm
Ứng dụng công nghệ cao: giải pháp “lá chắn” chống hàng giả
16:30, 23/11/2025

Ứng dụng công nghệ cao: giải pháp “lá chắn” chống hàng giả

Trước thực trạng hàng giả, hàng nhái tràn lan, việc sử dụng các công nghệ như QR Code, NFC, RFID hay blockchain đang được đẩy mạnh tại Việt Nam để truy xuất nguồn gốc, tăng cường minh bạch sản phẩm và bảo vệ người tiêu dùng.

Xem thêm
Úc ra mắt trợ lý bảo mật AI CASPER: Phát hiện mối đe dọa nhanh chóng và thông minh hơn
07:49, 23/11/2025

Úc ra mắt trợ lý bảo mật AI CASPER: Phát hiện mối đe dọa nhanh chóng và thông minh hơn

Các nhà nghiên cứu tại Đại học Công nghệ Sydney (UTS), Úc, vừa phát triển một trợ lý ảo bảo mật mạng sử dụng trí tuệ nhân tạo (AI) nhằm hỗ trợ phát hiện sớm rủi ro và hướng dẫn người dùng, tổ chức xử lý sự cố tấn công mạng. Công cụ mới mang tên CASPER AI có khả năng tích hợp dữ liệu đa nguồn và đưa ra khuyến nghị theo ngữ cảnh.

Xem thêm
Sun Group được xướng danh Nơi làm việc tốt nhất Việt Nam 2025
13:32, 20/11/2025

Sun Group được xướng danh Nơi làm việc tốt nhất Việt Nam 2025

Tập đoàn Sun Group vừa chính thức được vinh danh trong Top 100 Nơi làm việc tốt nhất Việt Nam năm 2025 tại Lễ trao giải "Nơi làm việc tốt nhất Việt Nam" do Anphabe tổ chức vào tối 19/11/2025 tại TP. HCM.

Xem thêm
Thúc đẩy xu hướng sống khỏe với công nghệ tiên tiến
16:31, 23/11/2025

Thúc đẩy xu hướng sống khỏe với công nghệ tiên tiến

Công nghệ tiên tiến trên thiết bị đeo góp phần thúc đẩy nâng cao sức khỏe dân số quốc gia. Từ giấc ngủ, sức khỏe tim mạch, đến quá trình lão hóa, các thiết bị đeo đang tái định hình chuẩn mực trải nghiệm chăm sóc sức khỏe dự phòng...

Xem thêm