Alibaba phát triển công nghệ giúp giảm 82% nhu cầu dùng chip Nvidia cho mô hình AI

Alibaba vừa công bố hệ thống Aegaeon - giải pháp tối ưu mới giúp cắt giảm tới 82% số lượng chip Nvidia GPU cần thiết cho việc xử lý và vận hành các mô hình trí tuệ nhân tạo quy mô lớn.

09:52, 20/10/2025
Các nhà nghiên cứu trên toàn cầu đã tìm cách cải thiện hiệu suất bằng phương pháp gộp chung sức mạnh GPU.
Các nhà nghiên cứu trên toàn cầu đã tìm cách cải thiện hiệu suất bằng phương pháp gộp chung sức mạnh GPU.

Theo công bố, Aegaeon đã được thử nghiệm nội bộ trên chợ mô hình của Alibaba Cloud trong hơn ba tháng. Kết quả cho thấy hệ thống có thể giảm số lượng GPU Nvidia H20 phục vụ hàng chục mô hình AI khổng lồ, lên đến 72 tỷ tham số, từ 1.192 chip xuống chỉ còn 213 chip.

Công trình nghiên cứu này được nhóm khoa học của Đại học Bắc Kinh và Alibaba Cloud trình bày tại Hội nghị chuyên đề quốc tế lần thứ 31 về Nguyên tắc Hệ điều hành (SOSP) tổ chức tại Hàn Quốc. Báo cáo chỉ ra chi phí khổng lồ phát sinh khi vận hành đồng thời nhiều mô hình ngôn ngữ lớn (LLM), trong đó 17,7% GPU chỉ được sử dụng để đáp ứng 1,35% tổng số yêu cầu trên chợ mô hình của Alibaba Cloud.

Trên thế giới, các nhà nghiên cứu đang tìm cách tăng hiệu suất xử lý bằng chiến lược “gộp GPU” - cho phép một GPU phục vụ nhiều mô hình AI cùng lúc. Tuy nhiên, giải pháp Aegaeon của Alibaba vượt xa các phương pháp trước đó khi triển khai cơ chế “tự động mở rộng và thu hẹp” (auto-scaling) ở cấp độ token - đơn vị dữ liệu cơ bản trong quá trình huấn luyện và suy luận của AI.

Nhờ đó, một GPU duy nhất có thể phục vụ tối đa bảy mô hình khác nhau, thay vì chỉ hai hoặc ba mô hình như trong các hệ thống cạnh tranh khác, đồng thời giảm tới 97% độ trễ (latency) khi chuyển đổi giữa các mô hình AI.

Trong bối cảnh tập đoàn chip Mỹ Nvidia đang chịu ảnh hưởng nặng nề từ chính sách kiểm soát xuất khẩu công nghệ của chính quyền Tổng thống Biden, dòng chip H20 - được thiết kế riêng cho thị trường Trung Quốc - đã trở thành giải pháp thay thế chủ lực cho các mô hình AI tại quốc gia này. Tuy nhiên, con chip này gần đây bị các cơ quan quản lý Trung Quốc điều tra do nghi ngờ tồn tại rủi ro bảo mật “cửa hậu” (backdoor).

Song song đó, các doanh nghiệp công nghệ Trung Quốc như Huawei Technologies và Cambricon Technologies đang đẩy mạnh nghiên cứu, phát triển GPU nội địa nhằm củng cố chiến lược tự chủ công nghệ quốc gia.

Đầu tháng này, Giám đốc điều hành Nvidia Jensen Huang cũng thừa nhận thị phần chip cao cấp của hãng tại Trung Quốc đã giảm xuống mức “0”, đánh dấu bước chuyển mạnh trong bức tranh cạnh tranh công nghệ bán dẫn toàn cầu.

Bình luận

Tin bài khác

VNIDCheck: Quét mã QR trên VNeID để phát hiện hàng giả, truy xuất nguồn gốc sản phẩm
13:54, 18/10/2025

VNIDCheck: Quét mã QR trên VNeID để phát hiện hàng giả, truy xuất nguồn gốc sản phẩm

Người dân sắp tới sẽ có thể kiểm tra hàng giả, hàng nhái và truy xuất nguồn gốc sản phẩm chỉ bằng cách quét mã QR trên ứng dụng VNeID, thông qua công cụ mới mang tên VNIDCheck do Bộ Công an triển khai.

Xem thêm
Tiên phong đưa Việt Nam bước vào kỷ nguyên XGS-PON và Wi-Fi 7
09:00, 17/10/2025

Tiên phong đưa Việt Nam bước vào kỷ nguyên XGS-PON và Wi-Fi 7

Sự kết hợp giữa XGS-PON và Wi-Fi 7 trong cùng một hệ sinh thái thiết bị đầu cuối do Công ty Cổ phần Công nghệ Công nghiệp Bưu chính Viễn thông (VNPT Technology) phát triển đã mở ra kỷ nguyên mới cho Internet tốc độ siêu cao, độ trễ cực thấp, đồng thời nâng tầm năng lực sản xuất thiết bị viễn thông “Make in Vietnam”.

Xem thêm
Giải pháp công nghệ xanh cho mục tiêu giảm khí mê-tan
16:56, 16/10/2025

Giải pháp công nghệ xanh cho mục tiêu giảm khí mê-tan

Australia đang đầu tư vào các công nghệ mới, phát triển thức ăn chăn nuôi tiên tiến giúp giảm phát thải từ gia súc, và nỗ lực thu hồi khí mê-tan từ ngành công nghiệp than.

Xem thêm
Khóa học an ninh mạng trực tuyến dành cho sinh viên
09:07, 16/10/2025

Khóa học an ninh mạng trực tuyến dành cho sinh viên

Công ty bảo mật Kaspersky vừa giới thiệu khóa học trực tuyến miễn phí về an ninh mạng dành cho sinh viên năm nhất và năm hai. Khóa học giúp người học hiểu rõ hơn về rủi ro trực tuyến và hình thành tư duy bảo mật sớm - yếu tố được xem là nền tảng cho mọi ngành nghề trong thời đại số.

Xem thêm
SkyWire - “mạch định thời” siêu chính xác bảo vệ hạ tầng trọng yếu
08:55, 16/10/2025

SkyWire - “mạch định thời” siêu chính xác bảo vệ hạ tầng trọng yếu

Để bảo vệ các cơ sở hạ tầng trọng yếu, công nghệ SkyWire cho phép bám tín hiệu định thời có khả năng mở rộng và độ chính xác cao theo tín hiệu định thời từ các phòng thí nghiệm đo lường…

Xem thêm
Bảo hiểm xã hội bước vào giai đoạn số hóa: Hai thủ tục đầu tiên lên VNeID
15:59, 15/10/2025

Bảo hiểm xã hội bước vào giai đoạn số hóa: Hai thủ tục đầu tiên lên VNeID

Hai thủ tục hành chính trong lĩnh vực bảo hiểm xã hội sẽ chính thức được triển khai trên ứng dụng VNeID, giúp người dân có thể nộp hồ sơ, theo dõi và nhận kết quả trực tuyến, không cần nộp giấy tờ trực tiếp.

Xem thêm
Khi AI lạc đường: Chuyến du lịch như cơn ác mộng của khách Tây
14:44, 15/10/2025

Khi AI lạc đường: Chuyến du lịch như cơn ác mộng của khách Tây

Từ việc bảo tàng đóng cửa đến nhà hàng cách xa tận 20 phút, câu chuyện du lịch do AI lên kế hoạch nhiều khi khiến du khách “vừa tốn tiền vừa mất thời gian”. Hậu quả là nhiều hành trình bị “đứt gánh giữa đường”, khiến du khách mệt mỏi và hoài nghi về độ tin cậy của trí tuệ nhân tạo.

Xem thêm