Một startup công nghệ mang tên Memories AI đang theo đuổi mục tiêu táo bạo: giúp robot và thiết bị đeo có khả năng ghi nhớ, tái hiện trải nghiệm như con người, thông qua một khái niệm mới mang tên “tầng bộ nhớ thị giác”. Ý tưởng này bắt nguồn từ một câu hỏi mang tính nền tảng: nếu trí tuệ nhân tạo đã vận hành hiệu quả trong thế giới số, thì làm thế nào để nó thích nghi với thế giới vật lý?
Shawn Shen - người đồng sáng lập Memories AI đặt ra vấn đề. “AI đã hoạt động rất tốt trong môi trường kỹ thuật số. Nhưng còn thế giới thực thì sao?”. Theo ông, các hệ thống như robot hay thiết bị đeo thông minh không thể chỉ dựa vào dữ liệu văn bản, mà cần ghi nhớ những gì chúng “nhìn thấy” để thực sự hiểu và tương tác với môi trường xung quanh.
![]() |
| Video ra mắt Memories AI (nguồn: Memories AI) |
Từ "ghi hình" đến "hiểu và ghi nhớ"
Khác với các hệ thống AI truyền thống vốn xử lý dữ liệu văn bản, Memories AI tập trung vào việc biến dữ liệu hình ảnh thành dạng “ký ức có thể truy xuất”. Công nghệ cốt lõi của công ty là “tầng bộ nhớ thị giác” - lớp hạ tầng cho phép lưu trữ, lập chỉ mục và tìm kiếm video theo ngữ nghĩa.
Điểm nổi bật nằm ở khả năng truy hồi gần như tức thì. Với mô hình LVMM 2.0, người dùng có thể tìm lại một khoảnh khắc cụ thể trong chưa đầy một giây, hoặc đặt câu hỏi bằng ngôn ngữ tự nhiên để hệ thống “gợi nhớ” lại sự kiện liên quan. Thậm chí, việc sử dụng hình ảnh làm tín hiệu gợi ý cũng được hỗ trợ, mô phỏng cách con người liên tưởng khi hồi tưởng ký ức.
Cách tiếp cận này góp phần thu hẹp khoảng cách giữa việc “ghi lại dữ liệu” và “hiểu ngữ cảnh” - một hạn chế lớn của nhiều hệ thống AI hiện nay.
Tại sự kiện GTC 2026, Memories AI thu hút sự chú ý khi hợp tác với Nvidia để phát triển công nghệ của mình. Công ty sử dụng mô hình Cosmos-Reason 2 kết hợp nền tảng Metropolis nhằm xử lý, phân tích và tổ chức dữ liệu video theo cách có thể tìm kiếm và khai thác hiệu quả.
Thay vì tham gia cuộc đua phần cứng, Memories AI lựa chọn tập trung vào hạ tầng dữ liệu và mô hình AI. Nhóm sáng lập – từng làm việc tại Meta và tham gia phát triển kính thông minh - nhận ra rằng việc ghi hình là chưa đủ nếu người dùng không thể truy xuất thông tin một cách hiệu quả. Chính nhận thức này đã thúc đẩy họ rời Meta vào năm 2024 để thành lập công ty riêng, tập trung giải quyết “nút thắt” trong cách AI xử lý dữ liệu thị giác.
![]() |
| Shawn Shen, nhà đồng sáng lập Memories AI (nguồn: Memories AI) |
Trong vài năm gần đây, nhiều “ông lớn” công nghệ như OpenAI hay Google đã bắt đầu tích hợp khả năng “ghi nhớ” cho AI, chủ yếu dưới dạng lưu trữ hội thoại văn bản. Tuy nhiên, theo Shawn Shen, cách tiếp cận này chưa phù hợp với các ứng dụng ngoài đời thực. Ông nhấn mạnh thêm rằng :“Thế giới vật lý vận hành dựa trên hình ảnh nhiều hơn là văn bản”
Do đó, việc xây dựng bộ nhớ thị giác không chỉ là một cải tiến kỹ thuật, mà còn là bước chuyển quan trọng để AI có thể thực sự “hiện diện” và vận hành trong môi trường thực.
Để huấn luyện hệ thống, Memories AI phát triển thiết bị nội bộ mang tên Luci, cho phép ghi lại video phục vụ đào tạo mô hình. Tuy nhiên, công ty khẳng định không có tham vọng trở thành nhà sản xuất phần cứng. Thay vào đó, Luci chỉ đóng vai trò thu thập dữ liệu chất lượng cao, giúp cải thiện khả năng hiểu và tổ chức thông tin của AI. Cách tiếp cận này cho thấy trọng tâm của Memories AI nằm ở xử lý và khai thác dữ liệu, thay vì thiết bị ghi hình.
Tham vọng đưa "ký ức số" vào đời sống
Memories AI hiện đã huy động được 16 triệu USD từ các quỹ đầu tư và đang hợp tác với Qualcomm nhằm đưa công nghệ của mình lên smartphone, kính thực tế ảo và máy tính cá nhân trong thời gian tới.
Theo Shawn Shen, thị trường robot và thiết bị đeo có thể chưa bùng nổ ngay lập tức, nhưng đó chỉ là vấn đề thời gian. Khi các thiết bị này trở nên phổ biến, khả năng ghi nhớ và truy xuất trải nghiệm sẽ trở thành một tính năng cốt lõi.
Ông cho biết :“Cuối cùng, mọi hệ thống thông minh đều cần ký ức”. Nếu tầm nhìn này trở thành hiện thực, “ký ức số” có thể sẽ không còn là khái niệm xa vời, mà trở thành lớp nền mặc định cho thế hệ thiết bị thông minh tiếp theo.
Thuý Hằng (tổng hợp)



Bình luận