Các nhà nghiên cứu Trung Quốc công bố MemOS, 'hệ điều hành bộ nhớ' đầu tiên cung cấp khả năng thu hồi giống như con người cho AI
Các nhà nghiên cứu Trung Quốc công bố MemOS, 'hệ điều hành bộ nhớ' đầu tiên cung cấp khả năng thu hồi giống như con người cho AI.
- 14 min read
Các nhà nghiên cứu Trung Quốc ra mắt MemOS, ‘hệ điều hành bộ nhớ’ đầu tiên cung cấp khả năng thu hồi giống như con người cho AI
Các nhà nghiên cứu đã tiết lộ MemOS, một “hệ điều hành bộ nhớ” đột phá dành cho AI, mang lại cải thiện 159% trong các tác vụ lý luận và cho phép bộ nhớ liên tục giữa các phiên.
Bạn muốn có những hiểu biết sâu sắc hơn trong hộp thư đến của mình? Đăng ký nhận bản tin hàng tuần của chúng tôi để chỉ nhận những gì quan trọng đối với các nhà lãnh đạo AI, dữ liệu và bảo mật doanh nghiệp. Đăng ký ngay
Một nhóm các nhà nghiên cứu từ các tổ chức hàng đầu, bao gồm Đại học Giao thông Thượng Hải và Đại học Chiết Giang, đã phát triển cái mà họ gọi là “hệ điều hành bộ nhớ” đầu tiên cho trí tuệ nhân tạo, giải quyết một hạn chế cơ bản đã cản trở các hệ thống AI đạt được bộ nhớ và khả năng học tập liên tục giống như con người.
Hệ thống này, được gọi là MemOS, coi bộ nhớ là một tài nguyên tính toán cốt lõi có thể được lên lịch, chia sẻ và phát triển theo thời gian — giống như cách các hệ điều hành truyền thống quản lý CPU và tài nguyên lưu trữ. Nghiên cứu, được công bố ngày 4 tháng 7 trên arXiv, chứng minh sự cải thiện hiệu suất đáng kể so với các phương pháp hiện có, bao gồm mức tăng 159% trong các tác vụ lý luận tạm thời so với hệ thống bộ nhớ của OpenAI.
“Các Mô hình Ngôn ngữ Lớn (LLM) đã trở thành một cơ sở hạ tầng thiết yếu cho Trí tuệ Nhân tạo Tổng quát (AGI), nhưng việc thiếu các hệ thống quản lý bộ nhớ được xác định rõ ràng đã cản trở sự phát triển của lý luận theo ngữ cảnh dài, cá nhân hóa liên tục và tính nhất quán của kiến thức”, các nhà nghiên cứu viết trong bài báo của họ.
Các hệ thống AI đấu tranh với bộ nhớ liên tục trên các cuộc hội thoại
Các hệ thống AI hiện tại phải đối mặt với cái mà các nhà nghiên cứu gọi là vấn đề “kho lưu trữ bộ nhớ” — một hạn chế kiến trúc cơ bản ngăn cản chúng duy trì các mối quan hệ mạch lạc, dài hạn với người dùng. Về cơ bản, mỗi cuộc trò chuyện hoặc phiên đều bắt đầu lại từ đầu, với các mô hình không thể giữ lại các tùy chọn, kiến thức tích lũy hoặc mô hình hành vi trên các tương tác. Điều này tạo ra trải nghiệm người dùng bực bội, nơi một trợ lý AI có thể quên các hạn chế về chế độ ăn uống của người dùng được đề cập trong một cuộc trò chuyện khi được hỏi về các đề xuất nhà hàng trong cuộc trò chuyện tiếp theo.
Mặc dù một số giải pháp như Tạo Tăng cường Truy xuất (RAG) cố gắng giải quyết vấn đề này bằng cách kéo thông tin bên ngoài vào trong các cuộc trò chuyện, nhưng các nhà nghiên cứu cho rằng những giải pháp này vẫn là “các giải pháp thay thế không trạng thái mà không có kiểm soát vòng đời”. Vấn đề còn sâu xa hơn cả việc truy xuất thông tin đơn giản — đó là việc tạo ra các hệ thống thực sự có thể học hỏi và phát triển từ kinh nghiệm, giống như bộ nhớ của con người.
“Các mô hình hiện tại chủ yếu dựa vào các tham số tĩnh và các trạng thái theo ngữ cảnh tồn tại trong thời gian ngắn, hạn chế khả năng theo dõi các tùy chọn của người dùng hoặc cập nhật kiến thức trong các khoảng thời gian dài”, nhóm nghiên cứu giải thích. Hạn chế này trở nên đặc biệt rõ ràng trong môi trường doanh nghiệp, nơi các hệ thống AI được kỳ vọng sẽ duy trì ngữ cảnh trên các quy trình làm việc phức tạp, nhiều giai đoạn có thể kéo dài hàng ngày hoặc hàng tuần.
Hệ thống mới mang lại những cải tiến đáng kể trong các tác vụ lý luận AI
MemOS giới thiệu một phương pháp khác biệt về cơ bản thông qua cái mà các nhà nghiên cứu gọi là “MemCubes” — các đơn vị bộ nhớ tiêu chuẩn có thể đóng gói các loại thông tin khác nhau và có thể được cấu thành, di chuyển và phát triển theo thời gian. Chúng bao gồm từ kiến thức dựa trên văn bản rõ ràng đến các điều chỉnh ở cấp độ tham số và trạng thái kích hoạt trong mô hình, tạo ra một khuôn khổ thống nhất để quản lý bộ nhớ mà trước đây không tồn tại.
Thử nghiệm trên điểm chuẩn LOCOMO, đánh giá các tác vụ lý luận chuyên sâu về bộ nhớ, MemOS liên tục vượt trội so với các đường cơ sở đã được thiết lập trên tất cả các danh mục. Hệ thống đạt được mức cải thiện tổng thể 38,98% so với việc triển khai bộ nhớ của OpenAI, với những cải thiện đặc biệt mạnh mẽ trong các tình huống lý luận phức tạp, đòi hỏi kết nối thông tin trên nhiều lượt hội thoại.
“MemOS (MemOS-0630) luôn đứng đầu trong tất cả các danh mục, vượt trội hơn các đường cơ sở mạnh mẽ như mem0, LangMem, Zep và OpenAI-Memory, với biên độ đặc biệt lớn trong các cài đặt đầy thách thức như lý luận đa bước và lý luận tạm thời”, theo nghiên cứu. Hệ thống cũng mang lại những cải tiến đáng kể về hiệu quả, với mức giảm tới 94% độ trễ thời gian đến mã thông báo đầu tiên trong một số cấu hình nhất định thông qua cơ chế tiêm bộ nhớ KV-cache sáng tạo của nó.
Những cải tiến về hiệu suất này cho thấy rằng nút thắt cổ chai bộ nhớ là một hạn chế đáng kể hơn so với những gì đã hiểu trước đây. Bằng cách coi bộ nhớ là một tài nguyên tính toán hạng nhất, MemOS dường như mở ra các khả năng lý luận trước đây bị hạn chế bởi các giới hạn kiến trúc.
Công nghệ có thể định hình lại cách các doanh nghiệp triển khai trí tuệ nhân tạo
Những tác động đối với việc triển khai AI doanh nghiệp có thể mang tính chuyển đổi, đặc biệt khi các doanh nghiệp ngày càng dựa vào các hệ thống AI để có các mối quan hệ phức tạp, liên tục với khách hàng và nhân viên. MemOS cho phép những gì các nhà nghiên cứu mô tả là “di chuyển bộ nhớ đa nền tảng”, cho phép bộ nhớ AI có thể di động trên các nền tảng và thiết bị khác nhau, phá vỡ cái mà họ gọi là “ốc đảo bộ nhớ” hiện đang giữ ngữ cảnh người dùng trong các ứng dụng cụ thể.
Hãy xem xét sự thất vọng hiện tại mà nhiều người dùng gặp phải khi những hiểu biết sâu sắc được khám phá trong một nền tảng AI không thể chuyển sang một nền tảng khác. Một nhóm tiếp thị có thể phát triển chân dung khách hàng chi tiết thông qua các cuộc trò chuyện với ChatGPT, chỉ để bắt đầu lại từ đầu khi chuyển sang một công cụ AI khác để lập kế hoạch chiến dịch. MemOS giải quyết vấn đề này bằng cách tạo ra một định dạng bộ nhớ tiêu chuẩn có thể di chuyển giữa các hệ thống.
Nghiên cứu cũng vạch ra tiềm năng cho “các mô-đun bộ nhớ trả phí”, nơi các chuyên gia trong lĩnh vực có thể đóng gói kiến thức của họ thành các đơn vị bộ nhớ có thể mua được. Các nhà nghiên cứu hình dung ra các kịch bản trong đó “một sinh viên y khoa trong quá trình luân phiên lâm sàng có thể muốn nghiên cứu cách quản lý một tình trạng tự miễn dịch hiếm gặp. Một bác sĩ có kinh nghiệm có thể đóng gói các phương pháp chẩn đoán heuristic, đường dẫn đặt câu hỏi và các mẫu trường hợp điển hình vào một bộ nhớ có cấu trúc” có thể được cài đặt và sử dụng bởi các hệ thống AI khác.
Mô hình thị trường này có thể thay đổi cơ bản cách kiến thức chuyên môn được phân phối và kiếm tiền trong các hệ thống AI, tạo ra các cơ hội kinh tế mới cho các chuyên gia đồng thời dân chủ hóa quyền truy cập vào kiến thức lĩnh vực chất lượng cao. Đối với các doanh nghiệp, điều này có thể có nghĩa là triển khai nhanh chóng các hệ thống AI với kiến thức chuyên môn sâu rộng trong các lĩnh vực cụ thể mà không phải chịu chi phí và thời gian liên quan đến đào tạo tùy chỉnh.
Thiết kế ba lớp phản ánh các hệ điều hành máy tính truyền thống
Kiến trúc kỹ thuật của MemOS phản ánh hàng thập kỷ học hỏi từ thiết kế hệ điều hành truyền thống, được điều chỉnh cho những thách thức riêng của quản lý bộ nhớ AI. Hệ thống sử dụng kiến trúc ba lớp: một lớp giao diện cho các lệnh gọi API, một lớp hoạt động để lên lịch bộ nhớ và quản lý vòng đời và một lớp cơ sở hạ tầng để lưu trữ và quản trị.
Thành phần MemScheduler của hệ thống quản lý động các loại bộ nhớ khác nhau — từ trạng thái kích hoạt tạm thời đến sửa đổi tham số vĩnh viễn — chọn các chiến lược lưu trữ và truy xuất tối ưu dựa trên mô hình sử dụng và yêu cầu tác vụ. Điều này thể hiện một sự khác biệt đáng kể so với các phương pháp hiện tại, thường coi bộ nhớ là hoàn toàn tĩnh (được nhúng trong các tham số mô hình) hoặc hoàn toàn phù du (giới hạn trong ngữ cảnh hội thoại).
“Trọng tâm chuyển từ việc mô hình học được bao nhiêu kiến thức một lần sang việc liệu nó có thể biến kinh nghiệm thành bộ nhớ có cấu trúc và liên tục truy xuất và tái cấu trúc nó hay không”, các nhà nghiên cứu lưu ý, mô tả tầm nhìn của họ về cái mà họ gọi là các mô hình “Mem-training”. Triết lý kiến trúc này gợi ý một cách suy nghĩ lại cơ bản về cách các hệ thống AI nên được thiết kế, chuyển từ mô hình đào tạo trước quy mô lớn hiện tại sang học tập dựa trên kinh nghiệm, năng động hơn.
Sự tương đồng với phát triển hệ điều hành rất nổi bật. Giống như các máy tính ban đầu yêu cầu các lập trình viên quản lý thủ công việc phân bổ bộ nhớ, các hệ thống AI hiện tại yêu cầu các nhà phát triển điều phối cẩn thận cách thông tin luân chuyển giữa các thành phần khác nhau. MemOS trừu tượng hóa sự phức tạp này, có khả năng cho phép một thế hệ ứng dụng AI mới có thể được xây dựng trên nền tảng quản lý bộ nhớ phức tạp mà không cần kiến thức chuyên môn sâu.
Các nhà nghiên cứu phát hành mã nguồn mở để đẩy nhanh quá trình chấp nhận
Nhóm nghiên cứu đã phát hành MemOS dưới dạng một dự án mã nguồn mở, với toàn bộ mã có sẵn trên GitHub và hỗ trợ tích hợp cho các nền tảng AI chính bao gồm HuggingFace, OpenAI và Ollama. Chiến lược mã nguồn mở này dường như được thiết kế để đẩy nhanh quá trình chấp nhận và khuyến khích phát triển cộng đồng, thay vì theo đuổi một phương pháp độc quyền có thể hạn chế việc triển khai rộng rãi.
“Chúng tôi hy vọng MemOS giúp thúc đẩy các hệ thống AI từ các trình tạo tĩnh thành các tác nhân hướng đến bộ nhớ, liên tục phát triển”, trưởng dự án Zhiyu Li nhận xét trong kho lưu trữ GitHub. Hệ thống hiện hỗ trợ các nền tảng Linux, với hỗ trợ Windows và macOS được lên kế hoạch, cho thấy nhóm đang ưu tiên việc chấp nhận của doanh nghiệp và nhà phát triển hơn là khả năng tiếp cận của người tiêu dùng ngay lập tức.
Chiến lược phát hành mã nguồn mở phản ánh một xu hướng rộng lớn hơn trong nghiên cứu AI, trong đó những cải tiến cơ sở hạ tầng nền tảng được chia sẻ công khai để mang lại lợi ích cho toàn bộ hệ sinh thái. Cách tiếp cận này đã đẩy nhanh quá trình đổi mới trong các lĩnh vực như khung học sâu trong lịch sử và có thể có tác dụng tương tự đối với quản lý bộ nhớ trong các hệ thống AI.
Các gã khổng lồ công nghệ chạy đua để giải quyết các giới hạn bộ nhớ AI
Nghiên cứu đến khi các công ty AI lớn phải vật lộn với những hạn chế của các phương pháp bộ nhớ hiện tại, làm nổi bật mức độ cơ bản của thách thức này đối với ngành. OpenAI gần đây đã giới thiệu các tính năng bộ nhớ cho ChatGPT, trong khi Anthropic, Google và các nhà cung cấp khác đã thử nghiệm với các hình thức ngữ cảnh liên tục khác nhau. Tuy nhiên, những triển khai này thường bị giới hạn về phạm vi và thường thiếu cách tiếp cận có hệ thống mà MemOS cung cấp.
Thời điểm của nghiên cứu này cho thấy rằng quản lý bộ nhớ đã nổi lên như một chiến trường cạnh tranh quan trọng trong phát triển AI. Các công ty có thể giải quyết vấn đề bộ nhớ một cách hiệu quả có thể đạt được lợi thế đáng kể trong việc giữ chân và làm hài lòng người dùng, vì các hệ thống AI của họ sẽ có thể xây dựng các mối quan hệ sâu sắc hơn, hữu ích hơn theo thời gian.
Những người quan sát trong ngành từ lâu đã dự đoán rằng đột phá lớn tiếp theo trong AI không nhất thiết đến từ các mô hình lớn hơn hoặc nhiều dữ liệu đào tạo hơn mà từ những đổi mới kiến trúc mô phỏng tốt hơn khả năng nhận thức của con người. Quản lý bộ nhớ thể hiện chính xác loại tiến bộ cơ bản này — một tiến bộ có thể mở ra các ứng dụng và trường hợp sử dụng mới mà không thể có với các hệ thống không trạng thái hiện tại.
Sự phát triển này đại diện cho một phần của sự thay đổi rộng lớn hơn trong nghiên cứu AI theo hướng các hệ thống trạng thái, liên tục hơn có thể tích lũy và phát triển kiến thức theo thời gian — các khả năng được xem là thiết yếu đối với trí tuệ nhân tạo tổng quát. Đối với các nhà lãnh đạo công nghệ doanh nghiệp đánh giá việc triển khai AI, MemOS có thể đại diện cho một bước tiến đáng kể trong việc xây dựng các hệ thống AI duy trì ngữ cảnh và cải thiện theo thời gian, thay vì coi mỗi tương tác là riêng biệt.
Nhóm nghiên cứu chỉ ra rằng họ có kế hoạch khám phá việc chia sẻ bộ nhớ giữa các mô hình, các khối bộ nhớ tự phát triển và sự phát triển của một hệ sinh thái “thị trường bộ nhớ” rộng lớn hơn trong công việc tương lai. Nhưng có lẽ tác động đáng kể nhất của MemOS sẽ không phải là việc triển khai kỹ thuật cụ thể mà là bằng chứng cho thấy việc coi bộ nhớ là một tài nguyên tính toán hạng nhất có thể mở ra những cải tiến đáng kể về khả năng AI. Trong một ngành công nghiệp phần lớn tập trung vào việc mở rộng quy mô kích thước mô hình và dữ liệu đào tạo, MemOS cho thấy rằng đột phá tiếp theo có thể đến từ kiến trúc tốt hơn thay vì máy tính lớn hơn.
Link bài viết gốc
- Tags:
- Ai
- 09 July 2025
- Venturebeat.com