Tương lai của hệ sinh thái AI nguồn mở toàn cầu- Từ DeepSeek đến AI+
Tương lai của hệ sinh thái AI nguồn mở toàn cầu- Từ DeepSeek đến AI+
- 12 min read
Tương lai của Hệ sinh thái AI Nguồn mở Toàn cầu: Từ DeepSeek đến AI+
Đây là bài viết thứ ba và cũng là cuối cùng trong loạt ba bài viết về những tiến bộ lịch sử của cộng đồng nguồn mở AI tại Trung Quốc kể từ “Khoảnh khắc DeepSeek” vào tháng 1 năm 2025. Bài viết đầu tiên về những thay đổi chiến lược và sự phát triển các tạo tác mở có sẵn tại đây, và bài viết thứ hai về những thay đổi kiến trúc và phần cứng có sẵn tại đây.
Trong bài viết thứ ba này, chúng tôi xem xét các con đường và quỹ đạo của các tổ chức AI nổi bật của Trung Quốc, đồng thời đề xuất các hướng đi tương lai cho nguồn mở.
Đối với các nhà nghiên cứu và nhà phát triển AI đóng góp và phụ thuộc vào hệ sinh thái nguồn mở, và đối với các nhà hoạch định chính sách hiểu môi trường đang thay đổi nhanh chóng, do những lợi ích trong nội bộ tổ chức và cộng đồng toàn cầu, nguồn mở là phương pháp thống trị và phổ biến cho các tổ chức AI của Trung Quốc trong tương lai gần. Việc chia sẻ công khai các tạo tác từ mô hình đến bài báo đến cơ sở hạ tầng triển khai phản ánh một chiến lược với mục tiêu triển khai và tích hợp quy mô lớn.
Hệ sinh thái AI Nguồn mở Tự nhiên của Trung Quốc
Sau khi xem xét những thay đổi chiến lược và kiến trúc kể từ R1 của DeepSeek, chúng tôi lần đầu tiên có cái nhìn thoáng qua về cách hệ sinh thái AI nguồn mở tự nhiên đang hình thành tại Trung Quốc. Sự kết hợp của các đối thủ mạnh, một số đã có uy tín trong nguồn mở, một số là người chơi mới, và một số đang thay đổi hoàn toàn để đóng góp vào văn hóa mở mới, cho thấy phương pháp hợp tác mở mang lại lợi ích chung.
Sự hợp tác này đang vươn ra ngoài biên giới quốc gia; tổ chức được theo dõi nhiều nhất trên Hugging Face là DeepSeek, và thứ tư là Qwen.

Ngoài các mô hình, việc chia sẻ khoa học và kỹ thuật một cách cởi mở không chỉ thông báo cho các tổ chức AI khác mà còn cho toàn bộ cộng đồng nguồn mở. Các bài báo phổ biến nhất trên Hugging Face phần lớn đến từ các tổ chức Trung Quốc, cụ thể là ByteDance, DeepSeek, Tencent và Qwen.
Nguồn: https://huggingface.co/spaces/evijit/PaperVerse
Những Tổ chức Hiện tại
Alibaba định vị nguồn mở như một chiến lược hệ sinh thái và cơ sở hạ tầng. Qwen không được định hình như một mô hình hàng đầu duy nhất, mà được mở rộng liên tục thành một dòng họ bao gồm nhiều kích cỡ, tác vụ và phương thức khác nhau, với các bản cập nhật thường xuyên trên Hugging Face và nền tảng ModelScope của riêng họ. Ảnh hưởng của nó không tập trung vào bất kỳ phiên bản đơn lẻ nào. Thay vào đó, nó được tái sử dụng nhiều lần như một thành phần trong các kịch bản khác nhau, dần dần đảm nhận vai trò là nền tảng AI tổng quát. Đến giữa năm 2025, Qwen trở thành mô hình có nhiều dẫn xuất nhất trên Hugging Face, với hơn 113 nghìn mô hình sử dụng Qwen làm cơ sở, và hơn 200 nghìn kho mô hình gắn thẻ Qwen, vượt xa Llama của Meta với 27 nghìn hoặc DeepSeek với 6 nghìn. Trên toàn tổ chức, Alibaba tự hào có nhiều dẫn xuất gần bằng cả Google và Meta cộng lại.
Tencent cũng thực hiện một bước đi quan trọng từ việc vay mượn sang xây dựng. Là một trong những công ty lớn đầu tiên tích hợp DeepSeek vào các sản phẩm tiêu dùng cốt lõi sau khi R1 được phát hành, Tencent ban đầu không coi nguồn mở là một câu chuyện công khai. Thay vào đó, họ đưa các mô hình trưởng thành vào thông qua tích hợp kiểu plug-in, thực hiện xác thực quy mô lớn và chỉ sau đó mới bắt đầu phát hành khả năng của riêng mình. Từ tháng 5 năm 2025 trở đi, Tencent đã đẩy nhanh việc phát hành công khai trong các lĩnh vực mà họ đã có thế mạnh, chẳng hạn như thị giác, video và 3D với thương hiệu riêng mang tên Tencent Hunyuan (nay là Tencent HY), và các mô hình này nhanh chóng được cộng đồng chấp nhận.
ByteDance, bằng cách tuân theo phương pháp “nhà máy ứng dụng AI” của mình, bắt đầu chọn lọc các thành phần có giá trị cao nguồn mở hóa trong khi vẫn duy trì trọng tâm cạnh tranh vào các điểm truy cập sản phẩm và việc sử dụng quy mô lớn. Trong bối cảnh này, nhóm Seed của ByteDance đã đóng góp một số tạo tác nguồn mở đáng chú ý, bao gồm UI-TARS-1.5 cho hiểu biết UI đa phương thức, Seed-Coder cho mô hình hóa mã tập trung vào dữ liệu và bộ dữ liệu SuperGPQA để đánh giá lý luận có hệ thống. Mặc dù có sự hiện diện nguồn mở tương đối kín đáo, ByteDance đã đạt được quy mô đáng kể trên thị trường AI của Trung Quốc, với ứng dụng AI Doubao của họ vượt qua 100 triệu người dùng hoạt động hàng ngày vào tháng 12 năm 2025.
Baidu, CEO của công ty này công khai kêu gọi ngừng nguồn mở, cũng bắt đầu thay đổi: sau nhiều năm ưu tiên các mô hình đóng, họ đã tái gia nhập hệ sinh thái thông qua quyền truy cập miễn phí và phát hành công khai, chẳng hạn như loạt Ernie 4.5. Sự thay đổi này đi kèm với việc đầu tư lại vào khung nguồn mở của họ, PaddlePaddle, cũng như chip AI của riêng họ, Kunlunxin, công ty đã công bố IPO vào ngày 1 tháng 1 năm 2026. Bằng cách kết nối các mô hình, chip và PaddlePaddle trong một hệ thống cởi mở hơn, Baidu có thể giảm chi phí, thu hút các nhà phát triển và ảnh hưởng đến các tiêu chuẩn, đồng thời duy trì quyền kiểm soát chiến lược trong các ràng buộc chung về tính toán, chi phí và quy định.
Sự Bình thường của “Những Khoảnh khắc DeepSeek”
Trong số các công ty khởi nghiệp, Moonshot, Z.ai, và MiniMax đã nhanh chóng điều chỉnh và mang lại động lực mới cho cộng đồng nguồn mở trong vòng vài tháng sau R1. Các mô hình như Kimi K2, GLM-4.5, và MiniMax M2 đều đã giành được vị trí trong bảng xếp hạng các cột mốc mô hình mở của AI-World. Cuối năm 2025, Z.ai và MiniMax đã phát hành các mô hình nguồn mở tiên tiến nhất của họ cho đến nay và sau đó liên tiếp công bố kế hoạch IPO của họ.
Việc nguồn mở hóa Kimi K2 được mô tả rộng rãi là “một khoảnh khắc DeepSeek nữa” đối với cộng đồng. Mặc dù Moonshot chưa công bố IPO, các báo cáo thị trường cho thấy công ty đã huy động được khoảng 500 triệu USD vốn vào cuối năm 2025, với AGI và các hệ thống dựa trên tác nhân được định vị là mục tiêu thương mại hóa chính của họ.
Các công ty tập trung vào ứng dụng như Xiaohongshu, Bilibili, Xiaomi và Meituan, trước đây chỉ tập trung vào lớp ứng dụng, đã bắt đầu đào tạo và phát hành các mô hình của riêng họ. Với lợi thế nội tại về các tình huống sử dụng thực tế và dữ liệu chuyên ngành, một khi khả năng suy luận mạnh mẽ trở nên khả dụng với chi phí thấp thông qua nguồn mở, việc xây dựng mô hình nội bộ đã trở nên thực tế. Nó điều chỉnh AI xoay quanh các hoạt động kinh doanh cụ thể của họ, thay vì bị giới hạn bởi cấu trúc chi phí hoặc giới hạn của các nhà cung cấp bên ngoài.
Nếu thế giới kinh doanh nắm bắt cơ hội có ROI tích cực để tăng trưởng, thì các viện nghiên cứu và cộng đồng rộng lớn hơn càng chào đón sự thay đổi một cách tự nguyện hơn. Các tổ chức như BAAI và Shanghai AI Lab đã chuyển nhiều nỗ lực hơn cho các chuỗi công cụ, hệ thống đánh giá, nền tảng dữ liệu và cơ sở hạ tầng triển khai, các dự án như FlagOpen, OpenDataLab và OpenCompass. Những nỗ lực này không theo đuổi hiệu suất mô hình đơn lẻ, mà thay vào đó củng cố các nền tảng dài hạn của hệ sinh thái.
Nền tảng cho Tương lai
Đặc điểm nổi bật của hệ sinh thái mới không phải là có nhiều mô hình hơn, mà là toàn bộ chuỗi đã hình thành. Các mô hình có thể được nguồn mở hóa và mở rộng; việc triển khai có thể được tái sử dụng và mở rộng quy mô; phần mềm và phần cứng có thể được phối hợp và thay thế; và khả năng quản trị có thể được nhúng và kiểm toán. Đây là một sự thay đổi từ những đột phá riêng lẻ sang một hệ thống thực sự có thể hoạt động trong thế giới thực.
Hệ sinh thái này không xuất hiện sau một đêm. Nó được xây dựng dựa trên nhiều năm tích lũy cơ sở hạ tầng “làn gió thuận” kể từ năm 2017. Trong vài năm qua, Trung Quốc đã đầu tư định kỳ vào các trung tâm dữ liệu và trung tâm tính toán, dần dần hình thành một bố cục tính toán tích hợp, toàn quốc tập trung vào chiến lược “Đông Dữ liệu, Tây Tính toán”. Kế hoạch quốc gia đã thiết lập 8 trung tâm tính toán lớn và 10 cụm trung tâm dữ liệu, hướng dẫn nhu cầu tính toán từ miền Đông sang các khu vực trung tâm và miền Tây.
Thông tin công khai cho thấy Trung Quốc có ý định đầu tư vào tăng trưởng liên tục về năng lực năng lượng. Tổng năng lực tính toán của Trung Quốc vào khoảng 1590 EFLOPS tính đến năm 2025, xếp trong top đầu toàn cầu. Các nguồn tin tại Trung Quốc khẳng định rằng năng lực tính toán thông minh, được tùy chỉnh cho việc đào tạo và triển khai AI, dự kiến sẽ tăng khoảng 43% hàng năm, vượt xa tính toán đa năng. Đồng thời, hiệu suất sử dụng năng lượng trung bình của trung tâm dữ liệu (PUE) đã giảm xuống còn khoảng 1.46, cho thấy hiệu quả tốt hơn và cung cấp một nền tảng phần cứng vững chắc cho AI ở quy mô lớn. Năng lượng rõ ràng là một trọng tâm chính.
Nếu “Kế hoạch Phát triển AI Thế hệ Mới” năm 2017 chủ yếu là về việc định hướng và xây dựng nền tảng, thì kế hoạch hành động “AI+” tháng 8 năm 2025 đã rõ ràng chuyển trọng tâm sang triển khai quy mô lớn và tích hợp sâu. Điều này đánh dấu một mục tiêu theo đuổi khác biệt về mặt định hướng so với AGI. Sự xuất hiện của R1 đã cung cấp “đòn bẩy” còn thiếu ở cấp độ kỹ thuật và hệ sinh thái. Đó là chất xúc tác đã kích hoạt một cách có hệ thống cơ sở hạ tầng tính toán, năng lượng và dữ liệu vốn đã được xây dựng.
Kết quả là, trong năm sau khi R1 được phát hành, sự phát triển AI của Trung Quốc đã tăng tốc theo hai con đường chính. Thứ nhất, AI ngày càng được tích hợp sâu hơn vào các quy trình công nghiệp, vượt ra ngoài các chatbot hướng tới các tác nhân và quy trình làm việc. Thứ hai, sự nhấn mạnh lớn hơn được đặt vào các hệ thống AI tự chủ và có thể kiểm soát, được phản ánh trong các con đường đào tạo linh hoạt hơn và các chiến lược triển khai ngày càng cục bộ hóa.
Nhìn lại, bước ngoặt thực sự không phải là sự tăng trưởng về số lượng mô hình, mà là sự thay đổi cơ bản trong cách các mô hình nguồn mở được sử dụng. Nguồn mở đã chuyển từ một lựa chọn tùy chọn sang một giả định mặc định trong thiết kế hệ thống. Các mô hình trở thành các thành phần có thể tái sử dụng và kết hợp trong các hệ thống kỹ thuật lớn hơn.
Nhìn Lại để Hướng Tới Tương Lai
Từ DeepSeek đến “AI+”, con đường của Trung Quốc vào năm 2025 không phải là theo đuổi hiệu suất đỉnh cao. Đó là về việc xây dựng một con đường thực tế được tổ chức xung quanh nguồn mở, hiệu quả kỹ thuật và phân phối có khả năng mở rộng, một con đường vốn đã bắt đầu tự vận hành.
Những hạn chế về tài nguyên không giới hạn sự phát triển AI của Trung Quốc. Trên một số khía cạnh, chúng đã định hình lại quỹ đạo của nó. Việc phát hành DeepSeek R1 đóng vai trò là một sự kiện xúc tác, kích hoạt một chuỗi phản ứng trên toàn ngành công nghiệp trong nước và đẩy nhanh sự hình thành một hệ sinh thái có cấu trúc hữu cơ hơn. Đồng thời, sự thay đổi này đã tạo ra một cửa sổ quan trọng cho nghiên cứu và phát triển trong nước liên tục. Khi hệ sinh thái này trưởng thành, tác động lâu dài của nó - và cách cộng đồng AI toàn cầu có thể tương tác với một hệ sinh thái AI ngày càng tự duy trì ở Trung Quốc - sẽ trở thành những câu hỏi quan trọng cho các cuộc thảo luận trong tương lai.
Link bài viết gốc
- Tags:
- Ai
- 3 February 2026
- Huggingface.co