Một năm kể từ 'Khoảnh khắc DeepSeek'
Một năm kể từ 'Khoảnh khắc DeepSeek'
- 13 min read
Một năm kể từ “Khoảnh khắc DeepSeek”
Đây là bài viết đầu tiên trong loạt bài sẽ xem xét những tiến bộ lịch sử của cộng đồng mã nguồn mở tại Trung Quốc trong năm qua và những ảnh hưởng của chúng trong việc định hình toàn bộ hệ sinh thái. Phần lớn tiến bộ của năm 2025 có thể bắt nguồn từ “Khoảnh khắc DeepSeek” vào tháng Giêng, khi công ty AI DeepSeek có trụ sở tại Hàng Châu phát hành mô hình R-1 của họ.
Bài viết đầu tiên đề cập đến những thay đổi chiến lược và sự bùng nổ của các mô hình mở mới và những người chơi mã nguồn mở. Bài viết thứ hai sẽ đề cập đến các lựa chọn kiến trúc và phần cứng mà các công ty Trung Quốc đã đưa ra sau sự phát triển ngày càng tăng của hệ sinh thái mở. Bài viết thứ ba sẽ phân tích quỹ đạo của các tổ chức nổi bật và tương lai của hệ sinh thái mã nguồn mở toàn cầu.
Đối với các nhà nghiên cứu và nhà phát triển AI đóng góp và dựa vào hệ sinh thái mã nguồn mở và đối với các nhà hoạch định chính sách hiểu về môi trường thay đổi nhanh chóng, chưa bao giờ có thời điểm tốt hơn để xây dựng và phát hành các mô hình và tạo phẩm mở, như đã được chứng minh bởi sự tăng trưởng khổng lồ trong năm qua được thúc đẩy bởi DeepSeek. Đáng chú ý, địa chính trị đã thúc đẩy việc áp dụng; trong khi các mô hình được phát triển ở Trung Quốc đã chiếm ưu thế trên các chỉ số trong suốt năm 2025 và những người chơi mới đang vượt qua nhau, thì cộng đồng AI phương Tây đang tìm kiếm các giải pháp thay thế có thể triển khai thương mại.
Những hạt giống của hệ sinh thái AI mã nguồn mở tự nhiên của Trung Quốc
Trước R1, ngành công nghiệp AI của Trung Quốc vẫn còn tập trung chủ yếu vào các mô hình đóng. Các mô hình mở đã tồn tại trong nhiều năm, nhưng chúng chủ yếu giới hạn trong các cộng đồng nghiên cứu hoặc chỉ được sử dụng trong các tình huống ngách như các ứng dụng nhạy cảm về quyền riêng tư. Đối với hầu hết các công ty, chúng không phải là lựa chọn mặc định. Tài nguyên tính toán bị hạn chế và việc “mở hay đóng” là một vấn đề tranh luận.
Mô hình R1 của DeepSeek đã hạ thấp rào cản tiếp cận các khả năng AI tiên tiến và cung cấp một khuôn mẫu rõ ràng để làm theo, mở ra một lớp thứ hai. Hơn nữa, việc phát hành đã mang lại cho sự phát triển AI của Trung Quốc một điều vô cùng quý giá: thời gian. Nó cho thấy rằng ngay cả với nguồn lực hạn chế, tiến bộ nhanh chóng vẫn có thể đạt được thông qua mã nguồn mở và lặp lại nhanh chóng. Cách tiếp cận này phù hợp tự nhiên với các mục tiêu được đặt ra trong chiến lược “AI+” của Trung Quốc năm 2017: kết hợp AI với ngành công nghiệp càng sớm càng tốt, đồng thời tiếp tục xây dựng năng lực tính toán trong dài hạn.
Một năm sau khi phát hành R1, những gì chúng ta thấy đang nổi lên không chỉ là một tập hợp các mô hình mới, mà còn là một hệ sinh thái AI mã nguồn mở đang phát triển tự nhiên.
DeepSeek R1: Một bước ngoặt
Lần đầu tiên, một mô hình mở từ Trung Quốc đã lọt vào bảng xếp hạng chính thống toàn cầu và trong suốt năm tiếp theo, nó đã nhiều lần được sử dụng làm điểm tham chiếu khi các mô hình mới được phát hành. Mô hình R1 của DeepSeek nhanh chóng trở thành mô hình được yêu thích nhất trên Hugging Face mọi thời đại và các mô hình được yêu thích hàng đầu không còn do Hoa Kỳ phát triển phần lớn nữa.
Nhưng ý nghĩa thực sự của R1 không nằm ở chỗ nó có phải là mô hình mạnh nhất tại thời điểm đó hay không, mà là tầm quan trọng của nó nằm ở việc nó đã giảm thiểu ba rào cản.
Đầu tiên là rào cản kỹ thuật. Bằng cách chia sẻ công khai các đường dẫn suy luận và phương pháp đào tạo sau đại học, R1 đã biến suy luận tiên tiến, trước đây bị khóa sau các API đóng, thành một tài sản kỹ thuật có thể tải xuống, chắt lọc và tinh chỉnh. Nhiều nhóm không còn cần phải đào tạo các mô hình khổng lồ từ đầu để đạt được khả năng suy luận mạnh mẽ. Suy luận bắt đầu hoạt động như một mô-đun tái sử dụng, được áp dụng hết lần này đến lần khác trên các hệ thống khác nhau. Điều này cũng thúc đẩy ngành công nghiệp suy nghĩ lại về mối quan hệ giữa khả năng của mô hình và chi phí tính toán, một sự thay đổi đặc biệt có ý nghĩa trong một môi trường bị hạn chế về tính toán như Trung Quốc.
Thứ hai là rào cản áp dụng. R1 được phát hành theo giấy phép MIT, giúp việc sử dụng, sửa đổi và phân phối nó trở nên đơn giản. Các công ty đã dựa vào các mô hình đóng bắt đầu đưa R1 trực tiếp vào sản xuất. Chắt lọc, đào tạo thứ cấp và điều chỉnh theo miền cụ thể đã trở thành công việc kỹ thuật thông thường thay vì các dự án đặc biệt. Khi các ràng buộc phân phối giảm đi, mô hình nhanh chóng lan rộng vào các nền tảng đám mây và chuỗi công cụ, và các cuộc thảo luận của cộng đồng chuyển từ “mô hình nào có điểm số cao hơn” sang “làm thế nào để triển khai nó, giảm chi phí và tích hợp nó vào các hệ thống thực tế.” Theo thời gian, R1 đã vượt ra ngoài việc trở thành một tạo tác nghiên cứu và trở thành một nền tảng kỹ thuật có thể tái sử dụng.
Thay đổi thứ ba là tâm lý. Khi câu hỏi chuyển từ “chúng ta có thể làm điều này không?” sang “làm thế nào để chúng ta làm điều này tốt?”, việc ra quyết định trên nhiều công ty đã thay đổi. Đối với cộng đồng AI Trung Quốc, đây cũng là một khoảnh khắc hiếm hoi của sự chú ý toàn cầu bền vững, một điều có ý nghĩa sâu sắc đối với một hệ sinh thái từ lâu đã được xem chủ yếu là người theo sau.
Cùng nhau, việc giảm thiểu ba rào cản này có nghĩa là hệ sinh thái bắt đầu có khả năng tự tái tạo.
Từ DeepSeek đến AI+: Điều chỉnh chiến lược
Khi mã nguồn mở tiến vào dòng chính, một câu hỏi tự nhiên theo sau: chiến lược của các công ty Trung Quốc sẽ thay đổi như thế nào? Trong năm qua, câu trả lời đã trở nên rõ ràng: cạnh tranh bắt đầu chuyển từ so sánh mô hình này với mô hình khác sang khả năng cấp hệ thống.
So với năm 2024, giai đoạn sau khi phát hành R1 đã chứng kiến cảnh quan AI của Trung Quốc ổn định theo một mô hình mới. Các công ty công nghệ lớn dẫn đầu, các công ty khởi nghiệp nhanh chóng theo sau, và các công ty từ các ngành dọc ngày càng tham gia vào lĩnh vực này. Mặc dù con đường của họ khác nhau, nhưng sự hiểu biết chung dần dần xuất hiện, đặc biệt là giữa những người chơi hàng đầu: mã nguồn mở không còn là một chiến thuật ngắn hạn, mà là một phần của chiến lược cạnh tranh dài hạn.
Số lượng các tổ chức cạnh tranh của Trung Quốc phát hành các mô hình và kho lưu trữ tiên tiến đã tăng vọt. Được phản ánh trong Sự tăng trưởng Kho lưu trữ của Hugging Face của các Công ty Trung Quốc, số lượng bản phát hành mở từ các gã khổng lồ hiện tại đã tăng lên đáng kể, với Baidu từ không có bản phát hành nào trên Hugging Face vào năm 2024 lên hơn 100 vào năm 2025, và những công ty khác như ByteDance và Tencent tăng số lượng bản phát hành lên tám đến chín lần. Một làn sóng các tổ chức mới được mở đã phát hành các mô hình có hiệu suất cao, với bản phát hành mở của Moonshot, Kimi K2, là “một khoảnh khắc DeepSeek khác”.
Các bản phát hành trở nên mạnh mẽ và thường xuyên hơn, với các mô hình có hiệu suất cao được phát hành hàng tuần; các mô hình Trung Quốc mới tạo ra liên tục trở thành mô hình được yêu thích và tải xuống nhiều nhất mỗi tuần, tự hào với sự phổ biến cao nhất trong số các mô hình mới được tải xuống nhiều nhất trên Hugging Face. Các Mô hình Mới Sáng tạo Hàng đầu theo Tuần trên Hugging Face cho thấy các kho lưu trữ mới được gắn nhãn theo vị trí tổ chức hoặc vị trí của tổ chức mô hình cơ sở cho các phái sinh phổ biến.
Khi nhìn thấy trong dữ liệu bản đồ nhiệt của Hugging Face, giữa tháng 2 và tháng 7 năm 2025, các bản phát hành mở từ các công ty Trung Quốc đã trở nên hoạt động rõ rệt hơn. Baidu và Moonshot chuyển từ các phương pháp chủ yếu là đóng sang phát hành mở. Zhipu AI’s GLM và Alibaba’s Qwen đã đi xa hơn, mở rộng từ chỉ đơn giản là xuất bản trọng số mô hình để xây dựng các hệ thống kỹ thuật và giao diện hệ sinh thái. Ở giai đoạn này, chỉ so sánh hiệu suất mô hình thô thôi là không đủ để chiến thắng. Cạnh tranh ngày càng tập trung vào hệ sinh thái, kịch bản ứng dụng và cơ sở hạ tầng.
Chiến lược này đã thành công hiệu quả; trong số các mô hình mới được tạo ra (<1 năm), lượt tải xuống cho các mô hình Trung Quốc đã vượt qua bất kỳ quốc gia nào khác bao gồm cả Hoa Kỳ.
Những người chơi AI của Trung Quốc không phối hợp theo thỏa thuận, mà theo sự ràng buộc. Những gì có vẻ là sự hợp tác nên được hiểu là sự liên kết dưới áp lực kỹ thuật, kinh tế và quy định chung. Điều này không có nghĩa là các công ty đã hình thành các liên minh hợp tác. Thay vào đó, dưới các ràng buộc tương tự về tính toán, chi phí và tuân thủ, họ bắt đầu cạnh tranh dọc theo các nền tảng kỹ thuật và các con đường kỹ thuật tương tự. Khi cạnh tranh diễn ra trên các cấu trúc hệ thống tương tự, hệ sinh thái bắt đầu thể hiện khả năng tự lan truyền và phát triển. Các nhà lãnh đạo công nghệ từ Zhipu AI (Z.ai), Moonshot AI, Qwen của Alibaba và Tencent phối hợp về các câu hỏi chung hiếm khi được thấy ở các quốc gia khác.
Tiếp nhận và phản ứng toàn cầu
Tâm lý tích cực đối với việc áp dụng và phát triển mã nguồn mở đã tăng lên trên toàn cầu và đặc biệt là ở Hoa Kỳ, với sự công nhận rộng rãi hơn về cách lãnh đạo mã nguồn mở là rất quan trọng trong khả năng cạnh tranh toàn cầu.
DeepSeek đã được áp dụng mạnh mẽ trên thị trường toàn cầu, đặc biệt là ở Đông Nam Á và Châu Phi. Ở các thị trường này, các yếu tố như hỗ trợ đa ngôn ngữ, trọng số mở có sẵn và các cân nhắc về chi phí đã hỗ trợ việc sử dụng của doanh nghiệp.
Các tổ chức phương Tây lớn thường tìm kiếm các mô hình không phải của Trung Quốc để triển khai thương mại. Các bản phát hành lớn từ các tổ chức Hoa Kỳ như gpt-oss của OpenAI, Olmo của AI2 và Llama 4 của Meta đã nhận được sự tham gia của cộng đồng. Reflection AI thông báo các nỗ lực của mình để xây dựng các mô hình tiên phong của Mỹ có trọng số mở. Tại Pháp, Mistral đã phát hành gia đình Mistral Large 3 của họ, liên tục phát triển nguồn gốc mã nguồn mở của họ.
Đồng thời, các bản phát hành lớn ở phương Tây được xây dựng dựa trên các mô hình Trung Quốc; vào tháng 11 năm 2025, Deep Cogito đã phát hành Cogito v2.1 như một mô hình trọng số mở hàng đầu của Hoa Kỳ. Mô hình là một phiên bản tinh chỉnh của DeepSeek-V3. Các công ty khởi nghiệp và các nhà nghiên cứu trên toàn cầu sử dụng các mô hình trọng số mở thường mặc định hoặc dựa vào các mô hình được phát triển ở Trung Quốc.
Dự án American Truly Open Model (ATOM) trích dẫn DeepSeek và động lực mô hình của Trung Quốc như một động lực cho các nỗ lực phối hợp hướng tới việc dẫn đầu trong phát triển mô hình trọng số mở. Dự án nhấn mạnh sự cần thiết của nhiều nỗ lực và nghiên cứu của nó cũng nêu bật việc gpt-oss của OpenAI được áp dụng sớm một cách mạnh mẽ.
Thế giới vẫn đang phản ứng, với một làn sóng mã nguồn mở mới. Năm 2026 đang hình thành với những bản phát hành lớn, đặc biệt là từ Trung Quốc và Hoa Kỳ. Các xu hướng kiến trúc, lựa chọn phần cứng và phương hướng tổ chức có liên quan cao, sẽ được đề cập tiếp theo trong loạt bài này.
Tất cả dữ liệu được biểu thị đều được lấy từ Hugging Face. Để biết thêm dữ liệu và phân tích liên quan về năm 2025 trong mã nguồn mở, chúng tôi khuyến khích bạn đọc Sáng kiến Nguồn gốc Dữ liệu và Kinh tế học Trí tuệ Mở: Theo dõi Sức mạnh & Sự tham gia trong Hệ sinh thái Mô hình của Hugging Face, Đánh giá Open Source AI Năm 2025 của aiWorld và 8 biểu đồ giải thích trạng thái của các mô hình mở của InterConnects.
Thảo luận cộng đồng
vansin
Chinese Open Source Model Take off !!!! 🔥 3 🚀 2
vansin
Chinese Translation of this Article: https://huggingface.co/blog/vansin/one-year-since-the-deepseek-moment-cn ❤️ 2
cfahlgren1
great job @irenesolaiman 👏 ❤️ 3
mahimairaja
Great read! ❤️ 2
NJX-njx
As a Chinese AI researcher who has fully experienced the wave of AI technologies and products in 2025, looking back on the series of changes brought about starting from DeepSeek, I have mixed feelings.
The author’s analysis is excellent. The open-sourcing of the R1 model weights and related technologies empowered the most usable technologies to both startups and large companies at that time. Such an “unconventional” change pushed China’s AI field, whether in research and development or product development, into a stage of rapid development.
Thanks to open source. May AI technology benefit all of humanity. ❤️ 3
RichardBian
This is such a fair and square article highlighting the technology and open trends. The wave of open models from China was a gift to the overall technical community and forever altered the progress of 2025 and beyond. 2026 will be another year of open models. It might also be the year to reveal how “open source” would be truly redefined in the next 5 years. ❤️ 2
Viết bình luận
Bạn cần đăng nhập để bình luận.
Link bài viết gốc
- Tags:
- Ai
- 20 January 2026
- Huggingface.co