Mistral ra mắt mô hình mã hóa Devstral 2 mạnh mẽ bao gồm cả mã nguồn mở, phiên bản thân thiện với máy tính xách tay

Mistral ra mắt mô hình mã hóa Devstral 2 mạnh mẽ bao gồm cả mã nguồn mở, phiên bản thân thiện với máy tính xách tay

  • 16 min read
Mistral ra mắt mô hình mã hóa Devstral 2 mạnh mẽ bao gồm cả mã nguồn mở, phiên bản thân thiện với máy tính xách tay
Mistral ra mắt mô hình mã hóa Devstral 2 mạnh mẽ bao gồm cả mã nguồn mở, phiên bản thân thiện với máy tính xách tay

Mistral ra mắt mô hình lập trình Devstral 2 mạnh mẽ, bao gồm phiên bản mã nguồn mở, thân thiện với máy tính xách tay

Công ty khởi nghiệp AI của Pháp, Mistral, đã vượt qua giai đoạn khó khăn với các câu hỏi từ công chúng trong năm qua để trở lại, vào tháng 12 năm 2025, với các mô hình mới được lòng công chúng dành cho doanh nghiệp và các nhà phát triển độc lập.

Chỉ vài ngày sau khi phát hành họ mô hình ngôn ngữ lớn Mistral 3 mã nguồn mở, đa năng mạnh mẽ cho các thiết bị biên và phần cứng cục bộ, công ty đã ra mắt Devstral 2.

Sản phẩm mới bao gồm một cặp mô hình mới được tối ưu hóa cho các tác vụ kỹ thuật phần mềm — một lần nữa, với một mô hình đủ nhỏ để chạy trên một máy tính xách tay duy nhất, ngoại tuyến và riêng tư — cùng với Mistral Vibe, một tác nhân giao diện dòng lệnh (CLI) được thiết kế để cho phép các nhà phát triển gọi trực tiếp các mô hình trong môi trường terminal của họ.

Các mô hình này nhanh, gọn nhẹ và mở — ít nhất là về lý thuyết. Nhưng câu chuyện thực sự không chỉ nằm ở các điểm chuẩn, mà còn ở cách Mistral đóng gói khả năng này: một mô hình hoàn toàn miễn phí, một mô hình có điều kiện, và một giao diện terminal được xây dựng để mở rộng quy mô với cả hai.

Đây là nỗ lực không chỉ để sánh ngang với các hệ thống độc quyền như Claude và GPT-4 về hiệu suất, mà còn để cạnh tranh với chúng về trải nghiệm nhà phát triển — và làm điều đó trong khi vẫn giữ vững lá cờ mã nguồn mở.

Cả hai mô hình hiện đều có sẵn miễn phí trong một thời gian giới hạn thông qua API của Mistral và Hugging Face.

Mô hình Devstral 2 đầy đủ được hỗ trợ sẵn trong trình cung cấp suy luận cộng đồng vLLM và trên nền tảng mã hóa tác nhân mã nguồn mở Kilo Code.

Mô hình Lập trình Được Thiết kế Để Lái

Ở đầu thông báo là Devstral 2, một transformer dày đặc với 123 tỷ tham số, cửa sổ ngữ cảnh 256K token, được thiết kế đặc biệt cho việc phát triển phần mềm tác nhân.

Mistral cho biết mô hình đạt 72,2% trên SWE-bench Verified, một điểm chuẩn được thiết kế để đánh giá các tác vụ kỹ thuật phần mềm ngữ cảnh dài trong các kho lưu trữ thực tế.

Mô hình em nhỏ hơn, Devstral Small 2, có 24 tỷ tham số, với cửa sổ ngữ cảnh tương tự và hiệu suất 68,0% trên SWE-bench.

Về lý thuyết, điều đó làm cho nó trở thành mô hình trọng lượng mở mạnh nhất có kích thước tương đương, thậm chí còn vượt qua nhiều đối thủ cạnh tranh lớp 70B.

Nhưng câu chuyện hiệu suất không chỉ là về phần trăm thô. Mistral đang đặt cược rằng trí thông minh hiệu quả vượt trội hơn quy mô, và đã nhấn mạnh thực tế rằng Devstral 2 là:

  • 5 lần nhỏ hơn DeepSeek V3.2
  • 8 lần nhỏ hơn Kimi K2
  • Tuy nhiên, vẫn ngang bằng hoặc vượt trội hơn chúng trên các điểm chuẩn suy luận phần mềm quan trọng.

Đánh giá của con người ủng hộ điều này. Trong các so sánh cạnh nhau:

  • Devstral 2 đã đánh bại DeepSeek V3.2 trong 42,8% tác vụ, chỉ thua 28,6%.
  • Đối đầu với Claude Sonnet 4.5, nó thua nhiều hơn (53,1%) — một lời nhắc nhở rằng mặc dù khoảng cách đang thu hẹp, các mô hình đóng vẫn dẫn đầu về sự ưa thích tổng thể.

Tuy nhiên, đối với một mô hình trọng lượng mở, những kết quả này đặt Devstral 2 vào vị trí tiên phong về những gì hiện có để chạy và sửa đổi độc lập.

Vibe CLI: Tác nhân Gốc Terminal

Cùng với các mô hình, Mistral đã phát hành Vibe CLI, một trợ lý dòng lệnh tích hợp trực tiếp với các mô hình Devstral. Đây không phải là một plugin IDE hay một trình giải thích mã kiểu ChatGPT. Đây là một giao diện gốc được thiết kế để hiểu và điều phối mã trên toàn dự án, được xây dựng để hoạt động trong quy trình làm việc thực tế của nhà phát triển.

Vibe mang lại mức độ thông minh đáng ngạc nhiên cho terminal:

  • Nó đọc cây tệp và trạng thái Git của bạn để hiểu phạm vi dự án.
  • Nó cho phép bạn tham chiếu tệp bằng @, chạy lệnh shell bằng ! và chuyển đổi hành vi bằng lệnh gạch chéo.
  • Nó điều phối các thay đổi trên nhiều tệp, theo dõi các phụ thuộc, thử lại các lần thực thi thất bại và thậm chí có thể tái cấu trúc ở quy mô kiến trúc.

Không giống như hầu hết các tác nhân nhà phát triển, mô phỏng REPL từ trong giao diện trò chuyện, Vibe bắt đầu với shell và kéo thông minh từ đó. Nó có thể lập trình, có thể viết script và có thể tùy chỉnh chủ đề. Và nó được phát hành theo giấy phép Apache 2.0, có nghĩa là nó thực sự miễn phí để sử dụng — trong môi trường thương mại, công cụ nội bộ hoặc tiện ích mở rộng mã nguồn mở.

Cấu trúc Giấy phép: Mở — Có Giới hạn Doanh thu

Thoạt nhìn, cách tiếp cận cấp phép của Mistral có vẻ đơn giản: các mô hình là trọng lượng mở và có sẵn công khai. Nhưng xem xét kỹ hơn sẽ tiết lộ một ranh giới được vẽ ở giữa bản phát hành, với các quy tắc khác nhau cho những người dùng khác nhau.

Devstral Small 2, biến thể 24 tỷ tham số, được bao phủ bởi giấy phép Apache 2.0 tiêu chuẩn, thân thiện với doanh nghiệp và nhà phát triển.

Đó là một tiêu chuẩn vàng trong mã nguồn mở: không hạn chế doanh thu, không có phụ lục, không cần kiểm tra với bộ phận pháp lý. Các doanh nghiệp có thể sử dụng nó trong sản xuất, nhúng nó vào sản phẩm và phân phối các phiên bản đã tinh chỉnh mà không cần xin phép.

Devstral 2, mô hình flagship 123B, được phát hành theo những gì Mistral gọi là “giấy phép MIT sửa đổi.” Cụm từ đó nghe có vẻ vô hại, nhưng việc sửa đổi giới thiệu một hạn chế quan trọng: bất kỳ công ty nào có doanh thu hàng tháng trên 20 triệu đô la đều không thể sử dụng mô hình — ngay cả nội bộ — mà không xin được giấy phép thương mại riêng từ Mistral.

“Bạn không được phép thực hiện bất kỳ quyền nào theo giấy phép này nếu doanh thu hàng tháng hợp nhất toàn cầu của công ty bạn […] vượt quá 20 triệu đô la,” giấy phép quy định.

Điều khoản này không chỉ áp dụng cho mô hình cơ sở, mà còn cho các dẫn xuất, các phiên bản tinh chỉnh và các biến thể được phân phối lại, bất kể ai lưu trữ chúng. Trên thực tế, điều đó có nghĩa là mặc dù trọng lượng là “mở”, việc sử dụng chúng bị giới hạn đối với các doanh nghiệp lớn — trừ khi họ sẵn sàng tương tác với nhóm bán hàng của Mistral hoặc sử dụng API được lưu trữ với giá theo đo lường.

Để đưa ra một phép loại suy: Apache 2.0 giống như một thư viện công cộng — bạn bước vào, mượn sách và sử dụng nó theo bất kỳ cách nào bạn cần. Giấy phép MIT sửa đổi của Mistral giống như một không gian làm việc chung của công ty, miễn phí cho người làm nghề tự do nhưng tính phí thuê khi công ty của bạn đạt đến một quy mô nhất định.

Đánh giá Devstral Small 2 cho Sử dụng Doanh nghiệp

Sự phân chia này đặt ra một câu hỏi rõ ràng cho các công ty lớn hơn: liệu Devstral Small 2 với giấy phép Apache 2.0 tự do và không hạn chế hơn có thể đóng vai trò là một giải pháp thay thế khả thi cho các doanh nghiệp vừa và lớn không?

Câu trả lời phụ thuộc vào ngữ cảnh. Devstral Small 2 đạt 68,0% trên SWE-bench, cao hơn đáng kể so với nhiều mô hình mở lớn hơn, và vẫn có thể triển khai trên các thiết lập chỉ có một GPU hoặc chỉ có CPU. Đối với các nhóm tập trung vào:

  • Công cụ nội bộ,
  • Triển khai tại chỗ,
  • Suy luận biên độ trễ thấp,

…nó mang đến sự kết hợp hiếm có giữa tính hợp pháp, hiệu suất và sự tiện lợi.

Nhưng khoảng cách hiệu suất so với Devstral 2 là có thật. Đối với các thiết lập đa tác nhân, tái cấu trúc monorepo sâu, hoặc phân tích mã ngữ cảnh dài, chênh lệch điểm chuẩn 4 điểm đó có thể làm giảm nhẹ sự khác biệt về trải nghiệm thực tế.

Đối với hầu hết các doanh nghiệp, Devstral Small 2 sẽ đóng vai trò là một cách thức dễ dàng để tạo mẫu — hoặc là một cầu nối thực tế cho đến khi giấy phép cho Devstral 2 trở nên khả thi. Nó không phải là một sự thay thế trực tiếp cho mô hình hàng đầu, nhưng nó có thể “đủ tốt” trong các phân khúc sản xuất cụ thể, đặc biệt khi kết hợp với Vibe CLI.

Nhưng bởi vì Devstral Small 2 có thể chạy hoàn toàn ngoại tuyến — bao gồm cả trên máy GPU đơn hoặc máy tính xách tay có cấu hình đủ cao — nó mở ra một trường hợp sử dụng quan trọng cho các nhà phát triển và nhóm hoạt động trong môi trường được kiểm soát chặt chẽ.

Cho dù bạn là một nhà phát triển độc lập xây dựng công cụ khi đang di chuyển, hay là một phần của công ty có yêu cầu quản trị dữ liệu hoặc tuân thủ nghiêm ngặt, khả năng chạy một mô hình lập trình ngữ cảnh dài, hiệu suất cao mà không cần kết nối internet là một yếu tố khác biệt mạnh mẽ. Không có cuộc gọi đám mây, không có đo từ xa của bên thứ ba, không có rủi ro rò rỉ dữ liệu — chỉ có suy luận cục bộ với khả năng hiển thị và kiểm soát đầy đủ.

Điều này quan trọng trong các ngành như tài chính, y tế, quốc phòng và sản xuất tiên tiến, nơi dữ liệu thường không thể rời khỏi phạm vi mạng. Nhưng nó cũng hữu ích cho các nhà phát triển ưa thích quyền tự chủ hơn là bị khóa bởi nhà cung cấp — hoặc những người muốn công cụ của họ hoạt động như nhau trên máy bay, tại hiện trường hoặc bên trong phòng thí nghiệm được cách ly bằng không khí. Trong một thị trường mà hầu hết các mô hình mã hàng đầu được cung cấp dưới dạng sản phẩm SaaS chỉ có API, Devstral Small 2 mang đến mức độ di động, quyền riêng tư và quyền sở hữu hiếm có.

Theo nghĩa đó, Mistral không chỉ cung cấp các mô hình mở — họ cung cấp nhiều con đường để áp dụng, tùy thuộc vào quy mô, trạng thái tuân thủ và sự sẵn sàng tham gia của bạn.

Tích hợp, Cơ sở hạ tầng và Khả năng truy cập

Từ góc độ kỹ thuật, các mô hình của Mistral được xây dựng để triển khai. Devstral 2 yêu cầu tối thiểu 4 GPU lớp H100 và đã có sẵn trên build.nvidia.com.

Devstral Small 2 có thể chạy trên một GPU hoặc CPU duy nhất như những gì có trong máy tính xách tay tiêu chuẩn, giúp nó dễ dàng tiếp cận với cả các nhà phát triển độc lập và các nhóm nhúng.

Cả hai mô hình đều hỗ trợ trọng số lượng tử hóa FP4 và FP8, và tương thích với vLLM để suy luận có thể mở rộng. Khả năng tinh chỉnh được hỗ trợ sẵn.

Giá API — sau cửa sổ giới thiệu miễn phí — tuân theo cấu trúc dựa trên token:

  • Devstral 2: $0,40 cho mỗi triệu token đầu vào / $2,00 cho đầu ra
  • Devstral Small 2: $0,10 đầu vào / $0,30 đầu ra

Mức giá đó thấp hơn một chút so với GPT-4 Turbo của OpenAI, và thấp hơn nhiều so với Claude Sonnet của Anthropic ở các mức hiệu suất tương đương.

Tiếp nhận của Nhà phát triển: Sự Hưởng ứng Từ Cấp cơ sở

Trên X (trước đây là Twitter), các nhà phát triển đã nhanh chóng phản hồi với một làn sóng tiếp nhận tích cực, với Trưởng phòng Sản phẩm của Hugging Face, Victor Mustar, đặt câu hỏi liệu biến thể nhỏ, được cấp phép Apache 2.0 có phải là “vua lập trình cục bộ mới” không, tức là mô hình mà các nhà phát triển có thể sử dụng để chạy trực tiếp và riêng tư trên máy tính xách tay của họ, mà không cần kết nối internet:

Một tài khoản tin tức và tin đồn AI phổ biến khác, TestingCatalogNews, đã đăng rằng nó đang “SOTTA trong lập trình”, hoặc “State Of The Tiny Art”

Một người dùng khác, @xlr8harder, đã phản đối các điều khoản cấp phép tùy chỉnh cho Devstral 2, viết rằng “gọi giấy phép Devstral 2 là ‘MIT sửa đổi’ là cách nói giảm nói tránh. Đó là một giấy phép độc quyền với các yêu cầu ghi nhận công trạng kiểu MIT.”

Mặc dù giọng điệu mang tính phê phán, nó phản ánh sự chú ý mà cấu trúc cấp phép của Mistral đang nhận được, đặc biệt là trong số các nhà phát triển quen thuộc với các chuẩn mực sử dụng mở.

Bối cảnh Chiến lược: Từ Codestral đến Devstral và Mistral 3

Sự thúc đẩy đều đặn của Mistral vào các công cụ phát triển phần mềm không bắt đầu với Devstral 2 — nó bắt đầu vào tháng 5 năm 2024 với Codestral, mô hình ngôn ngữ lớn tập trung vào mã đầu tiên của công ty. Một hệ thống 22 tỷ tham số được đào tạo trên hơn 80 ngôn ngữ lập trình, Codestral được thiết kế để sử dụng trong các môi trường phát triển, từ tự động hoàn thành cơ bản đến tạo chức năng đầy đủ. Mô hình được phát hành theo giấy phép phi thương mại nhưng vẫn vượt trội hơn các đối thủ cạnh tranh hạng nặng như CodeLlama 70B và Deepseek Coder 33B trong các điểm chuẩn ban đầu như HumanEval và RepoBench.

Việc phát hành Codestral đánh dấu bước đi đầu tiên của Mistral vào không gian mô hình mã cạnh tranh, nhưng nó cũng thiết lập một mô hình quen thuộc hiện nay: các mô hình kỹ thuật gọn nhẹ với kết quả mạnh mẽ đáng ngạc nhiên, cửa sổ ngữ cảnh rộng và các lựa chọn cấp phép mời gọi sự thử nghiệm của nhà phát triển. Các đối tác trong ngành bao gồm JetBrains, LlamaIndex và LangChain nhanh chóng bắt đầu tích hợp mô hình vào quy trình làm việc của họ, trích dẫn tốc độ và khả năng tương thích công cụ của nó như những yếu tố khác biệt chính.

Một năm sau, công ty tiếp nối với Devstral, một mô hình 24B được thiết kế riêng cho hành vi “tác nhân” — xử lý suy luận phạm vi dài, điều hướng tệp và sửa đổi mã tự động. Được phát hành với sự hợp tác của All Hands AI và được cấp phép theo Apache 2.0, Devstral không chỉ đáng chú ý vì tính di động của nó (nó có thể chạy trên MacBook hoặc RTX 4090), mà còn vì hiệu suất của nó: nó đã vượt qua một số mô hình đóng trên SWE-Bench Verified, một điểm chuẩn gồm 500 vấn đề GitHub thực tế.

Sau đó là Mistral 3, được công bố vào tháng 12 năm 2025 với một danh mục 10 mô hình trọng lượng mở nhắm mục tiêu mọi thứ từ máy bay không người lái và điện thoại thông minh đến cơ sở hạ tầng đám mây. Bộ này bao gồm cả các mô hình cao cấp như Mistral Large 3 (hệ thống MoE với 41 tham số hoạt động và ngữ cảnh 256K) và các biến thể “Ministral” nhẹ có thể chạy trên 4GB VRAM. Tất cả đều được cấp phép theo Apache 2.0, củng cố cam kết của Mistral về triển khai linh hoạt, thân thiện với biên.

Mistral 3 định vị công ty không phải là đối thủ cạnh tranh trực tiếp với các mô hình tiên phong như GPT-5 hay Gemini 3, mà là một nền tảng lấy nhà phát triển làm trung tâm cho các hệ thống AI tùy chỉnh, cục bộ hóa. Đồng người sáng lập Guillaume Lample mô tả tầm nhìn là “trí thông minh phân tán” — nhiều hệ thống nhỏ hơn được điều chỉnh cho các tác vụ cụ thể và chạy bên ngoài cơ sở hạ tầng tập trung. “Trong hơn 90% trường hợp, một mô hình nhỏ có thể hoàn thành công việc,” ông nói với VentureBeat. “Nó không nhất thiết phải là một mô hình có hàng trăm tỷ tham số.”

Chiến lược rộng lớn hơn đó giúp giải thích ý nghĩa của Devstral 2. Nó không phải là một bản phát hành đơn lẻ mà là sự tiếp nối cam kết lâu dài của Mistral đối với các tác nhân mã, triển khai ưu tiên cục bộ và tính khả dụng trọng lượng mở — một hệ sinh thái bắt đầu với Codestral, trưởng thành thông qua Devstral và mở rộng quy mô với Mistral 3. Devstral 2, theo cách diễn giải này, không chỉ là một mô hình. Đó là phiên bản tiếp theo của một bộ bài đã được tiết lộ công khai trong hơn một năm.

Suy nghĩ Cuối cùng (Hiện tại): Một Ngã ba Đường

Với Devstral 2, Devstral Small 2 và Vibe CLI, Mistral AI đã vẽ ra một bản đồ rõ ràng cho cả nhà phát triển và công ty. Các công cụ này nhanh, có khả năng và được tích hợp một cách chu đáo. Nhưng chúng cũng đưa ra một lựa chọn — không chỉ về kiến trúc, mà còn về cách thức và nơi bạn được phép sử dụng chúng.

Nếu bạn là một nhà phát triển cá nhân, một startup nhỏ hoặc người bảo trì mã nguồn mở, đây là một trong những hệ thống AI mạnh mẽ nhất bạn có thể chạy miễn phí ngày hôm nay.

Nếu bạn là người đứng đầu bộ phận kỹ thuật của Fortune 500, bạn sẽ cần phải nói chuyện với Mistral — hoặc chấp nhận mô hình nhỏ hơn và cố gắng sử dụng nó.

Trong một thị trường ngày càng bị chi phối bởi các mô hình hộp đen và các khóa SaaS, ưu đãi của Mistral vẫn là một làn gió tươi mát. Chỉ cần đọc kỹ các điều khoản trước khi bạn bắt đầu xây dựng.

Recommended for You

AI của Quilter vừa thiết kế máy tính Linux gồm 843 bộ phận và nó đã khởi động ngay lần thử đầu tiên. Phần cứng sẽ không bao giờ như cũ.

AI của Quilter vừa thiết kế máy tính Linux gồm 843 bộ phận và nó đã khởi động ngay lần thử đầu tiên. Phần cứng sẽ không bao giờ như cũ.

AI của Quilter vừa thiết kế máy tính Linux gồm 843 bộ phận và nó đã khởi động ngay lần thử đầu tiên. Phần cứng sẽ không bao giờ như cũ.

Cảm biến thời gian chạy của Hud cắt giảm thời gian phân loại từ 3 giờ xuống còn 10 phút

Cảm biến thời gian chạy của Hud cắt giảm thời gian phân loại từ 3 giờ xuống còn 10 phút

Cảm biến thời gian chạy của Hud cắt giảm thời gian phân loại từ 3 giờ xuống còn 10 phút