Qwen3-Coder- Mã hóa Agentic trên thế giới
Hôm nay, chúng tôi thông báo về Qwen3-Coder, mô hình mã hóa agentic nhất của chúng tôi cho đến nay.
- 7 min read
Qwen3-Coder: Lập trình Agentic trong Thế giới
GITHUB HUGGING FACE MODELSCOPE DISCORD
Hôm nay, chúng tôi xin giới thiệu Qwen3-Coder, mô hình code agentic nhất của chúng tôi từ trước đến nay. Qwen3-Coder có nhiều kích cỡ khác nhau, nhưng chúng tôi rất vui mừng được giới thiệu biến thể mạnh mẽ nhất của nó trước tiên: Qwen3-Coder-480B-A35B-Instruct — một mô hình Mixture-of-Experts với 480 tỷ tham số với 35 tỷ tham số hoạt động, hỗ trợ độ dài ngữ cảnh 256K token một cách tự nhiên và 1 triệu token với các phương pháp ngoại suy, mang lại hiệu suất vượt trội trong cả nhiệm vụ coding và agentic. Qwen3-Coder-480B-A35B-Instruct thiết lập các kết quả tiên tiến mới trong số các mô hình mở về Lập trình Agentic, Sử dụng Trình duyệt Agentic và Sử dụng Công cụ Agentic, tương đương với Claude Sonnet 4.
Cùng với mô hình, chúng tôi cũng đang mở mã nguồn một công cụ dòng lệnh để lập trình agentic: Qwen Code. Được phân nhánh từ Gemini Code, Qwen Code đã được điều chỉnh với các lời nhắc tùy chỉnh và giao thức gọi hàm để khai thác tối đa khả năng của Qwen3-Coder trong các nhiệm vụ coding agentic. Qwen3-Coder hoạt động liền mạch với các công cụ phát triển tốt nhất của cộng đồng. Là một mô hình nền tảng, chúng tôi hy vọng nó có thể được sử dụng ở bất cứ đâu trên thế giới kỹ thuật số — Lập trình Agentic trong Thế giới!
Qwen3-Coder
Huấn luyện trước (Pre-Training)
Vẫn còn chỗ để mở rộng quy mô trong quá trình huấn luyện trước — và với Qwen3-Coder, chúng tôi đang tiến lên trên nhiều khía cạnh để tăng cường các khả năng cốt lõi của mô hình:
- Mở rộng quy mô Tokens: 7.5T tokens (tỷ lệ mã 70%), vượt trội trong coding đồng thời duy trì khả năng toán học và tổng quát.
- Mở rộng quy mô Ngữ cảnh: Hỗ trợ tự nhiên ngữ cảnh 256K và có thể được mở rộng lên đến 1M với YaRN, được tối ưu hóa cho quy mô kho lưu trữ và dữ liệu động (ví dụ: Yêu cầu kéo) để trao quyền cho Lập trình Agentic.
- Mở rộng quy mô Dữ liệu Tổng hợp: Tận dụng Qwen2.5-Coder để làm sạch và viết lại dữ liệu nhiễu, cải thiện đáng kể chất lượng dữ liệu tổng thể.
Huấn luyện sau (Post-Training)
Mở rộng quy mô Code RL: Khó giải quyết, dễ xác minh
Không giống như sự tập trung phổ biến vào tạo mã cấp cạnh tranh trong cộng đồng, chúng tôi tin rằng tất cả các tác vụ mã đều phù hợp một cách tự nhiên để học tăng cường quy mô lớn dựa trên thực thi. Đó là lý do tại sao chúng tôi mở rộng quy mô đào tạo Code RL trên một tập hợp lớn hơn các tác vụ coding trong thế giới thực. Bằng cách tự động mở rộng các trường hợp thử nghiệm của các tác vụ coding đa dạng, chúng tôi đã tạo ra các phiên bản đào tạo chất lượng cao và mở khóa thành công toàn bộ tiềm năng của học tăng cường. Nó không chỉ tăng đáng kể tỷ lệ thành công thực thi mã mà còn mang lại lợi ích cho các tác vụ khác. Điều này khuyến khích chúng tôi tiếp tục khám phá các nhiệm vụ khó giải quyết, dễ xác minh như là mảnh đất màu mỡ cho việc học tăng cường quy mô lớn.
Mở rộng quy mô RL đường dài
Trong các tác vụ kỹ thuật phần mềm trong thế giới thực như SWE-Bench, Qwen3-Coder phải tham gia vào tương tác nhiều lượt với môi trường, bao gồm lập kế hoạch, sử dụng công cụ, nhận phản hồi và đưa ra quyết định. Trong giai đoạn huấn luyện sau của Qwen3-Coder, chúng tôi đã giới thiệu RL đường dài (Agent RL) để khuyến khích mô hình giải quyết các tác vụ trong thế giới thực thông qua các tương tác nhiều lượt bằng cách sử dụng các công cụ. Thách thức chính của Agent RL nằm ở việc mở rộng quy mô môi trường. Để giải quyết vấn đề này, chúng tôi đã xây dựng một hệ thống có khả năng mở rộng, có khả năng chạy 20.000 môi trường độc lập song song, tận dụng cơ sở hạ tầng của Alibaba Cloud. Cơ sở hạ tầng cung cấp các phản hồi cần thiết cho học tăng cường quy mô lớn và hỗ trợ đánh giá ở quy mô lớn. Do đó, Qwen3-Coder đạt được hiệu suất hiện đại trong số các mô hình nguồn mở trên SWE-Bench Verified mà không cần mở rộng quy mô thời gian kiểm tra.
Code với Qwen3-Coder
Qwen Code
Qwen Code là một công cụ CLI mục đích nghiên cứu được điều chỉnh từ Gemini CLI, với trình phân tích cú pháp nâng cao và hỗ trợ công cụ cho các mô hình Qwen-Coder.
Hãy đảm bảo bạn đã cài đặt nodejs 20+:
Bạn có thể cài đặt nó thông qua các lệnh sau:
curl -qL https://www.npmjs.com/install.sh | sh
Sau đó, cài đặt Qwen code thông qua npm manager:
npm i -g @qwen-code/qwen-code
Cách khác là cài đặt từ nguồn:
git clone https://github.com/QwenLM/qwen-code.git
cd qwen-code && npm install && npm install -g
Qwen Code hỗ trợ OpenAI SDK khi gọi LLM và bạn có thể xuất các biến môi trường sau hoặc chỉ cần đặt chúng trong .envfile.
export OPENAI_API_KEY="your_api_key_here"
export OPENAI_BASE_URL="https://dashscope-intl.aliyuncs.com/compatible-mode/v1"
export OPENAI_MODEL="qwen3-coder-plus"
Bây giờ hãy tận hưởng việc coding theo phong cách của bạn với Qwen-Code và Qwen, bằng cách chỉ cần gõ: qwen!
Claude Code
Ngoài Qwen Code, giờ đây bạn có thể sử dụng Qwen3-Coder với Claude Code. Chỉ cần yêu cầu khóa API trên nền tảng Alibaba Cloud Model Studio và cài đặt Claude Code để bắt đầu coding.
npm install -g @anthropic-ai/claude-code
Chúng tôi đã cung cấp hai điểm truy cập để trải nghiệm coding liền mạch với Qwen3-Coder.
Tùy chọn 1: Claude Code proxy API
export ANTHROPIC_BASE_URL=https://dashscope-intl.aliyuncs.com/api/v2/apps/claude-code-proxy
export ANTHROPIC_AUTH_TOKEN=your-dashscope-apikey
Sau đó, bạn sẽ có thể sử dụng Claude Code với Qwen3-Coder!
Tùy chọn 2: Gói npm claude-code-config để tùy chỉnh bộ định tuyến
claude-code-router nhằm mục đích tùy chỉnh các mô hình phụ trợ khác nhau cho Claude Code. Nhóm dashscope cũng cung cấp một tiện ích mở rộng npm cấu hình tiện lợi, cụ thể là claude-code-config, cung cấp cấu hình mặc định cho claude-code-router với hỗ trợ DashScope. Chạy cài đặt:
npm install -g @musistudio/claude-code-router
npm install -g @dashscope-js/claude-code-config
và sau đó chạy cấu hình:
ccr-dashscope
Lệnh sẽ tự động tạo các tệp json cấu hình và các thư mục plugin cho ccr. (Bạn cũng có thể điều chỉnh thủ công những thứ này trong ~/.claude-code-router/config.json và ~/.claude-code-router/plugins/) Bắt đầu sử dụng claude code thông qua ccr:
ccr code
Cline
Định cấu hình Qwen3-Coder-480B-A35B-Instruct cho cline
- Đi tới cài đặt cấu hình Cline
- Đối với Nhà cung cấp API, hãy chọn ‘OpenAI Tương thích’
- Đối với Khóa API Tương thích với OpenAI, hãy nhập khóa nhận được từ Dashscope
- Chọn ‘Sử dụng URL gốc tùy chỉnh’ và nhập:
https://dashscope-intl.aliyuncs.com/compatible-mode/v1 - Nhập
qwen3-coder-plus
Các trường hợp sử dụng
API
Bạn có thể trực tiếp truy cập API của Qwen3-Coder thông qua Alibaba Cloud Model Studio. Dưới đây là bản trình diễn về cách sử dụng mô hình này với API Qwen.
import os
from openai import OpenAI
# Create client - using intl URL for users outside of China
# If you are in mainland China, use the following URL:
# "https://dashscope.aliyuncs.com/compatible-mode/v1"
client = OpenAI(
api_key=os.getenv("DASHSCOPE_API_KEY"),
base_url="https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
)
prompt = "Help me create a web page for an online bookstore."
# Send request to qwen3-coder-plus model
completion = client.chat.completions.create(
model="qwen3-coder-plus",
messages=[
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": prompt}
],
)
# Print the response
print(completion.choices[0].message.content.strip())
Công việc tiếp theo
Chúng tôi vẫn đang tích cực làm việc để cải thiện hiệu suất của Coding Agent của mình, hướng tới việc nó đảm nhận các tác vụ phức tạp và tẻ nhạt hơn trong kỹ thuật phần mềm, từ đó giải phóng năng suất của con người. Nhiều kích cỡ mô hình của Qwen3-Coder đang trên đường ra mắt, mang lại hiệu suất mạnh mẽ đồng thời giảm chi phí triển khai. Ngoài ra, chúng tôi đang tích cực khám phá xem Coding Agent có thể đạt được khả năng tự cải thiện hay không — một hướng đi thú vị và đầy cảm hứng.
Link bài viết gốc
- Tags:
- Ai
- July 22, 2025
- Qwenlm.github.io