Qwen-MT- Nơi Tốc Độ Gặp Gỡ Dịch Thuật Thông Minh

Giới thiệu bản cập nhật mới nhất của Qwen-MT (qwen-mt-turbo) thông qua Qwen API. Bản cập nhật này được xây dựng dựa trên Qwen3 mạnh mẽ, tận dụng hàng nghìn tỷ token đa ngôn ngữ và dịch thuật để tăng cường toàn diện khả năng hiểu và dịch đa ngôn ngữ của mô hình.

  • 9 min read
Qwen-MT- Nơi Tốc Độ Gặp Gỡ Dịch Thuật Thông Minh
Giới thiệu bản cập nhật mới nhất của Qwen-MT (qwen-mt-turbo) thông qua Qwen API. Bản cập nhật này được xây dựng dựa trên Qwen3 mạnh mẽ, tận dụng hàng nghìn tỷ token đa ngôn ngữ và dịch thuật để tăng cường toàn diện khả năng hiểu và dịch đa ngôn ngữ của mô hình.

Qwen-MT: Nơi Tốc Độ Gặp Gỡ Dịch Thuật Thông Minh

DEMO API DISCORD

Giới thiệu

Bài viết này giới thiệu bản cập nhật mới nhất của Qwen-MT (qwen-mt-turbo) thông qua Qwen API. Bản cập nhật này được xây dựng dựa trên sức mạnh của Qwen3, tận dụng hàng nghìn tỷ token đa ngôn ngữ và dịch thuật để tăng cường khả năng hiểu và dịch thuật đa ngôn ngữ của mô hình một cách toàn diện. Bằng cách tích hợp các kỹ thuật học tăng cường, mô hình đạt được những cải tiến đáng kể về độ chính xác dịch thuật và sự trôi chảy về ngôn ngữ.

Các tính năng chính:

  • Hỗ trợ đa ngôn ngữ cho 92 ngôn ngữ: Qwen-MT cho phép dịch thuật chất lượng cao trên 92 ngôn ngữ chính thức và các phương ngữ nổi bật, bao phủ hơn 95% dân số toàn cầu để đáp ứng nhu cầu giao tiếp đa ngôn ngữ đa dạng.
  • Khả năng tùy biến cao: Phiên bản mới cung cấp các khả năng dịch thuật nâng cao như can thiệp thuật ngữ, gợi ý theo miền và bộ nhớ dịch. Bằng cách cho phép kỹ thuật prompt có thể tùy chỉnh, nó mang lại hiệu suất dịch thuật tối ưu hóa phù hợp với các tình huống ứng dụng phức tạp, dành riêng cho từng miền và quan trọng.
  • Độ trễ thấp & Hiệu quả về chi phí: Bằng cách tận dụng kiến trúc Mixture of Experts (MoE) gọn nhẹ, Qwen-MT đạt được hiệu suất dịch thuật cao với thời gian phản hồi nhanh hơn và chi phí API giảm đáng kể (thấp tới 0,5 đô la cho mỗi triệu token đầu ra). Điều này đặc biệt phù hợp với môi trường có tính đồng thời cao và các ứng dụng nhạy cảm về độ trễ.

Chất lượng dịch thuật

Đánh giá tự động

Chúng tôi đánh giá Qwen-MT trên benchmark dịch thuật đa miền, đặc biệt là dịch tiếng Trung-Anh và tiếng Anh-Đức, cũng như benchmark dịch thuật đa ngôn ngữ WMT24. Kết quả thử nghiệm cho thấy Qwen-MT vượt trội hơn đáng kể so với các mô hình có kích thước tương đương bao gồm GPT-4.1-mini, Gemini-2.5-Flash và Qwen3-8B. Đáng chú ý, ngay cả khi so sánh với các mô hình ngôn ngữ lớn hiện đại như GPT-4.1, Gemini-2.5-Pro và Qwen3-235B-A22B, Qwen-MT vẫn duy trì chất lượng dịch thuật cạnh tranh trong khi kiến trúc gọn nhẹ được tối ưu hóa của nó cho phép xử lý dịch thuật nhanh chóng.

Đánh giá của con người

Các phương pháp đánh giá tự động có những hạn chế vốn có, chúng tôi đã triển khai thêm các giao thức đánh giá của con người bằng cách tận dụng dữ liệu dịch thuật thực tế trên mười ngôn ngữ chính: tiếng Trung, tiếng Anh, tiếng Nhật, tiếng Hàn, tiếng Thái, tiếng Ả Rập, tiếng Ý, tiếng Nga, tiếng Tây Ban Nha và tiếng Pháp. Khuôn khổ đánh giá nghiêm ngặt của chúng tôi bao gồm ba dịch giả chuyên nghiệp độc lập chấm điểm từng mẫu thử nghiệm, sau đó là các quy trình đối chiếu chéo có hệ thống để đảm bảo tính khách quan và độ tin cậy của kết quả đánh giá. Đáng chú ý, Qwen-MT đã đạt được các số liệu hiệu suất vượt trội, thể hiện những lợi thế đáng kể về cả tỷ lệ chấp nhận và tỷ lệ xuất sắc, xác nhận khả năng dịch thuật đặc biệt của nó trong các tình huống triển khai thực tế.

Dưới đây là một số ví dụ dịch thuật:

Source Text Qwen-MT
Make your cubicle neat, tidy and make it a homey charm. Hãy để khoảng không gian làm việc của bạn gọn gàng, ngăn nắp và tạo nên một vẻ đẹp ấm cúng.
Little study hack for y’all… do your homework/assignments the first day it was given to you… NO PROCRASTINATING!!! the day it was assigned Một mẹo học tập nhỏ cho tất cả các bạn… hãy làm bài tập về nhà/bài tập được giao vào ngày đầu tiên… KHÔNG TRÌ HOÃN!!! Ngay khi nó được giao!
Kim also attended her ex’s first Donda listening party at Atlanta’s Mercedes-Benz Stadium on July 22. Kim cũng đã tham dự buổi ra mắt album Donda đầu tiên của chồng cũ tại sân vận động Mercedes-Benz ở Atlanta vào ngày 22 tháng 7.
作为互联网公司搬砖的表示,用结果来推导自己的论点,真是闲得蛋疼,马后炮事后诸葛亮就别分析那么多。 Với tư cách là một người làm việc chăm chỉ tại một công ty internet, thật là khó chịu khi sử dụng kết quả để suy ra lập luận của một người. Đừng phân tích quá nhiều mọi thứ sau khi sự việc đã rồi như một chuyên gia nhìn lại.
浪姐一、二季还行,挺励志的。虽然什么成团确实挺扯的,起码过程也算新鲜,可以看。后面就有点炒回锅肉的赶脚了:大家意识到了浪姐的讨论度,然后都来上浪姐,浪姐有需要继续办下去,所以就有了故取所需的赶脚 Mùa một và hai của “Chị đẹp đạp gió rẽ sóng” khá hay và truyền cảm hứng. Mặc dù ý tưởng thành lập một nhóm thực sự lố bịch, nhưng ít nhất quá trình này cũng mới mẻ và đáng xem. Sau đó, nó bắt đầu có cảm giác như đồ ăn thừa hâm nóng: mọi người nhận ra sự nổi tiếng của chương trình, vì vậy tất cả họ đều nhảy lên. Vì chương trình cần tiếp tục, nên có cảm giác như mọi thứ đang được thực hiện vì sự tiện lợi.
发言人陈斌华表示:大陆企业出品的3A游戏《黑神话:悟空》,受到岛内青年、游戏爱好者的追捧和好评。一方面是游戏本身制作精良、体验感好、趣味性强;另一方面是取材于**《西游记》的故事和人物角色,融入了大量古代建筑、东方美学、国风音乐等中华文化元素,岛内玩家很熟悉、易亲近,毕竟大家都是读着四大名著**长大的中国人。 Người phát ngôn Chen Binhua tuyên bố: Tựa game 3A “Black Myth: Wukong” do một công ty đại lục sản xuất, đã được giới trẻ và những người đam mê trò chơi điện tử ở Đài Loan nhiệt tình đón nhận và đánh giá cao. Một mặt, bản thân trò chơi được làm tốt, mang lại trải nghiệm tuyệt vời và rất hấp dẫn. Mặt khác, nó lấy cảm hứng từ câu chuyện và các nhân vật của “Tây Du Ký”, kết hợp nhiều yếu tố của văn hóa truyền thống Trung Quốc, như kiến trúc cổ, thẩm mỹ phương Đông và âm nhạc theo phong cách dân tộc. Những yếu tố này quen thuộc và dễ dàng liên hệ với người chơi ở Đài Loan, xét cho cùng, họ đều là những người Trung Quốc lớn lên đọc Tứ đại danh tác.
且夫秦欲璧,赵弗予璧,两无所曲直也。入璧而秦弗予城,曲在秦;秦出城而璧归,曲在赵。 Hơn nữa, nếu Tần muốn ngọc bích, và Triệu từ chối đưa, thì không bên nào có lỗi. Nếu Triệu đưa ngọc bích nhưng Tần không cung cấp thành phố, thì lỗi thuộc về Tần; nếu Tần cung cấp thành phố nhưng ngọc bích trở về Triệu, thì lỗi thuộc về Triệu.

Hỗ trợ ngôn ngữ

Họ ngôn ngữ Tên ngôn ngữ
Ấn-Âu Afrikaans, Armenia, Assam, Asturias, Belarus, Bengal, Bosnia, Bulgaria, Catalonia, Croatia, Séc, Đan Mạch, Hà Lan, Anh, Pháp, Galicia, Đức, Hy Lạp, Gujarati, Hindi, Iceland, Ý, Latvia, Litva, Luxembourg, Macedonia, Maithili, Marathi, Nepal, Bokmål Na Uy, Nynorsk Na Uy, Occitan, Odia, Ba Lan, Bồ Đào Nha, Romania, Nga, Serbia, Sicilia, Sindh, Sinhala, Slovak, Slovenia, Tây Ban Nha, Thụy Điển, Albania Tosk, Ukraina, Urdu, Venice, Wales, Ba Tư phương Tây
Hán-Tạng Tiếng Trung (Quảng Đông, Giản thể và Phồn thể), Tiếng Miến Điện
Phi-Á Tiếng Ả Rập (Tiêu chuẩn, Ai Cập, Lưỡng Hà, Ma Rốc, Najd, Bắc Levant, Nam Levant, Ta’izzi-Adeni và Tunisia), Tiếng Do Thái, Tiếng Malta
Nam Đảo Cebuano, Indonesia, Java, Malay, Pangasinan, Tagalog, Waray
Dravidian Kannada, Tamil, Telugu
Turkic Kazakh, Bắc Azerbaijan, Bắc Uzbek, Thổ Nhĩ Kỳ
Thái-Kadai Thái, Lào
Uralic Estonia, Phần Lan, Hungary
Austroasiatic Khmer, Việt Nam
Khác Basque, Georgia, Nhật Bản, Hàn Quốc, Swahili

Cách sử dụng

Bạn có thể dễ dàng sử dụng Qwen-MT thông qua Qwen API. Dưới đây, chúng ta sẽ lấy một ví dụ đơn giản về dịch từ tiếng Trung sang tiếng Anh.

import os
from openai import OpenAI

client = OpenAI(
    api_key=os.getenv("DASHSCOPE_API_KEY"),
    base_url="https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
)

messages = [
    {
        "role": "user",
        "content": "我看到这个视频后没有笑"
    }
]

translation_options = {
    "source_lang": "auto",
    "target_lang": "English"
}

completion = client.chat.completions.create(
    model="qwen-mt-turbo",
    messages=messages,
    extra_body={
        "translation_options": translation_options
    }
)

print(completion.choices[0].message.content)

Qwen-MT hỗ trợ các tính năng như can thiệp thuật ngữ, gợi ý theo miền và bộ nhớ dịch. Ví dụ: trong một tình huống dịch liên quan đến các thuật ngữ chuyên ngành, người dùng có thể xác định trước các cặp thuật ngữ chính và đưa chúng vào dưới dạng tham số cho mô hình, đảm bảo áp dụng nhất quán từ vựng do người dùng chỉ định trong suốt đầu ra.

import os
from openai import OpenAI

client = OpenAI(
    api_key=os.getenv("DASHSCOPE_API_KEY"),
    base_url="https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
)

messages = [
    {
        "role": "user",
        "content": "而这套生物传感器运用了石墨烯这种新型材料,它的目标物是化学元素,敏锐的“嗅觉”让它能更深度、准确地体现身体健康状况。"
    }
]

translation_options = {
    "source_lang": "Chinese",
    "target_lang": "English",
    "terms": [
        {
            "source": "生物传感器",
            "target": "biological sensor"
        },
        {
            "source": "石墨烯",
            "target": "graphene"
        },
        {
            "source": "化学元素",
            "target": "chemical elements"
        },
        {
            "source": "身体健康状况",
            "target": "health status of the body"
        }
    ]
}

completion = client.chat.completions.create(
    model="qwen-mt-turbo",
    messages=messages,
    extra_body={
        "translation_options": translation_options
    }
)

print(completion.choices[0].message.content)

# Response:
# This biological sensor uses graphene, a new material, and its target is chemical elements. Its sensitive "nose" can more deeply and accurately reflect the health status of the body.

Hơn nữa, phong cách dịch phải thích ứng với các sắc thái theo ngữ cảnh. Ví dụ: trong bối cảnh pháp lý và chính thức, đăng ký chính thức là bắt buộc, trong khi giao tiếp trên mạng xã hội yêu cầu một giọng điệu đàm thoại. Để đảm bảo sự thích ứng về phong cách thích hợp, người dùng có thể cung cấp thông tin chi tiết về ngữ cảnh và tùy chọn phong cách bằng ngôn ngữ tự nhiên cùng với văn bản nguồn của họ.

import os
from openai import OpenAI

client = OpenAI(
    api_key=os.getenv("DASHSCOPE_API_KEY"),
    base_url="https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
)

messages = [
    {
        "role": "user",
        "content": "第二个SELECT语句返回一个数字,表示在没有LIMIT子句的情况下,第一个SELECT语句返回了多少行。"
    }
]

translation_options = {
    "source_lang": "Chinese",
    "target_lang": "English",
    "domains": "The sentence is from Ali Cloud IT domain. It mainly involves computer-related software development and usage methods, including many terms related to computer software and hardware. Pay attention to professional troubleshooting terminologies and sentence patterns when translating. Translate into this IT domain style."
}

completion = client.chat.completions.create(
    model="qwen-mt-turbo",
    messages=messages,
    extra_body={
        "translation_options": translation_options
    }
)

print(completion.choices[0].message.content)

# Response:
# The second SELECT statement returns a number that indicates how many rows were returned by the first SELECT statement without LIMIT clause.

Để biết thêm các tính năng nâng cao, vui lòng tham khảo Qwen API.

Kết luận

Qwen-MT là một mô hình dịch máy nâng cao hỗ trợ dịch giữa 92 ngôn ngữ. Nó nhằm mục đích cung cấp cho người dùng toàn cầu trải nghiệm dịch thuật thông minh, linh hoạt và hiệu quả thông qua API. Mặc dù “trung thực, trôi chảy và trang nhã” vẫn là một hành trình liên tục đầy thách thức, chúng tôi vẫn kiên trì khám phá và cải thiện. Trong tương lai, chúng tôi sẽ tiếp tục nâng cao độ chính xác và tính tự nhiên của bản dịch, mở rộng phạm vi sang nhiều ngôn ngữ hơn, cuối cùng là phá bỏ các rào cản ngôn ngữ để hiện thực hóa giao tiếp thực sự không biên giới.

Recommended for You

Qwen3-Coder- Mã hóa Agentic trên thế giới

Qwen3-Coder- Mã hóa Agentic trên thế giới

Hôm nay, chúng tôi thông báo về Qwen3-Coder, mô hình mã hóa agentic nhất của chúng tôi cho đến nay.

Qwen VLo- Từ "Hiểu" Thế Giới đến "Miêu Tả" Nó

Qwen VLo- Từ "Hiểu" Thế Giới đến "Miêu Tả" Nó

Sự phát triển của các mô hình lớn đa phương thức liên tục thúc đẩy ranh giới của những gì chúng ta tin rằng công nghệ có thể đạt được. Từ QwenVL ban đầu đến Qwen2.5 VL mới nhất, chúng tôi đã có những tiến bộ trong việc tăng cường khả năng của mô hình để hiểu nội dung hình ảnh. Hôm nay, chúng tôi rất vui mừng giới thiệu một mô hình mới, Qwen VLo, một mô hình tạo và hiểu đa phương thức thống nhất. Mô hình mới được nâng cấp này không chỉ "hiểu" thế giới mà còn tạo ra các bản tái tạo chất lượng cao dựa trên sự hiểu biết đó, thực sự thu hẹp khoảng cách giữa nhận thức và sáng tạo.