Các mô hình. Giới thiệu bản xem trước Gemma 3n- AI mạnh mẽ, hiệu quả, ưu tiên thiết bị di động

Gemma 3n là một mô hình mở tiên tiến được thiết kế để mang lại AI đa phương thức nhanh chóng trên các thiết bị, với hiệu suất được tối ưu hóa, tính linh hoạt độc đáo với mô hình 2 trong 1 và khả năng hiểu đa phương thức mở rộng...

May 21, 2025
8 min read

Các mô hình. Giới thiệu bản xem trước Gemma 3n- AI mạnh mẽ, hiệu quả, ưu tiên thiết bị di động — Gemma 3n là một mô hình mở tiên tiến được thiết kế để mang lại AI đa phương thức nhanh chóng trên các thiết bị, với hiệu suất được tối ưu hóa, tính linh hoạt độc đáo với mô hình 2 trong 1 và khả năng hiểu đa phương thức mở rộng...

Thông báo bản xem trước Gemma 3n: AI mạnh mẽ, hiệu quả, ưu tiên thiết bị di động

Tiếp nối sự ra mắt thú vị của Gemma 3 và Gemma 3 QAT, dòng mô hình mở hiện đại của chúng tôi có khả năng chạy trên một đám mây duy nhất hoặc bộ tăng tốc máy tính để bàn, chúng tôi đang thúc đẩy tầm nhìn của mình về AI có thể truy cập hơn nữa. Gemma 3 cung cấp các khả năng mạnh mẽ cho các nhà phát triển và hiện chúng tôi đang mở rộng tầm nhìn đó sang AI có khả năng cao, thời gian thực hoạt động trực tiếp trên các thiết bị bạn sử dụng hàng ngày – điện thoại, máy tính bảng và máy tính xách tay của bạn.

Để cung cấp năng lượng cho thế hệ AI trên thiết bị tiếp theo và hỗ trợ một loạt các ứng dụng đa dạng, bao gồm cả việc nâng cao khả năng của Gemini Nano, chúng tôi đã thiết kế một kiến trúc tiên tiến, hiện đại. Nền tảng thế hệ tiếp theo này được tạo ra với sự hợp tác chặt chẽ với các nhà lãnh đạo phần cứng di động như Qualcomm Technologies, MediaTek và Samsung System LSI, đồng thời được tối ưu hóa cho AI đa phương thức nhanh như chớp, cho phép trải nghiệm thực sự cá nhân và riêng tư trực tiếp trên thiết bị của bạn.

Gemma 3n là mô hình mở đầu tiên của chúng tôi được xây dựng trên kiến trúc đột phá, dùng chung này, cho phép các nhà phát triển bắt đầu thử nghiệm công nghệ này ngay hôm nay trong bản xem trước sớm. Cùng một kiến trúc tiên tiến cũng cung cấp năng lượng cho thế hệ tiếp theo của Gemini Nano, mang những khả năng này đến một loạt các tính năng trong các ứng dụng của Google và hệ sinh thái trên thiết bị của chúng tôi, đồng thời sẽ có sẵn vào cuối năm nay. Gemma 3n cho phép bạn bắt đầu xây dựng trên nền tảng này sẽ có trên các nền tảng lớn như Android và Chrome.

        <img
            class="regular-image"
            src="https://storage.googleapis.com/gweb-developer-goog-blog-assets/images/image3_OjwrVp1.original.png"
            alt="Chatbot Arena Elo scores"
        />
    
    
        
            <div class="regular-image-description">
                Biểu đồ này xếp hạng các mô hình AI theo điểm Chatbot Arena Elo; điểm số cao hơn (số trên cùng) cho biết sở thích của người dùng cao hơn. Gemma 3n được xếp hạng cao trong số cả các mô hình độc quyền và mở phổ biến.
            </div>
        
</div>

Gemma 3n tận dụng một cải tiến của Google DeepMind có tên là Per-Layer Embeddings (PLE) giúp giảm đáng kể việc sử dụng RAM. Mặc dù số lượng tham số thô là 5B và 8B, nhưng cải tiến này cho phép bạn chạy các mô hình lớn hơn trên thiết bị di động hoặc phát trực tiếp từ đám mây, với chi phí bộ nhớ tương đương với mô hình 2B và 4B, nghĩa là các mô hình có thể hoạt động với dung lượng bộ nhớ động chỉ 2GB và 3GB. Tìm hiểu thêm trong tài liệu của chúng tôi.

Bằng cách khám phá Gemma 3n, các nhà phát triển có thể xem trước sớm các khả năng cốt lõi của mô hình mở và các cải tiến kiến trúc ưu tiên thiết bị di động sẽ có trên Android và Chrome với Gemini Nano.

Trong bài đăng này, chúng ta sẽ khám phá các khả năng mới của Gemma 3n, phương pháp tiếp cận của chúng tôi đối với quá trình phát triển có trách nhiệm và cách bạn có thể truy cập bản xem trước ngay hôm nay.

Các khả năng chính của Gemma 3n

Được thiết kế cho trải nghiệm AI nhanh chóng, ít dấu chân chạy cục bộ, Gemma 3n cung cấp:

Hiệu suất & Hiệu quả trên thiết bị được tối ưu hóa: Gemma 3n bắt đầu phản hồi nhanh hơn khoảng 1,5 lần trên thiết bị di động với chất lượng tốt hơn đáng kể (so với Gemma 3 4B) và giảm dung lượng bộ nhớ đạt được thông qua các cải tiến như Per Layer Embeddings, chia sẻ KVC và lượng tử hóa kích hoạt nâng cao.
Tính linh hoạt Nhiều trong 1: Một mô hình có dung lượng bộ nhớ hoạt động 4B, vốn đã bao gồm một mô hình con có dung lượng bộ nhớ hoạt động 2B hiện đại (nhờ đào tạo MatFormer). Điều này mang lại sự linh hoạt để đánh đổi động hiệu suất và chất lượng một cách nhanh chóng mà không cần lưu trữ các mô hình riêng biệt. Chúng tôi tiếp tục giới thiệu khả năng mix’n’match trong Gemma 3n để tạo động các mô hình con từ mô hình 4B có thể phù hợp tối ưu với trường hợp sử dụng cụ thể của bạn – và sự đánh đổi về chất lượng/độ trễ liên quan. Hãy theo dõi để biết thêm về nghiên cứu này trong báo cáo kỹ thuật sắp tới của chúng tôi.
Ưu tiên quyền riêng tư & Sẵn sàng ngoại tuyến: Khả năng thực thi cục bộ cho phép các tính năng tôn trọng quyền riêng tư của người dùng và hoạt động đáng tin cậy, ngay cả khi không có kết nối internet.
Mở rộng Khả năng Hiểu Đa phương thức với Âm thanh: Gemma 3n có thể hiểu và xử lý âm thanh, văn bản và hình ảnh, đồng thời cung cấp khả năng hiểu video được nâng cao đáng kể. Khả năng âm thanh của nó cho phép mô hình thực hiện Nhận dạng giọng nói tự động (chuyển mã) và Dịch thuật (chuyển lời nói thành văn bản đã dịch) chất lượng cao. Ngoài ra, mô hình chấp nhận các đầu vào xen kẽ trên các phương thức, cho phép hiểu các tương tác đa phương thức phức tạp. (Triển khai công khai sắp ra mắt)
Cải thiện khả năng đa ngôn ngữ: Cải thiện hiệu suất đa ngôn ngữ, đặc biệt là tiếng Nhật, tiếng Đức, tiếng Hàn, tiếng Tây Ban Nha và tiếng Pháp. Hiệu suất mạnh mẽ được phản ánh trên các điểm chuẩn đa ngôn ngữ như 50,1% trên WMT24++ (ChrF).

        <img
            class="regular-image"
            src="https://storage.googleapis.com/gweb-developer-goog-blog-assets/images/Artboard_1.original.png"
            alt="MMLU performance"
        />
    
    
        
            <div class="regular-image-description">
                Biểu đồ này hiển thị hiệu suất MMLU so với kích thước mô hình của khả năng mix-n-match (được đào tạo trước) của Gemma 3n.
            </div>
        
</div>

Mở khóa những trải nghiệm mới khi di chuyển

Gemma 3n sẽ trao quyền cho một làn sóng ứng dụng thông minh, khi di chuyển mới bằng cách cho phép các nhà phát triển:

Xây dựng trải nghiệm tương tác trực tiếp có thể hiểu và phản hồi các tín hiệu thính giác và thị giác theo thời gian thực từ môi trường của người dùng.
Nâng cao khả năng hiểu biết sâu sắc hơn và tạo văn bản theo ngữ cảnh bằng cách sử dụng kết hợp đầu vào âm thanh, hình ảnh, video và văn bản—tất cả đều được xử lý riêng tư trên thiết bị.
Phát triển các ứng dụng tập trung vào âm thanh nâng cao, bao gồm chuyển mã giọng nói, dịch thuật theo thời gian thực và các tương tác điều khiển bằng giọng nói phong phú.

Dưới đây là tổng quan và các loại trải nghiệm bạn có thể xây dựng:

Cùng nhau xây dựng có trách nhiệm

Cam kết của chúng tôi đối với quá trình phát triển AI có trách nhiệm là tối quan trọng. Gemma 3n, giống như tất cả các mô hình Gemma, đã trải qua các đánh giá an toàn nghiêm ngặt, quản trị dữ liệu và điều chỉnh phù hợp với các chính sách an toàn của chúng tôi. Chúng tôi tiếp cận các mô hình mở bằng cách đánh giá rủi ro cẩn thận, liên tục tinh chỉnh các hoạt động của mình khi bối cảnh AI phát triển.

Bắt đầu: Xem trước Gemma 3n ngay hôm nay

Chúng tôi rất vui mừng khi đưa Gemma 3n vào tay bạn thông qua bản xem trước bắt đầu từ hôm nay:

Truy cập ban đầu (Hiện có sẵn):

Khám phá dựa trên đám mây với Google AI Studio: Hãy dùng thử Gemma 3n trực tiếp trong trình duyệt của bạn trên Google AI Studio – không cần thiết lập. Khám phá khả năng nhập văn bản của nó ngay lập tức.
Phát triển trên thiết bị với Google AI Edge: Đối với các nhà phát triển muốn tích hợp Gemma 3n cục bộ, Google AI Edge cung cấp các công cụ và thư viện. Bạn có thể bắt đầu với khả năng hiểu/tạo văn bản và hình ảnh ngay hôm nay.

Gemma 3n đánh dấu bước tiếp theo trong việc dân chủ hóa quyền truy cập vào AI tiên tiến, hiệu quả. Chúng tôi vô cùng hào hứng được thấy những gì bạn sẽ xây dựng khi chúng tôi cung cấp công nghệ này một cách liên tục, bắt đầu với bản xem trước ngày hôm nay.

Khám phá thông báo này và tất cả các bản cập nhật Google I/O 2025 trên io.google bắt đầu từ ngày 22 tháng 5.

AI Today - SkyAI