Gemini 3 Flash- trí tuệ tiên phong được chế tạo để đạt tốc độ
Các mô hình
- 7 min read
Giới thiệu Gemini 3 Flash: Chuẩn hiệu năng, sẵn có toàn cầu
Gemini 3 Flash cung cấp trí tuệ tiên tiến được xây dựng để đạt tốc độ với chi phí thấp hơn đáng kể.
Hôm nay, chúng tôi mở rộng dòng sản phẩm Gemini 3 với việc ra mắt Gemini 3 Flash, mang đến trí tuệ tiên tiến được xây dựng để đạt tốc độ với chi phí thấp hơn đáng kể. Với bản phát hành này, chúng tôi đang làm cho trí tuệ thế hệ tiếp theo của Gemini 3 trở nên dễ tiếp cận với mọi người trên các sản phẩm của Google.
Tháng trước, chúng tôi đã khai trương Gemini 3 với Gemini 3 Pro và chế độ Gemini 3 Deep Think, và phản hồi thật đáng kinh ngạc. Kể từ ngày ra mắt, chúng tôi đã xử lý hơn 1 nghìn tỷ token mỗi ngày trên API của mình. Chúng tôi đã thấy bạn sử dụng Gemini 3 để mô phỏng mã vibe nhằm tìm hiểu về các chủ đề phức tạp, xây dựng và thiết kế trò chơi tương tác và hiểu tất cả các loại nội dung đa phương thức.
Với Gemini 3, chúng tôi đã giới thiệu hiệu suất tiên tiến trong các tác vụ suy luận phức tạp, hiểu đa phương thức và thị giác, cũng như các tác vụ đại lý và mã hóa vibe. Gemini 3 Flash giữ vững nền tảng này, kết hợp khả năng suy luận Pro-grade của Gemini 3 với độ trễ, hiệu quả và chi phí ở cấp độ Flash. Nó không chỉ cho phép thực hiện các tác vụ hàng ngày với khả năng suy luận được cải thiện, mà còn là mô hình ấn tượng nhất của chúng tôi cho các quy trình làm việc đại lý.
Bắt đầu từ hôm nay, Gemini 3 Flash đang được triển khai cho hàng triệu người trên toàn cầu:
- Dành cho nhà phát triển: Trong API Gemini trên Google AI Studio, Gemini CLI và nền tảng phát triển đại lý mới của chúng tôi là Google Antigravity.
- Dành cho mọi người: Thông qua ứng dụng Gemini và ở Chế độ AI trong Tìm kiếm.
- Dành cho doanh nghiệp: Trong Vertex AI và Gemini Enterprise.
Gemini 3 Flash: Trí tuệ tiên tiến ở quy mô lớn
Gemini 3 Flash cho thấy rằng tốc độ và quy mô không nhất thiết phải đánh đổi bằng trí tuệ. Nó mang lại hiệu suất tiên tiến trên các tiêu chuẩn suy luận và kiến thức cấp PhD như GPQA Diamond (90,4%) và Humanity’s Last Exam (33,7% không có công cụ), cạnh tranh với các mô hình tiên tiến lớn hơn, và vượt trội đáng kể so với mô hình 2.5 tốt nhất, Gemini 2.5 Pro, trên nhiều tiêu chuẩn. Nó cũng đạt được hiệu suất tốt nhất trong ngành với điểm số ấn tượng 81,2% trên MMMU Pro, tương đương với Gemini 3 Pro.

Ngoài khả năng suy luận đa phương thức và khả năng suy luận cấp độ tiên tiến, Gemini 3 Flash còn được xây dựng để có hiệu quả cao, đẩy biên giới Pareto về chất lượng so với chi phí và tốc độ. Khi xử lý ở cấp độ suy luận cao nhất, Gemini 3 Flash có thể điều chỉnh mức độ suy nghĩ của nó. Nó có thể suy nghĩ lâu hơn cho các trường hợp sử dụng phức tạp hơn, nhưng nó cũng sử dụng ít hơn 30% token so với 2.5 Pro, theo đo lường trên lưu lượng truy cập thông thường, để hoàn thành các tác vụ hàng ngày với hiệu suất cao hơn một cách chính xác.
Gemini 3 Flash đẩy biên giới Pareto về hiệu năng so với chi phí và tốc độ.
Hiệu năng ở đây được đo bằng LMArena Elo Score.
Sức mạnh của Gemini 3 Flash nằm ở tốc độ thô của nó, xây dựng dựa trên dòng Flash mà các nhà phát triển và người tiêu dùng đã yêu thích. Nó vượt trội hơn 2.5 Pro trong khi nhanh hơn gấp 3 lần (dựa trên các tiêu chuẩn của Artificial Analysis) với chi phí thấp hơn đáng kể. Gemini 3 Flash có giá 0,50 USD / 1 triệu token đầu vào và 3 USD / 1 triệu token đầu ra (đầu vào âm thanh vẫn giữ nguyên ở 1 USD / 1 triệu token đầu vào).
Dành cho nhà phát triển: Trí tuệ bắt kịp tốc độ
Gemini 3 Flash được tạo ra để phát triển lặp đi lặp lại, cung cấp hiệu suất mã hóa Pro-grade của Gemini 3 với độ trễ thấp — nó có thể suy luận và giải quyết các tác vụ nhanh chóng trong các quy trình làm việc có tần suất cao. Trên SWE-bench Verified, một tiêu chuẩn để đánh giá khả năng của các tác nhân mã hóa, Gemini 3 Flash đạt điểm 78%, vượt trội không chỉ dòng 2.5, mà còn cả Gemini 3 Pro. Nó đạt được sự cân bằng lý tưởng cho mã hóa đại lý, các hệ thống sẵn sàng sản xuất và các ứng dụng tương tác phản hồi nhanh.

Hiệu suất mạnh mẽ của Gemini 3 Flash trong suy luận, sử dụng công cụ và khả năng đa phương thức lý tưởng cho các nhà phát triển muốn thực hiện phân tích video phức tạp hơn, trích xuất dữ liệu và hỏi đáp trực quan, có nghĩa là nó có thể cho phép các ứng dụng thông minh hơn — như trợ lý trong trò chơi hoặc thử nghiệm A/B — đòi hỏi cả câu trả lời nhanh và suy luận sâu sắc.

Gemini 3 Flash cũng bắt đầu được triển khai làm mô hình mặc định cho Chế độ AI trong Tìm kiếm với quyền truy cập cho mọi người trên toàn thế giới.
Dựa trên khả năng suy luận của Gemini 3 Pro, Chế độ AI với Gemini 3 Flash mạnh mẽ hơn trong việc phân tích các sắc thái trong câu hỏi của bạn. Nó xem xét mọi khía cạnh của truy vấn của bạn để cung cấp các phản hồi chu đáo, toàn diện mà có thể tiêu hóa bằng hình ảnh — kéo thông tin địa phương theo thời gian thực và các liên kết hữu ích từ khắp web. Kết quả kết hợp hiệu quả nghiên cứu với hành động tức thì: bạn nhận được một phân tích được tổ chức thông minh cùng với các đề xuất cụ thể — với tốc độ của Tìm kiếm.
Điều này tỏa sáng khi giải quyết các mục tiêu phức tạp với nhiều yếu tố xem xét như cố gắng lên kế hoạch cho một chuyến đi vào phút chót hoặc nhanh chóng tìm hiểu các khái niệm giáo dục phức tạp.

Hãy thử Gemini 3 Flash ngay hôm nay
Gemini 3 Flash hiện đã có sẵn dưới dạng bản xem trước thông qua API Gemini trên Google AI Studio, Google Antigravity, Vertex AI và Gemini Enterprise. Bạn cũng có thể truy cập nó thông qua các công cụ nhà phát triển khác như Gemini CLI và Android Studio. Nó cũng bắt đầu được triển khai cho mọi người trong ứng dụng Gemini và Chế độ AI trong Tìm kiếm, mang đến quyền truy cập nhanh vào trí tuệ thế hệ tiếp theo mà không mất phí.
Chúng tôi mong muốn được thấy những gì bạn sẽ tạo ra với dòng mô hình mở rộng này: Gemini 3 Pro, Gemini 3 Deep Think và bây giờ là Gemini 3 Flash.
TAGS: Gemini Models, AI, Google DeepMind
Câu chuyện liên quan
- Google Cloud - 5 cách các tác nhân AI sẽ thay đổi cách chúng ta làm việc vào năm 2026
- Bởi Anil Jain - Ngày 19 tháng 12 năm 2025
- AI - Giờ đây, bạn có thể xác minh các video do Google AI tạo trong ứng dụng Gemini.
- Ngày 18 tháng 12 năm 2025
- Nhà phát triển - Bên trong khóa học chuyên sâu về Tác nhân AI của Kaggle với Google
- Bởi Brenda Flynn và Anant Nawalgaria - Ngày 18 tháng 12 năm 2025
- AI - Xem một cuộc thảo luận podcast về Gemini 3 và tương lai của Tìm kiếm.
- Ngày 18 tháng 12 năm 2025
- Nhà phát triển - Xây dựng với Gemini 3 Flash, trí tuệ tiên tiến có thể mở rộng cùng bạn
- Bởi Logan Kilpatrick - Ngày 17 tháng 12 năm 2025
- Bền vững - Chúng tôi đang xuất bản một cuốn cẩm nang AI để giúp những người khác báo cáo về tính bền vững.
- Bởi Luke Elder - Ngày 15 tháng 12 năm 2025
Link bài viết gốc
- Tags:
- Ai
- December 2025
- Blog.google