Gemini 3 Flash- Trí tuệ tiên phong được xây dựng cho tốc độ

Gemini 3 Flash là phiên bản mới nhất của Gemini, tập trung vào tốc độ và hiệu quả

  • 10 min read
Gemini 3 Flash- Trí tuệ tiên phong được xây dựng cho tốc độ
Gemini 3 Flash là phiên bản mới nhất của Gemini, tập trung vào tốc độ và hiệu quả

Giới thiệu Gemini 3 Flash: Điểm chuẩn, khả dụng trên toàn cầu

Gemini 3 Flash cung cấp trí tuệ tiên phong được xây dựng cho tốc độ với chi phí thấp hơn.


Hôm nay, chúng tôi giới thiệu Gemini 3 Flash, mô hình mới nhất của chúng tôi với trí tuệ tiên phong được xây dựng cho tốc độ, giúp mọi người học, xây dựng và lên kế hoạch mọi thứ – nhanh hơn.

Tháng trước, chúng tôi đã ra mắt Gemini 3 với Gemini 3 Pro và chế độ Gemini 3 Deep Think, và phản hồi thật đáng kinh ngạc. Kể từ khi ra mắt, chúng tôi đã xử lý hơn 1 nghìn tỷ token mỗi ngày trên API của mình. Chúng tôi đã thấy bạn sử dụng Gemini 3 để điều chỉnh các mô phỏng mã nhằm tìm hiểu các chủ đề phức tạp, xây dựng và thiết kế các trò chơi tương tác, đồng thời hiểu tất cả các loại nội dung đa phương thức.

Với Gemini 3, chúng tôi đã giới thiệu hiệu suất tiên phong trên các tác vụ suy luận phức tạp, hiểu biết đa phương thức và thị giác, cũng như các tác vụ đại diện và mã hóa rung động. Gemini 3 Flash giữ vững nền tảng này, kết hợp suy luận cấp độ Pro của Gemini 3 với độ trễ, hiệu quả và chi phí ở cấp độ Flash. Nó không chỉ hỗ trợ các tác vụ hàng ngày với khả năng suy luận được cải thiện mà còn là mô hình ấn tượng nhất của chúng tôi cho các quy trình làm việc đại diện.

Bắt đầu từ hôm nay, Gemini 3 Flash đang được triển khai cho hàng triệu người trên toàn cầu:

  • Đối với các nhà phát triển trong Gemini API tại Google AI Studio, Gemini CLI và nền tảng phát triển đại diện mới của chúng tôi, Google Antigravity.
  • Cho tất cả mọi người thông qua ứng dụng Gemini và Chế độ AI trong Tìm kiếm.
  • Cho doanh nghiệp trong Vertex AI và Gemini Enterprise.

Gemini 3 Flash: Trí tuệ tiên phong ở quy mô lớn

Gemini 3 Flash chứng minh rằng tốc độ và quy mô không nhất thiết phải đánh đổi lấy trí tuệ. Nó mang lại hiệu suất tiên phong trên các điểm chuẩn suy luận cấp độ Tiến sĩ và kiến thức chuyên môn như GPQA Diamond (90,4%) và Humanity’s Last Exam (33,7% không sử dụng công cụ), cạnh tranh với các mô hình tiên phong lớn hơn và vượt trội đáng kể so với mô hình 2.5 tốt nhất, Gemini 2.5 Pro, trên nhiều điểm chuẩn. Nó cũng đạt được hiệu suất tiên tiến với điểm số ấn tượng 81,2% trên MMMU Pro, tương đương với Gemini 3 Pro.

Bảng so sánh điểm chuẩn cho các mô hình ngôn ngữ

Ngoài khả năng suy luận và đa phương thức tiên tiến, Gemini 3 Flash còn được xây dựng để có hiệu quả cao, đẩy biên Pareto về chất lượng so với chi phí và tốc độ. Khi xử lý ở cấp độ suy nghĩ cao nhất, Gemini 3 Flash có thể điều chỉnh mức độ suy nghĩ của nó. Nó có thể suy nghĩ lâu hơn cho các trường hợp sử dụng phức tạp hơn, nhưng nó cũng sử dụng ít hơn 30% token trung bình so với 2.5 Pro, theo phép đo trên lưu lượng truy cập thông thường, để hoàn thành các tác vụ hàng ngày một cách chính xác với hiệu suất cao hơn.

Biểu đồ Pareto hiển thị điểm Elo LMArena so với Giá mỗi triệu token

Gemini 3 Flash đẩy biên Pareto về hiệu suất so với chi phí và tốc độ.

Hiệu suất ở đây được đo bằng Điểm Elo LMArena.

Tốc độ thô của Gemini 3 Flash, được xây dựng dựa trên dòng sản phẩm Flash mà các nhà phát triển và người tiêu dùng yêu thích, là điểm mạnh của nó. Nó vượt trội hơn 2.5 Pro trong khi nhanh hơn gấp 3 lần (dựa trên đánh giá của Artificial Analysis) với chi phí thấp hơn đáng kể. Gemini 3 Flash có giá 0,50 USD / 1 triệu token đầu vào và 3 USD / 1 triệu token đầu ra (đầu vào âm thanh vẫn là 1 USD / 1 triệu token đầu vào).

Video demo Gemini 3 Flash

Gemini 3 Flash vượt trội hơn 2.5 Pro về tốc độ và chất lượng.

Đối với các nhà phát triển: trí tuệ bắt kịp

Gemini 3 Flash được tạo ra để phát triển lặp đi lặp lại, mang lại hiệu suất mã hóa cấp độ Pro của Gemini 3 với độ trễ thấp — nó có thể suy luận và giải quyết các tác vụ nhanh chóng trong các quy trình làm việc có tần suất cao. Trên SWE-bench Verified, một điểm chuẩn để đánh giá khả năng của tác nhân mã hóa, Gemini 3 Flash đạt điểm 78%, vượt trội không chỉ các phiên bản 2.5 mà còn cả Gemini 3 Pro. Nó đạt được sự cân bằng lý tưởng cho mã hóa đại diện, các hệ thống sẵn sàng cho sản xuất và các ứng dụng tương tác phản hồi.

Video demo Gemini 3 Flash cho nhà phát triển

Gemini 3 Flash hoạt động nhanh chóng để cập nhật các ứng dụng sẵn sàng cho sản xuất.

Khả năng suy luận đa phương thức mạnh mẽ của Gemini 3 Flash rất lý tưởng cho các nhà phát triển muốn thực hiện phân tích video, trích xuất dữ liệu và Hỏi & Đáp thị giác phức tạp hơn, điều đó có nghĩa là nó có thể hỗ trợ nhiều ứng dụng thông minh hơn — như trợ lý trong trò chơi hoặc thử nghiệm A/B — đòi hỏi cả câu trả lời nhanh chóng và suy luận sâu sắc.

Gemini 3 Flash sling shot game demo

Gemini 3 Flash cho phép suy luận đa phương thức trong trò chơi giải đố “ném bóng” theo dõi bằng tay, cung cấp hỗ trợ AI gần như theo thời gian thực.

Gemini 3 Flash demo Cloud City

Gemini 3 Flash phân tích và chú thích hình ảnh với các lớp phủ UI theo ngữ cảnh theo thời gian thực, cuối cùng biến hình ảnh tĩnh thành trải nghiệm tương tác.

Gemini 3 Flash demo UI design variations

Gemini 3 Flash lấy một lời nhắc lệnh duy nhất và mã hóa ba biến thể thiết kế độc đáo.

Chúng tôi đã nhận được phản hồi vô cùng tích cực từ các công ty sử dụng Gemini 3 Flash. Các công ty như JetBrains, Bridgewater Associates và Figma đã sử dụng nó để chuyển đổi hoạt động kinh doanh của họ, nhận thấy tốc độ suy luận, hiệu quả và khả năng suy luận của nó hoạt động ngang bằng với các mô hình lớn hơn. Gemini 3 Flash hiện có sẵn cho doanh nghiệp thông qua Vertex AI và Gemini Enterprise.

Trích dẫn khách hàng JetBrains

Dành cho mọi người: Gemini 3 Flash đang được triển khai trên toàn cầu

Gemini 3 Flash hiện là mô hình mặc định trong ứng dụng Gemini, thay thế cho 2.5 Flash. Điều đó có nghĩa là tất cả người dùng Gemini của chúng tôi trên toàn cầu sẽ được truy cập trải nghiệm Gemini 3 mà không phải trả phí, giúp nâng cấp đáng kể các tác vụ hàng ngày của họ.

Do khả năng suy luận đa phương thức đáng kinh ngạc của Gemini 3 Flash, bạn có thể sử dụng nó để giúp bạn xem, nghe và hiểu mọi loại thông tin nhanh hơn. Ví dụ: bạn có thể yêu cầu Gemini hiểu video và hình ảnh của bạn và biến nội dung đó thành một kế hoạch hữu ích và có thể hành động chỉ trong vài giây.

Demo swing golf Gemini 3

Gemini 3 Flash trong ứng dụng Gemini có thể phân tích nội dung video ngắn và cung cấp cho bạn một kế hoạch, chẳng hạn như cách cải thiện cú đánh golf của bạn.

Demo Pictionary Gemini 3 Flash

Vì Gemini 3 Flash được tối ưu hóa cho tốc độ, nó có thể nhìn thấy và đoán những gì bạn đang vẽ trong khi bạn vẫn đang phác thảo nó.

Demo học tập Gemini 3 Flash

Bạn có thể tải lên bản ghi âm và Gemini 3 Flash sẽ xác định các lỗ hổng kiến thức của bạn, tạo một bài kiểm tra tùy chỉnh và cung cấp cho bạn các giải thích chi tiết về các câu trả lời.

Bạn cũng có thể nhanh chóng xây dựng các ứng dụng thú vị, hữu ích từ đầu bằng giọng nói của mình mà không cần kiến thức lập trình trước đó. Chỉ cần đọc cho Gemini nghe khi đang di chuyển và nó có thể biến những suy nghĩ chưa được cấu trúc của bạn thành một ứng dụng hoạt động chỉ trong vài phút.

Demo tạo mẫu thực phẩm bằng Gemini 3 Flash

Gemini 3 Flash | Từ ý tưởng đến ứng dụng trong vài phút

Gemini 3 Flash cũng bắt đầu được triển khai làm mô hình mặc định cho Chế độ AI trong Tìm kiếm với quyền truy cập cho mọi người trên toàn thế giới.

Dựa trên khả năng suy luận của Gemini 3 Pro, Chế độ AI với Gemini 3 Flash mạnh mẽ hơn trong việc phân tích sắc thái trong câu hỏi của bạn. Nó xem xét từng khía cạnh của truy vấn của bạn để cung cấp các phản hồi chu đáo, toàn diện, dễ hiểu bằng hình ảnh — lấy thông tin địa phương theo thời gian thực và các liên kết hữu ích từ khắp web. Kết quả kết hợp hiệu quả nghiên cứu với hành động tức thì: bạn nhận được một bản phân tích được tổ chức thông minh cùng với các đề xuất cụ thể — với tốc độ của Tìm kiếm.

Điều này tỏa sáng khi giải quyết các mục tiêu phức tạp với nhiều yếu tố xem xét như lên kế hoạch cho một chuyến đi cuối cùng hoặc nhanh chóng tìm hiểu các khái niệm giáo dục phức tạp.

Demo Gemini 3 Flash trong Chế độ AI

Gemini 3 Flash mang khả năng suy luận đáng kinh ngạc của Gemini 3 đến Tìm kiếm, mà không ảnh hưởng đến tốc độ, để bạn có thể giải quyết các câu hỏi phức tạp nhất của mình.

Hãy thử Gemini 3 Flash ngay hôm nay

Gemini 3 Flash hiện có sẵn trong bản xem trước thông qua Gemini API tại Google AI Studio, Google Antigravity, Vertex AI và Gemini Enterprise. Bạn cũng có thể truy cập nó thông qua các công cụ dành cho nhà phát triển khác như Gemini CLI và Android Studio. Nó cũng đang bắt đầu được triển khai cho tất cả mọi người trong ứng dụng Gemini và Chế độ AI trong Tìm kiếm, mang lại quyền truy cập nhanh vào trí tuệ thế hệ tiếp theo mà không mất phí.

Chúng tôi mong muốn được thấy những gì bạn sẽ tạo ra với gia đình mô hình mở rộng này: Gemini 3 Pro, Gemini 3 Deep Think và hiện tại là Gemini 3 Flash.


ĐƯỢC ĐĂNG TRONG: Gemini models, AI Products, Google DeepMind

LIÊN QUAN ĐẾN CÂU CHUYỆN:

  • Google DeepMind - Project Genie: Thử nghiệm với thế giới vô hạn, tương tác
  • Công cụ dành cho nhà phát triển - Giới thiệu Agentic Vision trong Gemini 3 Flash
  • Công cụ dành cho nhà phát triển - Các công cụ dành cho nhà phát triển mới cho người đăng ký Google AI Pro và Ultra
  • Tìm kiếm - Chỉ cần hỏi bất cứ điều gì: trải nghiệm Tìm kiếm mới liền mạch
  • AI - Trong podcast mới nhất của chúng tôi, hãy nghe cách nhóm “Smoke Jumpers” mang Gemini đến hàng tỷ người.
  • Google DeepMind - Làm thế nào các nhà làm phim hoạt hình và nhà nghiên cứu AI đã tạo ra ‘Dear Upstairs Neighbors’

Recommended for You

Cải thiện các mô hình âm thanh Gemini cho trải nghiệm giọng nói mạnh mẽ

Cải thiện các mô hình âm thanh Gemini cho trải nghiệm giọng nói mạnh mẽ

Các bản cập nhật cho mô hình âm thanh Gemini giúp cải thiện trải nghiệm giọng nói và tương tác

Tổng kết năm của Google- 8 lĩnh vực có những đột phá nghiên cứu trong năm 2025

Tổng kết năm của Google- 8 lĩnh vực có những đột phá nghiên cứu trong năm 2025

Xem lại những đột phá nghiên cứu AI nổi bật của Google trong năm 2025 trên 8 lĩnh vực khác nhau.