Xây dựng với Nano Banana Pro, mô hình Hình ảnh Gemini 3 Pro của chúng tôi

Hướng dẫn cho nhà phát triển về cách sử dụng Nano Banana Pro để tạo và chỉnh sửa hình ảnh chi tiết

January 31, 2026
7 min read

Xây dựng với Nano Banana Pro, mô hình Hình ảnh Gemini 3 Pro của chúng tôi — Hướng dẫn cho nhà phát triển về cách sử dụng Nano Banana Pro để tạo và chỉnh sửa hình ảnh chi tiết

Các nhà phát triển có thể xây dựng với Nano Banana Pro (Gemini 3 Pro Image)

Hôm nay, chúng tôi ra mắt Nano Banana Pro (Gemini 3 Pro Image), một mô hình có độ trung thực cao hơn được xây dựng trên Gemini 3 Pro dành cho các nhà phát triển truy cập vào khả năng tạo ảnh chất lượng phòng thu. Điều này tiếp nối việc chúng tôi ra mắt Nano Banana (Gemini 2.5 Flash Image) chỉ vài tháng trước. Kể từ đó, chúng tôi đã rất vui mừng khi thấy cộng đồng ứng dụng các tính năng chính của nó — từ tính nhất quán của nhân vật đến phục hồi ảnh, và thậm chí sử dụng khả năng của nó để thực hiện các chỉnh sửa cục bộ trên một khung vẽ vô hạn.

Mô hình tạo và chỉnh sửa ảnh tiên tiến này đang bắt đầu được triển khai dưới dạng xem trước trả phí để xây dựng làn sóng ứng dụng đa phương thức, thông minh mới với Gemini API trong Google AI Studio và Vertex AI cho các doanh nghiệp. Mô hình này mở ra khả năng tạo ảnh có độ trung thực cao với độ chính xác cao hơn trong việc hiển thị văn bản và kiến thức thế giới mạnh mẽ, được tăng cường bởi khả năng sử dụng Grounding với Google Search để truy xuất dữ liệu dựa trên lời nhắc của người dùng.

Biểu đồ cột so sánh Gemini 3 Pro Image với các đối thủ cạnh tranh hàng đầu khác về điểm chuẩn AI Text to Image Gemini 3 Pro Image vượt trội trên các điểm chuẩn AI Text to Image.

Chúng tôi cũng đang mở rộng phạm vi tiếp cận của Gemini 3 Pro Image trên hệ sinh thái nhà phát triển. Trong Google Antigravity — nền tảng phát triển tác tử mới của chúng tôi — các tác tử lập trình giờ đây có thể tận dụng trực tiếp khả năng tạo ảnh này để tạo ra các bản phác thảo giao diện người dùng chi tiết để xem xét hoặc thậm chí các tài sản hình ảnh mới trước khi triển khai vào mã. Ngoài ra, các nền tảng sáng tạo hàng đầu đang tích hợp mô hình này, bao gồm Adobe và Figma.

Độ trung thực cao và kiểm soát

Nếu bạn đang xây dựng các công cụ tiên tiến yêu cầu độ chính xác, Gemini 3 Pro Image cung cấp cho bạn quyền kiểm soát vật lý (ánh sáng, camera, lấy nét, phân loại màu sắc) và bố cục của ảnh để đảm bảo đầu ra chất lượng chuyên nghiệp.

Một hình bóng bị lạc trong biển tia nắng vàng và sương sớm. Lời nhắc: Thay thế ánh sáng khối theo thể tích bằng hiệu ứng bokeh. Một bóng hình lạc giữa biển bokeh vàng và sương sớm.

Với độ phân giải 2K và 4K có sẵn, bạn có thể đảm bảo đầu ra đáp ứng các tiêu chuẩn độ phân giải cần thiết cho sản xuất chuyên nghiệp. Dễ dàng tạo quảng cáo mạch lạc bằng cách kết hợp các yếu tố đa dạng như hình ảnh sản phẩm, logo và tài liệu tham khảo. Đạt được sự tương đồng nhất quán cho tối đa năm cá nhân, tích hợp sáu ảnh có độ trung thực cao hoặc kết hợp tối đa mười bốn đầu vào tiêu chuẩn vào một quảng cáo được đánh bóng duy nhất. Hãy thử ứng dụng demo của chúng tôi — nơi bạn có thể ghép các logo với sản phẩm để tạo thiết kế bản phác thảo của riêng mình.

Ứng dụng demo cập nhật áo phông với logo theo hiệu ứng phun sơn.

Kết xuất văn bản và bản địa hóa nâng cao

Gemini 3 Pro Image mang đến một bước nhảy vọt đáng kể so với 2.5 Flash Image, biến việc tạo ảnh trừu tượng thành các tài sản chức năng. Nó vượt trội trong việc xử lý logic và ngôn ngữ, đồng thời mang lại khả năng kết xuất văn bản tiên tiến, tạo ra văn bản rõ ràng, chính xác được tích hợp trong ảnh của bạn.

8 logo tối giản, tinh tế, mỗi logo là một từ thú vị về thực phẩm, và các chữ cái được làm từ thực phẩm thật để thể hiện ý nghĩa của từ đó. Nhiếp ảnh thực phẩm sáng tạo, trong đó mỗi từ được viết cách điệu bằng cách sử dụng chính nguyên liệu gắn liền với thực phẩm đó.

Đây cũng là một giải pháp lý tưởng để phát triển tài liệu tiếp thị, nội dung giáo dục và nhiều ứng dụng khác. Hãy thử nghiệm khả năng của mô hình trong trình tạo truyện tranh của chúng tôi trong Google AI Studio, nơi bạn có thể tạo truyện tranh nhiều trang độc đáo với bạn và một người bạn, bao gồm kết xuất và tạo kiểu văn bản nâng cao.

Demo tạo truyện tranh kỹ thuật số với văn bản được kết xuất bên trong bằng AI.

Với Gemini 3 Pro Image, chúng tôi đã loại bỏ rào cản giữa việc tạo ảnh và logic bản địa hóa. Mô hình tiên tiến này nắm bắt ngữ cảnh ngữ nghĩa của một hình ảnh, cho phép thay đổi ngôn ngữ dễ dàng trên các yếu tố như menu, bảng hiệu hoặc tài liệu bằng cách sử dụng khả năng tạo ảnh-sang-ảnh, giữ nguyên phong cách nghệ thuật hoặc bố cục ban đầu.

Nghiên cứu về chiến dịch đồ uống làm nổi bật bản dịch và kết xuất văn bản chính xác từ tiếng Anh sang tiếng Pháp. Một ý tưởng chiến dịch đồ uống giới thiệu bản dịch và kết xuất văn bản chính xác từ tiếng Anh sang tiếng Pháp.

Tiếp cận kiến thức thế giới

Gemini 3 Pro Image kết nối một cơ sở kiến thức rộng lớn để tạo ra các tài sản thực tế hơn so với các mô hình tạo ảnh trước đó. Ngoài ra, khi được bật, Grounding với Google Search sẽ kết nối mô hình với nội dung web thời gian thực để cho ra các kết quả dựa trên dữ liệu. Điều này đặc biệt có giá trị đối với các ứng dụng yêu cầu biểu diễn chính xác, chẳng hạn như sơ đồ sinh học hoặc bản đồ lịch sử. Hãy tự mình thử điều này với ứng dụng demo của chúng tôi, nơi bạn có thể tạo đồ họa thông tin động về bất kỳ chủ đề nào được tùy chỉnh cho đối tượng của bạn.

Đồ họa thông tin về các yếu tố cần thiết cho việc chăm sóc và bảo dưỡng xe đạp được tạo bằng một lời nhắc văn bản đơn giản bằng AI. Đồ họa thông tin về việc chăm sóc và bảo dưỡng xe đạp được tạo từ ứng dụng demo để tạo ra các đồ họa thông tin giáo dục.

“Go Bananas” và bắt đầu xây dựng ngay hôm nay

Việc phát hành mô hình mới này tích hợp nhiều thông tin đầu vào mà bạn đã chia sẻ với chúng tôi, nhưng chúng tôi sẽ không dừng lại ở đó. Để đảm bảo nguồn gốc rõ ràng trong phương tiện do AI tạo ra, chúng tôi đã tích hợp các hình mờ kỹ thuật số SynthID trực tiếp vào mọi hình ảnh được tạo hoặc chỉnh sửa bằng Gemini 3 Pro Image để ghi nhận nguồn gốc do AI tạo ra hoặc chỉnh sửa.

Hãy bắt đầu bằng cách khám phá bộ sưu tập các ứng dụng của chúng tôi sử dụng Gemini 3 Pro Image để khơi gợi trí tưởng tượng của bạn và xem những gì có thể thực hiện được. Khi bạn đã có cảm hứng, hãy sửa đổi các ứng dụng demo này hoặc tích hợp trực tiếp mô hình vào các dự án của riêng bạn thông qua Gemini API trong Google AI Studio và Vertex AI cho mục đích doanh nghiệp. Để có chi tiết kỹ thuật trong quá trình này, hãy xem tài liệu, hướng dẫn nhắc, cookbook hoặc truy cập diễn đàn nhà phát triển để nhận trợ giúp và chia sẻ phản hồi.

Bảng so sánh giữa các mô hình Gemini 2 Pro Image và Gemini 2.5 Flash Image về tốc độ, chất lượng và chi phí. Sử dụng Gemini 2.5 Flash Image để tạo ảnh nhanh hơn, chi phí thấp hơn, hoặc Gemini 3 Pro Image để tạo ảnh chất lượng cao hơn, với chi phí và độ trễ cao hơn.

Câu chuyện liên quan

[Developer tools] Giới thiệu Agentic Vision trong Gemini 3 Flash

Bởi Rohan Doshi - Jan 27, 2026
Giới thiệu Agentic Vision trong Gemini 3 Flash

[Developer tools] Công cụ nhà phát triển mới cho người đăng ký Google AI Pro và Ultra

Bởi Niv Govindaraju & Bala Muthukrishnan - Jan 27, 2026
Công cụ nhà phát triển mới cho Google AI Pro và Ultra

[Search] Chỉ cần hỏi bất cứ điều gì: trải nghiệm Tìm kiếm mới liền mạch

Bởi Robby Stein - Jan 27, 2026
Chỉ cần hỏi bất cứ điều gì

[AI] Trong podcast mới nhất của chúng tôi, hãy nghe cách nhóm “Smoke Jumpers” đưa Gemini đến với hàng tỷ người dùng.

Jan 27, 2026
Trong podcast mới nhất của chúng tôi

[Developer tools] TranslateGemma: Bộ mô hình dịch thuật mở mới

Bởi David Vilar & Kat Black - Jan 15, 2026
TranslateGemma: Bộ mô hình dịch thuật mở mới

[Developer tools] Giới thiệu Điểm chuẩn Cộng đồng trên Kaggle

Bởi Michael Aaron & Meg Risdal - Jan 14, 2026
Giới thiệu Điểm chuẩn Cộng đồng trên Kaggle

AI Today - SkyAI