Xây dựng với Nano Banana Pro, mô hình Gemini 3 Pro Image của chúng tôi

Giới thiệu Nano Banana Pro, mô hình tạo và chỉnh sửa hình ảnh tiên tiến dựa trên Gemini 3 Pro.

  • 7 min read
Xây dựng với Nano Banana Pro, mô hình Gemini 3 Pro Image của chúng tôi
Giới thiệu Nano Banana Pro, mô hình tạo và chỉnh sửa hình ảnh tiên tiến dựa trên Gemini 3 Pro.

Phát triển với Nano Banana Pro, mô hình Gemini 3 Pro Image của chúng tôi

Hôm nay, chúng tôi ra mắt Nano Banana Pro (Gemini 3 Pro Image), một mô hình có độ trung thực cao hơn được xây dựng trên Gemini 3 Pro, dành cho các nhà phát triển sử dụng. Mô hình này cho phép tạo ảnh chất lượng phòng thu, tiếp nối bản phát hành Nano Banana (Gemini 2.5 Flash Image) cách đây vài tháng. Kể từ đó, chúng tôi đã rất vui mừng khi thấy cộng đồng ứng dụng các tính năng chính của nó, từ tính nhất quán về nhân vật đến phục hồi ảnh, và thậm chí sử dụng khả năng của nó để chỉnh sửa cục bộ trong một khung vẽ vô hạn.

Mô hình tạo và chỉnh sửa ảnh tiên tiến này đang bắt đầu được triển khai trong bản xem trước trả phí để xây dựng làn sóng ứng dụng đa phương thức, thông minh mới với Gemini API trên Google AI Studio và Vertex AI cho các doanh nghiệp. Mô hình này mang lại hình ảnh có độ trung thực cao với độ chính xác vượt trội trong việc hiển thị văn bản và kiến thức thế giới mạnh mẽ, được tăng cường nhờ khả năng sử dụng kết quả tìm kiếm từ Google Search để truy xuất dữ liệu dựa trên lời nhắc của người dùng.

Chúng tôi cũng đang mở rộng phạm vi tiếp cận của Gemini 3 Pro Image trên hệ sinh thái nhà phát triển. Trong Google Antigravity — nền tảng phát triển tác nhân mới của chúng tôi — các tác nhân mã giờ đây có thể tận dụng trực tiếp các khả năng tạo ảnh này để tạo các bản thiết kế UI chi tiết cho người dùng xem xét hoặc thậm chí các tài sản hình ảnh mới trước khi triển khai vào mã. Ngoài ra, các nền tảng sáng tạo hàng đầu đang tích hợp mô hình này, bao gồm Adobe và Figma.

Độ trung thực và kiểm soát cao

Nếu bạn đang xây dựng các công cụ tiên tiến yêu cầu độ chính xác, Gemini 3 Pro Image cung cấp cho bạn quyền kiểm soát các yếu tố vật lý (ánh sáng, máy ảnh, lấy nét, chỉnh màu) và bố cục của ảnh để đảm bảo kết quả chất lượng chuyên nghiệp. Dễ dàng tạo các quảng cáo mạch lạc bằng cách kết hợp các yếu tố đa dạng như ảnh sản phẩm, logo và tài liệu tham khảo. Đạt được sự tương đồng nhất quán cho tối đa năm người, tích hợp sáu ảnh có độ trung thực cao hoặc kết hợp tối đa mười bốn đầu vào tiêu chuẩn vào một quảng cáo duy nhất, được đánh bóng. Hãy thử ứng dụng demo của chúng tôi, ứng dụng này cho phép bạn ghép nối logo với sản phẩm để tạo các thiết kế mockup của riêng bạn.

Một bóng người lạc lõng giữa biển ánh sáng vàng và màn sương buổi sáng. Prompt: Thay đổi ánh sáng thể tích bằng bokeh

Kết xuất văn bản và bản địa hóa được cải thiện

Gemini 3 Pro Image mang đến một bước nhảy vọt đáng kể so với 2.5 Flash Image, biến việc tạo ảnh trừu tượng thành các tài sản chức năng. Nó vượt trội trong việc xử lý logic và ngôn ngữ, đồng thời mang lại khả năng kết xuất văn bản hàng đầu, tạo ra văn bản rõ ràng, chính xác được tích hợp trong ảnh của bạn.

Nhiếp ảnh ẩm thực sáng tạo, nơi mỗi từ được viết một cách nghệ thuật bằng các nguyên liệu thực tế liên quan đến món ăn đó. Prompt: Tạo 8 logo tối giản tinh tế, mỗi logo là một từ ẩm thực vui nhộn, và tạo các chữ cái từ thực phẩm thực tế để thể hiện ý nghĩa của từ đó. bố cục: hiển thị tất cả các logo trên một nền trắng đồng nhất

Đây cũng là một giải pháp lý tưởng để phát triển tài liệu tiếp thị, nội dung giáo dục và nhiều ứng dụng khác. Hãy thử nghiệm khả năng của mô hình trong ứng dụng tạo truyện tranh của chúng tôi trên Google AI Studio, nơi bạn có thể tạo truyện tranh nhiều trang gốc có bạn và bạn bè của bạn, hoàn chỉnh với khả năng kết xuất và tạo kiểu văn bản nâng cao.

Ứng dụng demo tạo truyện tranh bằng ngôn ngữ bạn chọn dựa trên ảnh và thể loại đã chọn. Các chuỗi đã được rút ngắn.

Với Gemini 3 Pro Image, chúng tôi đã loại bỏ rào cản giữa tạo ảnh và logic bản địa hóa. Mô hình tiên tiến này nắm bắt ngữ cảnh ngữ nghĩa của hình ảnh, cho phép thay đổi ngôn ngữ dễ dàng trên các yếu tố như menu, biển báo hoặc tài liệu bằng cách sử dụng tính năng tạo ảnh từ ảnh, giữ nguyên phong cách nghệ thuật hoặc bố cục ban đầu.

Ý tưởng chiến dịch đồ uống hiển thị bản dịch và kết xuất chính xác văn bản tiếng Anh sang tiếng Pháp. Prompt: Dịch sang tiếng Pháp

Truy cập kiến thức thế giới

Gemini 3 Pro Image kết nối một cơ sở kiến thức rộng lớn để tạo ra các tài sản chính xác hơn so với các mô hình tạo ảnh trước đó. Ngoài ra, khi được kích hoạt, việc kết nối với Google Search sẽ liên kết mô hình với nội dung web theo thời gian thực để có kết quả dựa trên dữ liệu. Điều này đặc biệt có giá trị đối với các ứng dụng yêu cầu biểu diễn chính xác, chẳng hạn như sơ đồ sinh học hoặc bản đồ lịch sử. Hãy tự mình thử nghiệm với ứng dụng demo của chúng tôi, nơi bạn có thể tạo infographic động về bất kỳ chủ đề nào phù hợp với đối tượng của bạn.

Infographic chăm sóc và bảo trì xe đạp được tạo từ ứng dụng demo tạo infographic giáo dục.

“Go bananas” và bắt đầu xây dựng ngay hôm nay

Bản phát hành mô hình mới này kết hợp nhiều thông tin đầu vào mà bạn đã chia sẻ với chúng tôi, nhưng chúng tôi sẽ không dừng lại ở đó. Để đảm bảo nguồn gốc rõ ràng trong phương tiện do AI tạo ra, chúng tôi đã tích hợp dấu agua kỹ thuật số SynthID trực tiếp vào mọi ảnh được tạo hoặc chỉnh sửa bằng Gemini 3 Pro Image để ghi nhận nguồn gốc do AI tạo ra hoặc đã chỉnh sửa.

Hãy bắt đầu bằng cách khám phá bộ sưu tập ứng dụng của chúng tôi sử dụng Gemini 3 Pro Image để khơi dậy trí tưởng tượng của bạn và xem những gì có thể thực hiện được. Sau khi bạn có cảm hứng, hãy sửa đổi các ứng dụng demo này hoặc tích hợp mô hình trực tiếp vào các dự án của riêng bạn thông qua Gemini API trong Google AI Studio và Vertex AI cho doanh nghiệp. Để biết chi tiết kỹ thuật trên đường đi, hãy xem tài liệu, hướng dẫn nhắc, sách dạy nấu ăn hoặc truy cập diễn đàn nhà phát triển để nhận trợ giúp và chia sẻ phản hồi.

Sử dụng Gemini 2.5 Flash Image để tạo ảnh nhanh hơn, chi phí thấp hơn, hoặc 3 Pro Image để tạo ảnh chất lượng cao hơn, với chi phí và độ trễ cao hơn.


Bài viết liên quan:

  • AI - 16 mẹo AI của Google để bạn có một kỳ nghỉ lễ thư giãn vào năm 2025 - Bởi Molly McHugh-Johnson - ngày 21 tháng 11 năm 2025
  • Learning & Education - Phát triển sự hiểu biết sâu sắc hơn với hình ảnh tương tác trong Gemini. - Bởi Dave Messer - ngày 20 tháng 11 năm 2025
  • Gemini App - 7 mẹo để tận dụng tối đa Nano Banana Pro - Bởi Bea Alessio - ngày 20 tháng 11 năm 2025
  • AI - Cách chúng tôi mang xác minh hình ảnh AI đến ứng dụng Gemini - Bởi Pushmeet Kohli, Laurie Richardson - ngày 20 tháng 11 năm 2025
  • AI - Giới thiệu Nano Banana Pro - Bởi Naina Raisinghani - ngày 20 tháng 11 năm 2025
  • Google Cloud - Westinghouse làm thế nào để tái năng lượng hạt nhân bằng — và cho — AI - Bởi Matt A.V. Chaban - ngày 20 tháng 11 năm 2025

ĐƯỢC ĐĂNG TRONG:

Recommended for You

Cách chúng tôi mang tính năng xác minh hình ảnh AI đến ứng dụng Gemini

Cách chúng tôi mang tính năng xác minh hình ảnh AI đến ứng dụng Gemini

Tìm hiểu cách Google DeepMind tích hợp xác minh hình ảnh vào ứng dụng Gemini để nâng cao độ tin cậy.

Bắt đầu xây dựng với Gemini 3

Bắt đầu xây dựng với Gemini 3

Bắt đầu xây dựng với Gemini 3