Bắt đầu xây dựng với Gemini 3

November 19, 2025
12 min read

Gemini 3 dành cho nhà phát triển: Khả năng suy luận và tác tử mới

Google giới thiệu khả năng lập trình tác tử tiên tiến cho Gemini 3, cùng với Google Antigravity, một nền tảng phát triển tác tử mới.

Giới thiệu Gemini 3 Pro

Hôm nay, chúng tôi giới thiệu Gemini 3, mô hình thông minh nhất của chúng tôi, có thể giúp hiện thực hóa mọi ý tưởng. Được xây dựng trên nền tảng suy luận tiên tiến, Gemini 3 Pro mang lại kết quả vượt trội trên mọi chỉ số AI chính so với các phiên bản trước. Nó cũng vượt trội Gemini 2.5 Pro về lập trình, thành thạo cả quy trình làm việc của tác tử và các tác vụ zero-shot phức tạp.

Bảng xếp hạng so sánh các mô hình AI

Gemini 3 Pro tích hợp liền mạch vào quy trình làm việc tác tử và lập trình hiện có, đồng thời cho phép các trường hợp sử dụng mới chưa từng có. Nó có sẵn dưới dạng bản xem trước với giá 2 đô la/1 triệu token đầu vào và 12 đô la/1 triệu token đầu ra cho các lệnh nhắc dưới 200 nghìn token thông qua API Gemini trong Google AI Studio và Vertex AI cho doanh nghiệp (xem bảng giá để biết giới hạn tốc độ và chi tiết giá đầy đủ). Ngoài ra, nó có thể được sử dụng thông qua các công cụ nhà phát triển yêu thích của bạn trong hệ sinh thái rộng lớn hơn và có sẵn, với giới hạn tốc độ, miễn phí trong Google AI Studio.

Lập trình tác tử (Agentic Coding)

Các nhà phát triển ngày càng dành nhiều thời gian hơn để tạo phần mềm với AI hỗ trợ. Dựa trên đà phát triển của Gemini 2.5 Pro và tất cả phản hồi nhận được, Gemini 3 Pro phục vụ như một nền tảng trí tuệ mới cho những gì có thể với mô hình lập trình tác tử.

Biểu đồ đánh giá Terminal Bench cho Gemini 3 và các mô hình AI khác

Gemini 3 Pro ghi được 54,2% điểm trên Terminal-Bench 2.0, bài kiểm tra khả năng sử dụng công cụ của mô hình để vận hành máy tính thông qua terminal.

Bạn có thể cảm nhận sức mạnh của mô hình này khi hoạt động trong Google Antigravity, nền tảng phát triển tác tử mới của chúng tôi, ngoài Gemini CLI, Android Studio, và các sản phẩm lập trình khác như Cursor, GitHub, JetBrains, Manus, Cline và nhiều hơn nữa.

Cline đang sử dụng Gemini 3 để cung cấp khả năng tạo mã tự động trong IDE của nhà phát triển…. Gemini 3 Pro xử lý các tác vụ phức tạp, tầm xa trên toàn bộ cơ sở mã, duy trì ngữ cảnh thông qua các quy trình tái cấu trúc đa tệp, phiên gỡ lỗi và triển khai tính năng. Nó sử dụng ngữ cảnh dài hiệu quả hơn nhiều so với Gemini 2.5 Pro và đã giải quyết các vấn đề làm bối rối các mô hình hàng đầu khác.

- Nik Pash, Trưởng bộ phận AI, Cline

Google Antigravity

Để nâng cao cách mô hình và IDE hoạt động cùng nhau, chúng tôi giới thiệu Google Antigravity để giới thiệu những gì có thể với Gemini 3. Đây là một nền tảng phát triển tác tử cho phép các nhà phát triển hoạt động ở cấp độ cao hơn, hướng tới tác vụ bằng cách quản lý các tác tử trên các không gian làm việc, đồng thời vẫn giữ trải nghiệm IDE AI quen thuộc làm cốt lõi.

Đây là cách phát triển nhanh hơn: bạn đóng vai trò là kiến trúc sư, cộng tác với các tác tử thông minh hoạt động tự động trên trình soạn thảo, terminal và trình duyệt. Các tác tử này lập kế hoạch và thực thi các tác vụ phần mềm phức tạp, truyền đạt công việc của họ cho người dùng thông qua các tạo phẩm chi tiết. Điều này nâng cao tất cả các khía cạnh của phát triển, từ xây dựng tính năng, lặp lại UI, sửa lỗi cho đến nghiên cứu và tạo báo cáo. Truy cập trang web Google Antigravity để tải xuống bản xem trước công khai miễn phí, hiện có sẵn cho MacOS, Windows và Linux.

Video hiển thị ứng dụng bảng trắng được xây dựng với nhiều tác tử chạy song song trong IDE trên máy tính.

API Gemini

Với Gemini 3, chúng tôi đang phát hành một công cụ bash phía máy khách cho phép mô hình đề xuất lệnh shell như một phần của quy trình làm việc của tác tử cho các tác vụ như điều hướng hệ thống tệp cục bộ, điều khiển quy trình phát triển và tự động hóa hoạt động hệ thống. Chúng tôi đang kết hợp điều này với một công cụ bash phía máy chủ được lưu trữ để tạo mã đa ngôn ngữ và tạo mẫu an toàn. Hiện đã có trong API Gemini dành cho các đối tác truy cập sớm, với tính khả dụng chung sớm.

Ngoài ra, các công cụ do Gemini lưu trữ Grounding with Google Search và URL context giờ đây có thể được kết hợp với đầu ra có cấu trúc. Điều này đặc biệt mạnh mẽ để xây dựng các trường hợp sử dụng tác tử liên quan đến việc lấy và trích xuất dữ liệu, sau đó xuất chúng ở định dạng cụ thể cho các tác vụ tác tử tiếp theo.

Lập trình theo “vibe” (Vibe Coding)

Gemini 3 Pro mở khóa tiềm năng thực sự của “lập trình theo vibe”, nơi ngôn ngữ tự nhiên là cú pháp duy nhất bạn cần. Bằng cách cải thiện đáng kể khả năng tuân theo các hướng dẫn phức tạp và sử dụng công cụ chuyên sâu, mô hình có thể chuyển đổi ý tưởng cấp cao thành ứng dụng tương tác hoàn chỉnh chỉ với một lệnh nhắc duy nhất. Nó xử lý việc lập kế hoạch đa bước và chi tiết mã hóa, mang lại hình ảnh phong phú hơn và khả năng tương tác sâu hơn, cho phép bạn tập trung vào tầm nhìn sáng tạo.

Đồ họa hiển thị điểm số bảng xếp hạng WebDev Arena 1487

Gemini 3 Pro đứng đầu bảng xếp hạng WebDev Arena với điểm Elo ấn tượng 1487.

Khả năng tuân thủ lệnh nhắc xuất sắc của Gemini 3 tăng cường nền tảng phát triển ứng dụng fullstack của Emergent, đặc biệt là trong quy trình làm việc UI/frontend. Chúng tôi đang thấy những kết quả đáng kinh ngạc khi kết hợp khả năng gọi công cụ đa bước của Gemini 3 vào thiết lập phát triển mã tác tử của mình.

- Madhav Jha, Đồng sáng lập và CTO, Emergent

Google AI Studio

Cho dù đó là xây dựng một trò chơi bằng một lệnh nhắc duy nhất, một trang đích tương tác từ các ghi chú giọng nói không có cấu trúc, hay một ứng dụng hoàn chỉnh từ một bản phác thảo trên giấy ăn, các nhà phát triển có thể hiện thực hóa ý tưởng của mình với Gemini 3. Với mô hình này, chúng tôi đã đẩy các khả năng tạo từ một lần nhắc tiến xa hơn bao giờ hết, có nghĩa là bạn có thể chuyển từ ý tưởng sang ứng dụng do AI cung cấp chỉ bằng một lệnh nhắc, như trò chơi retro này được xây dựng trong Google AI Studio.

Video hiển thị ứng dụng bảng trắng được xây dựng với nhiều tác tử chạy song song trong IDE trên máy tính.

Chúng tôi đã xây dựng Google AI Studio để trở thành con đường nhanh nhất của bạn từ lệnh nhắc đến ứng dụng gốc AI. Chế độ Build cho phép bạn thêm các khả năng AI nhanh hơn bao giờ hết, tự động kết nối các mô hình và API phù hợp, trong khi các tính năng như chú thích cho phép lặp lại nhanh chóng và trực quan. Bạn có thể bắt đầu xây dựng với Gemini 3 trong Google AI Studio ngay hôm nay.

Hiểu biết đa phương thức

Gemini 3 là mô hình tốt nhất trên thế giới về hiểu biết đa phương thức phức tạp và đạt mức cao mới trên MMMU-Pro về suy luận hình ảnh phức tạp và Video MMMU về hiểu biết video. Kết hợp trí thông minh và cửa sổ ngữ cảnh 1 triệu token, các nhà phát triển có thể thấy những cải tiến đáng kể khi xây dựng các trường hợp sử dụng đa phương thức chính. Để cung cấp cho bạn nhiều quyền kiểm soát hơn đối với độ trễ và chi phí, giờ đây bạn có thể cấu hình xử lý hình ảnh đa phương thức với độ chi tiết cao hơn trong API Gemini dựa trên độ trung thực trực quan cần thiết cho ứng dụng của bạn.

Suy luận hình ảnh

Gemini 3 Pro là mô hình tốt nhất trong phân khúc về hiểu tài liệu, vượt ra ngoài OCR (Nhận dạng ký tự quang học) đơn giản để xử lý thông minh việc hiểu và suy luận tài liệu phức tạp.

Bạn có thể thấy khả năng hiểu hình ảnh, suy luận và lập trình của mô hình trong ứng dụng demo của chúng tôi, mang mọi ý tưởng vào cuộc sống trong Google AI Studio.

Video demo của một ứng dụng web trong Google AI Studio hiển thị nhiều hình ảnh được tải lên và biến thành trải nghiệm web tương tác với AI.

Suy luận không gian

Khả năng hiểu không gian được cải thiện của mô hình cũng thúc đẩy hiệu suất mạnh mẽ trong các tác vụ suy luận hiện thân như chỉ định, dự đoán quỹ đạo và tiến trình tác vụ, mở ra các trường hợp sử dụng mới trên xe tự hành, thiết bị XR và robot.

Khả năng suy luận không gian của nó cũng cung cấp khả năng hiểu màn hình thông minh của các màn hình máy tính, di động và hệ điều hành, mang lại hiệu suất cải thiện đáng kể cho các tác tử sử dụng máy tính. Mô hình cũng hiểu ý định của các hành động của người dùng dựa trên chuyển động chuột và chú thích màn hình, mở ra những trải nghiệm mới lạ như ứng dụng demo Visual Computer này.

Video demo hiển thị một màn hình nơi người dùng vẽ các nét gạch lên các tệp và kích hoạt AI để xóa các tệp đó.

Trong quy trình suy luận và gọi công cụ tác tử video của chúng tôi, Gemini 3 mang lại hiệu quả trên ba mặt trận quan trọng cho Agent Opus: tốc độ, mang lại sự gia tăng hơn 32% về tốc độ so với triển khai hiện tại của chúng tôi; độ chính xác, được chứng minh bằng khả năng xuất sắc trong việc tuân theo các hướng dẫn phức tạp và thực hiện giải mã có cấu trúc một cách chính xác; và độ tin cậy, quản lý suy luận ngữ cảnh dài và gọi các công cụ chi tiết mà không gặp phải những cạm bẫy phổ biến của ảo giác.

- Jay Wu, Đồng sáng lập và CTO, OpusClip

Suy luận video

Gemini 3 Pro nắm bắt hành động nhanh chóng với khả năng hiểu tốc độ khung hình cao, đảm bảo các nhà phát triển không bao giờ bỏ lỡ khoảnh khắc quan trọng trong các cảnh chuyển động nhanh. Ngoài tốc độ, khả năng ghi nhớ ngữ cảnh dài cho phép tổng hợp các câu chuyện và xác định các chi tiết cụ thể qua nhiều giờ cảnh quay liên tục.

Xây dựng những gì tiếp theo, ngay hôm nay

Gemini 3 Pro hiện đã được tích hợp vào nhiều sản phẩm và công cụ dành cho nhà phát triển để tích hợp liền mạch vào quy trình làm việc hiện có của bạn và mở ra những cách thức lập trình hoàn toàn mới.

Xây dựng với API Gemini: Bạn có thể tích hợp Gemini 3 Pro ngay lập tức vào các ứng dụng của mình thông qua Google AI Studio và Vertex AI cho Doanh nghiệp. Để hỗ trợ các khả năng suy luận sâu hơn của mô hình, chúng tôi đang giới thiệu cấp độ suy nghĩ mới và các tham số độ phân giải phương tiện chi tiết hơn trong API, cùng với xác thực nghiêm ngặt hơn cho chữ ký suy nghĩ. Bản cập nhật này rất quan trọng để bảo toàn suy nghĩ của mô hình trong các cuộc hội thoại nhiều lượt. Hãy xem Hướng dẫn dành cho nhà phát triển để biết chi tiết kỹ thuật và Hướng dẫn nhắc của chúng tôi để tìm hiểu cách xây dựng với Gemini 3 Pro.
Trải nghiệm khả năng tác tử của mô hình: Cho dù bạn đang thêm các tính năng gốc AI vào ứng dụng Android, tự động hóa quy trình làm việc thông qua Gemini CLI hay quản lý một nhóm các tác tử tự động trong Google Antigravity, Gemini 3 Pro cung cấp độ tin cậy cần thiết cho các kiến trúc phức tạp, tác tử.
Lập trình theo vibe với Gemini 3 Pro: Google AI Studio là con đường nhanh nhất để hiện thực hóa mọi ý tưởng. Bắt đầu trong Chế độ Build để tạo một ứng dụng hoàn chỉnh chỉ bằng một lệnh nhắc. Và nếu bạn cần một chút cảm hứng, hãy nhấp vào “Tôi cảm thấy may mắn” và để Gemini 3 Pro xử lý tia lửa sáng tạo và triển khai mã đồng thời.

Cảnh quan phần mềm đang thay đổi. Khi AI thay đổi ai xây dựng và cách thức họ xây dựng, chúng tôi cam kết đáp ứng bạn ở nơi bạn đang ở — cung cấp cho bạn các công cụ để vượt qua mọi giới hạn về những gì có thể.

Đây chỉ là sự khởi đầu của kỷ nguyên Gemini 3 nhưng chúng tôi nóng lòng muốn xem những gì bạn sẽ xây dựng với Gemini 3 Pro!

ĐƯỢC ĐĂNG TẢI TRONG:

Developers
Gemini Models

Câu chuyện liên quan

Google Search với Gemini 3: Tìm kiếm thông minh nhất của chúng tôi từ trước đến nay

Gemini 3 Pro mang lại khả năng suy luận và truy xuất thông tin mạnh mẽ vào Google Search, giúp bạn tìm thấy những gì bạn đang tìm kiếm nhanh hơn và hiệu quả hơn.

Một kỷ nguyên mới của trí tuệ với Gemini 3

Google giới thiệu Gemini 3 Pro, mô hình thông minh nhất của chúng tôi, mang lại khả năng suy luận và lập trình vượt trội.

Giới thiệu Công cụ Tìm kiếm Tệp trong API Gemini

Công cụ Tìm kiếm Tệp mới trong API Gemini cho phép các nhà phát triển tích hợp khả năng tìm kiếm tệp vào các ứng dụng của họ.

Tạo thẻ flashcard và câu đố trong ứng dụng NotebookLM.

Chúng tôi đang triển khai một bản cập nhật lớn cho ứng dụng NotebookLM trong tuần này.

Cải thiện Đầu ra có cấu trúc trong API Gemini

API Gemini giờ đây cung cấp khả năng đầu ra có cấu trúc tốt hơn, giúp các nhà phát triển dễ dàng hơn trong việc sử dụng API.

Tin tức AI mới nhất chúng tôi đã công bố vào tháng 10

Google đã công bố nhiều cập nhật AI mới trong tháng 10, bao gồm Gemini 3 Pro, công cụ tìm kiếm tệp và nhiều hơn nữa.

Theo dõi chúng tôi Instagram | Twitter | YouTube | Facebook | LinkedIn

AI Today - SkyAI