Gemini 2.5- Các mô hình thông minh nhất của chúng tôi đang ngày càng trở nên tốt hơn

Gemini 2.5 Pro tiếp tục được các nhà phát triển yêu thích với tư cách là mô hình tốt nhất để viết mã và 2.5 Flash thậm chí còn tốt hơn với bản cập nhật mới. Chúng tôi đang mang đến những khả năng mới cho các mô hình của mình, bao gồm...

May 21, 2025
9 min read

Gemini 2.5- Các mô hình thông minh nhất của chúng tôi đang ngày càng trở nên tốt hơn — Gemini 2.5 Pro tiếp tục được các nhà phát triển yêu thích với tư cách là mô hình tốt nhất để viết mã và 2.5 Flash thậm chí còn tốt hơn với bản cập nhật mới. Chúng tôi đang mang đến những khả năng mới cho các mô hình của mình, bao gồm...

Google I/O 2025: Cập nhật về Gemini 2.5 từ Google DeepMind

Tại I/O 2025, chúng tôi đã chia sẻ những cập nhật mới nhất về dòng mô hình Gemini 2.5 và Deep Think, một chế độ suy luận nâng cao thử nghiệm cho 2.5 Pro.

[Hình ảnh: Hình ảnh trừu tượng về hai đường lượn sóng màu xanh lam tươi sáng trên nền đen]

Gemini 2.5 Pro tiếp tục được các nhà phát triển yêu thích như là mô hình tốt nhất để viết code, và 2.5 Flash ngày càng trở nên tốt hơn với một bản cập nhật mới. Chúng tôi cũng mang đến những khả năng mới cho các mô hình của mình, bao gồm Deep Think, một chế độ lý luận nâng cao thử nghiệm cho 2.5 Pro.

2.5 Pro hoạt động tốt hơn bao giờ hết

Gần đây, chúng tôi đã cập nhật 2.5 Pro để giúp các nhà phát triển xây dựng các ứng dụng web tương tác, phong phú hơn. Thật tuyệt vời khi thấy phản ứng tích cực từ người dùng và nhà phát triển và chúng tôi tiếp tục thực hiện các cải tiến dựa trên phản hồi của người dùng.

Ngoài hiệu suất mạnh mẽ trên các chuẩn mực học thuật, 2.5 Pro mới hiện đang dẫn đầu bảng xếp hạng mã hóa phổ biến, WebDev Arena, với điểm ELO là 1415. Nó cũng dẫn đầu trên tất cả các bảng xếp hạng của LMArena, nơi đánh giá sở thích của con người về nhiều khía cạnh. Và, với cửa sổ ngữ cảnh 1 triệu token, 2.5 Pro có khả năng hiểu video và ngữ cảnh dài hiện đại nhất.

Kể từ khi kết hợp LearnLM, dòng mô hình được xây dựng với các chuyên gia giáo dục của chúng tôi, 2.5 Pro hiện cũng là mô hình hàng đầu để học tập. Trong các so sánh trực tiếp đánh giá tính sư phạm và hiệu quả của nó, các nhà giáo dục và chuyên gia thích Gemini 2.5 Pro hơn các mô hình khác trên một loạt các kịch bản đa dạng. Và, nó vượt trội hơn các mô hình hàng đầu trên mọi năm nguyên tắc khoa học học tập được sử dụng để xây dựng các hệ thống AI để học tập.

Tìm hiểu thêm trong thẻ mô hình Gemini 2.5 Pro được cập nhật và trên trang công nghệ Gemini.

Deep Think

Thông qua việc khám phá các giới hạn về khả năng tư duy của Gemini, chúng tôi đang bắt đầu thử nghiệm một chế độ lý luận nâng cao được gọi là Deep Think sử dụng các kỹ thuật nghiên cứu mới cho phép mô hình xem xét nhiều giả thuyết trước khi trả lời.

2.5 Pro Deep Think đạt được điểm số ấn tượng trên USAMO 2025, hiện là một trong những chuẩn mực toán học khó nhất. Nó cũng dẫn đầu trên LiveCodeBench, một chuẩn mực khó khăn cho việc viết mã cấp cạnh tranh, và đạt được 84,0% trên MMMU, kiểm tra lý luận đa phương thức.

[Hình ảnh: Biểu đồ so sánh khả năng nâng cao của Gemini 2.5 Pro Deep Think]

Bởi vì chúng tôi đang xác định giới hạn với 2.5 Pro DeepThink, chúng tôi sẽ dành thêm thời gian để tiến hành đánh giá an toàn nâng cao và thu thập thêm ý kiến đóng góp từ các chuyên gia an toàn. Là một phần của việc đó, chúng tôi sẽ cung cấp nó cho những người thử nghiệm đáng tin cậy thông qua Gemini API để nhận phản hồi của họ trước khi cung cấp rộng rãi.

2.5 Cải tiến Flash

2.5 Flash là mô hình “ngựa thồ” hiệu quả nhất của chúng tôi được thiết kế để có tốc độ và chi phí thấp — và giờ đây nó đã tốt hơn trên nhiều khía cạnh. Nó đã được cải thiện trên các chuẩn mực chính cho lý luận, tính đa phương thức, mã và ngữ cảnh dài đồng thời trở nên hiệu quả hơn, sử dụng ít hơn 20-30% token trong các đánh giá của chúng tôi.

[Hình ảnh: Biểu đồ so sánh Gemini 2.5 Flash với các mô hình khác]

2.5 Flash mới hiện có sẵn để xem trước trong Google AI Studio cho nhà phát triển, trong Vertex AI cho doanh nghiệp và trong ứng dụng Gemini cho mọi người. Và vào đầu tháng 6, nó sẽ được cung cấp rộng rãi cho sản xuất.

Tìm hiểu thêm trong thẻ mô hình Gemini 2.5 Flash được cập nhật và trên trang công nghệ Gemini.

Các tính năng mới của Gemini 2.5

Đầu ra âm thanh gốc và cải tiến cho Live API

Hôm nay, Live API đang giới thiệu phiên bản xem trước của đầu vào nghe nhìn và đối thoại xuất âm thanh gốc, để bạn có thể trực tiếp xây dựng các trải nghiệm đàm thoại, với Gemini tự nhiên và biểu cảm hơn.

Nó cũng cho phép người dùng điều chỉnh giọng điệu, ngữ điệu và phong cách nói. Ví dụ: bạn có thể yêu cầu mô hình sử dụng giọng điệu kịch tính khi kể chuyện. Và nó hỗ trợ sử dụng công cụ, để có thể tìm kiếm thay mặt bạn.

Bạn có thể thử nghiệm một bộ tính năng ban đầu, bao gồm:

Đối thoại cảm xúc, trong đó mô hình phát hiện cảm xúc trong giọng nói của người dùng và phản hồi phù hợp.
Âm thanh chủ động, trong đó mô hình sẽ bỏ qua các cuộc trò chuyện nền và biết khi nào cần phản hồi.
Tư duy trong Live API, trong đó mô hình tận dụng các khả năng tư duy của Gemini để hỗ trợ các tác vụ phức tạp hơn.

Chúng tôi cũng đang phát hành bản xem trước mới cho chuyển văn bản thành giọng nói trong 2.5 Pro và 2.5 Flash. Chúng có hỗ trợ đầu tiên thuộc loại này cho nhiều diễn giả, cho phép chuyển văn bản thành giọng nói với hai giọng thông qua đầu ra âm thanh gốc.

Giống như Đối thoại âm thanh gốc, chuyển văn bản thành giọng nói có tính biểu cảm và có thể nắm bắt những sắc thái thực sự tinh tế, chẳng hạn như tiếng thì thầm. Nó hoạt động trên hơn 24 ngôn ngữ và chuyển đổi liền mạch giữa chúng.

[Video: Ví dụ về đầu ra âm thanh gốc]

Khả năng chuyển văn bản thành giọng nói này sẽ có sẵn vào cuối ngày hôm nay trong Gemini API.

Sử dụng máy tính

Chúng tôi đang đưa khả năng sử dụng máy tính của Dự án Mariner vào Gemini API và Vertex AI. Các công ty như Automation Anywhere, UiPath, Browserbase, Autotab, The Interaction Company và Cartwheel đang khám phá tiềm năng của nó và chúng tôi rất vui mừng được triển khai nó rộng rãi hơn để các nhà phát triển thử nghiệm vào mùa hè này.

Bảo mật tốt hơn

Chúng tôi cũng đã tăng cường đáng kể các biện pháp bảo vệ chống lại các mối đe dọa bảo mật, như tấn công tiêm prompt gián tiếp. Đây là khi các hướng dẫn độc hại được nhúng vào dữ liệu mà một mô hình AI truy xuất. Cách tiếp cận bảo mật mới của chúng tôi đã giúp tăng đáng kể tỷ lệ bảo vệ của Gemini chống lại các cuộc tấn công tiêm prompt gián tiếp trong quá trình sử dụng công cụ, khiến Gemini 2.5 trở thành dòng mô hình an toàn nhất của chúng tôi cho đến nay.

Đọc thêm về công việc của chúng tôi trên khắp các lĩnh vực an toàn, trách nhiệm và bảo mật và cách chúng tôi đang nâng cao các biện pháp bảo vệ an ninh của Gemini trên blog Google DeepMind.

Trải nghiệm nhà phát triển nâng cao

Tóm tắt suy nghĩ

2.5 Pro và Flash giờ đây sẽ bao gồm các bản tóm tắt suy nghĩ trong Gemini API và trong Vertex AI. Tóm tắt suy nghĩ lấy những suy nghĩ thô sơ của mô hình và sắp xếp chúng thành một định dạng rõ ràng với tiêu đề, chi tiết chính và thông tin về các hành động của mô hình, chẳng hạn như khi chúng sử dụng công cụ.

Chúng tôi hy vọng rằng với định dạng hợp lý, có cấu trúc hơn về quá trình suy nghĩ của mô hình, các nhà phát triển và người dùng sẽ thấy các tương tác với các mô hình Gemini dễ hiểu và gỡ lỗi hơn.

Ngân sách tư duy

Chúng tôi đã ra mắt 2.5 Flash với ngân sách tư duy để cung cấp cho các nhà phát triển nhiều quyền kiểm soát hơn đối với chi phí bằng cách cân bằng độ trễ và chất lượng. Và chúng tôi đang mở rộng khả năng này sang 2.5 Pro. Điều này cho phép bạn kiểm soát số lượng mã thông báo mà một mô hình sử dụng để suy nghĩ trước khi nó phản hồi hoặc thậm chí tắt khả năng tư duy của nó.

Gemini 2.5 Pro với ngân sách sẽ có sẵn rộng rãi để sử dụng sản xuất ổn định trong những tuần tới, cùng với mô hình có sẵn rộng rãi của chúng tôi.

Hỗ trợ MCP

Chúng tôi đã thêm hỗ trợ SDK gốc cho các định nghĩa Giao thức ngữ cảnh mô hình (MCP) trong Gemini API để dễ dàng tích hợp với các công cụ nguồn mở hơn. Chúng tôi cũng đang khám phá các cách để triển khai máy chủ MCP và các công cụ được lưu trữ khác, giúp bạn dễ dàng xây dựng các ứng dụng đại diện.

Chúng tôi luôn đổi mới các phương pháp mới để cải thiện mô hình và trải nghiệm nhà phát triển của chúng tôi, bao gồm làm cho chúng hiệu quả và hoạt động tốt hơn, đồng thời tiếp tục phản hồi phản hồi của nhà phát triển, vì vậy vui lòng tiếp tục gửi phản hồi! Chúng tôi cũng tiếp tục tăng gấp đôi về bề rộng và chiều sâu của nghiên cứu cơ bản của chúng tôi — thúc đẩy các giới hạn về khả năng của Gemini. Sẽ có thêm thông tin sớm thôi.

Tìm hiểu thêm về Gemini và khả năng của nó trên trang web của chúng tôi.

[Liên kết: Bài viết liên quan về I/O 2025]

[Biểu mẫu đăng ký nhận bản tin]

AI Today - SkyAI