Thử Deep Think trong ứng dụng Gemini

Mô hình

  • 7 min read
Thử Deep Think trong ứng dụng Gemini
Mô hình

Gemini 2.5: Deep Think hiện đã ra mắt

Ngày hôm nay, chúng tôi đã cho ra mắt tính năng Deep Think trong ứng dụng Gemini dành cho những người đăng ký Google AI Ultra. Đây là công cụ mới nhất trong chuỗi các công cụ và tính năng AI mạnh mẽ dành riêng cho họ.

Phiên bản mới này tích hợp phản hồi từ những người dùng thử nghiệm ban đầu và những đột phá trong nghiên cứu. So với phiên bản Gemini 2.5 Deep Think được công bố tại sự kiện I/O, phiên bản hiện tại đã có những cải thiện đáng kể về các chỉ số đánh giá chính và phản hồi từ người dùng thử nghiệm. Đây là một phiên bản của mô hình đã đạt được tiêu chuẩn huy chương vàng tại Olympic Toán học Quốc tế (IMO) năm nay. Mặc dù mô hình đó cần hàng giờ để suy luận về các bài toán toán học phức tạp, phiên bản phát hành hôm nay nhanh hơn và hữu dụng hơn trong sử dụng hàng ngày, đồng thời vẫn đạt được hiệu suất ở mức Huy chương Đồng trên bộ tiêu chí đánh giá IMO năm 2025, dựa trên đánh giá nội bộ.

Deep Think có thể là một công cụ mạnh mẽ trong việc giải quyết vấn đề một cách sáng tạo:

Khi chúng tôi đưa Deep Think vào tay những người đăng ký Google AI Ultra, chúng tôi cũng chia sẻ phiên bản chính thức của mô hình Gemini 2.5 Deep Think đã đạt tiêu chuẩn huy chương vàng với một nhóm nhỏ các nhà toán học và học giả. Chúng tôi mong muốn nhận được phản hồi của họ về cách công cụ này có thể nâng cao nghiên cứu và khám phá của họ, đồng thời chúng tôi sẽ sử dụng phản hồi đó để tiếp tục cải thiện sản phẩm này.

Bản phát hành này đại diện cho một bước tiến quan trọng trong sứ mệnh xây dựng AI hữu ích và có năng lực hơn, đồng thời thúc đẩy cam kết của chúng tôi trong việc sử dụng Gemini để đẩy mạnh kiến thức của con người.

Deep Think hoạt động như thế nào: Mở rộng “thời gian suy nghĩ” song song của Gemini

Giống như cách con người giải quyết các vấn đề phức tạp bằng cách dành thời gian khám phá các khía cạnh khác nhau, cân nhắc các giải pháp tiềm năng và tinh chỉnh câu trả lời cuối cùng, Deep Think đã đẩy mạnh khả năng suy nghĩ bằng cách sử dụng các kỹ thuật tư duy song song. Cách tiếp cận này cho phép Gemini tạo ra nhiều ý tưởng cùng một lúc và xem xét chúng đồng thời, thậm chí xem xét hoặc kết hợp các ý tưởng khác nhau theo thời gian, trước khi đưa ra câu trả lời tốt nhất.

Hơn nữa, bằng cách kéo dài thời gian suy luận hoặc “thời gian suy nghĩ”, chúng tôi cung cấp cho Gemini nhiều thời gian hơn để khám phá các giả thuyết khác nhau và đưa ra các giải pháp sáng tạo cho các vấn đề phức tạp.

Chúng tôi cũng đã phát triển các kỹ thuật học tăng cường (reinforcement learning) mới để khuyến khích mô hình tận dụng các đường suy luận kéo dài này, do đó giúp Deep Think trở thành một công cụ giải quyết vấn đề tốt hơn, trực quan hơn theo thời gian.

Deep Think hoạt động ra sao: Hiệu suất tiên tiến

Deep Think có thể giúp mọi người giải quyết các vấn đề đòi hỏi sự sáng tạo, lập kế hoạch chiến lược và cải tiến từng bước, chẳng hạn như:

  • Phát triển và thiết kế lặp đi lặp lại: Chúng tôi đã ấn tượng với hiệu suất của Deep Think trong các tác vụ đòi hỏi phải xây dựng thứ gì đó phức tạp, từng bước một. Ví dụ, chúng tôi nhận thấy Deep Think có thể cải thiện cả tính thẩm mỹ và chức năng của các tác vụ phát triển web.
  • Khám phá khoa học và toán học: Vì nó có thể suy luận qua các vấn đề cực kỳ phức tạp, Deep Think có thể là một công cụ mạnh mẽ cho các nhà nghiên cứu. Nó có thể giúp hình thành và khám phá các giả thuyết toán học hoặc suy luận qua các tài liệu khoa học phức tạp, có khả năng đẩy nhanh con đường dẫn đến khám phá.
  • Phát triển thuật toán và mã: Deep Think đặc biệt xuất sắc trong các bài toán mã hóa khó, nơi việc hình thành vấn đề và xem xét cẩn thận các yếu tố cân bằng và độ phức tạp về thời gian là điều tối quan trọng.

Hiệu suất của Deep Think cũng được phản ánh trong các bộ tiêu chí đầy thách thức đo lường khả năng mã hóa, khoa học, kiến thức và suy luận. Ví dụ, so với các mô hình khác không sử dụng công cụ, Gemini 2.5 Deep Think đạt hiệu suất tiên tiến trên LiveCodeBench V6, đo lường hiệu suất mã cạnh tranh và Humanity’s Last Exam, một bộ tiêu chí đầy thách thức đo lường chuyên môn trong các lĩnh vực khác nhau, bao gồm khoa học và toán học.

Cách chúng tôi đang phát triển Gemini một cách có trách nhiệm

Chúng tôi tiếp tục tích hợp tính năng an toàn và trách nhiệm vào Gemini trong suốt vòng đời đào tạo và triển khai. Trong quá trình thử nghiệm, Gemini 2.5 Deep Think cho thấy sự cải thiện về an toàn nội dung và tính khách quan của giọng điệu so với Gemini 2.5 Pro, nhưng có xu hướng từ chối các yêu cầu vô hại cao hơn một chút.

Khi khả năng giải quyết vấn đề của Gemini tiến bộ, chúng tôi đang xem xét sâu hơn các rủi ro đi kèm với sự phức tạp gia tăng, bao gồm các đánh giá an toàn tiên tiến của chúng tôi và việc triển khai các biện pháp giảm thiểu đã lên kế hoạch cho các cấp độ năng lực quan trọng.

Thông tin chi tiết hơn về kết quả an toàn của Gemini 2.5 Deep Think có sẵn trong thẻ mô hình.

Cách sử dụng Deep Think trong ứng dụng Gemini ngay hôm nay

Nếu bạn là người đăng ký Google AI Ultra, bạn có thể sử dụng Deep Think trong ứng dụng Gemini ngay hôm nay với một số lượng câu lệnh cố định mỗi ngày bằng cách bật “Deep Think” trong thanh câu lệnh khi chọn 2.5 Pro trong trình đơn thả xuống của mô hình. Deep Think tự động hoạt động với các công cụ như thực thi mã và Tìm kiếm Google, và có thể tạo ra các phản hồi dài hơn nhiều.

Chúng tôi cũng đang làm việc để phát hành Deep Think có và không có công cụ cho một nhóm người thử nghiệm đáng tin cậy thông qua Gemini API trong những tuần tới, để hiểu rõ hơn về khả năng sử dụng của nó cho các trường hợp sử dụng của nhà phát triển và doanh nghiệp.

Các nhóm ở gần như mọi cấp độ của ngăn xếp, từ nghiên cứu đến triển khai, đã làm việc để làm cho Deep Think nhanh hơn, đáng tin cậy hơn và thân thiện với người dùng cho người dùng ứng dụng Gemini. Chúng tôi rất mong chờ được thấy những gì bạn sẽ xây dựng với nó.


Bài viết liên quan


POSTED IN:

Recommended for You

Chỉnh sửa ảnh trong Gemini vừa được nâng cấp lớn

Chỉnh sửa ảnh trong Gemini vừa được nâng cấp lớn

Mô hình

Suy nghĩ lại về cách chúng ta đo lường trí tuệ AI

Suy nghĩ lại về cách chúng ta đo lường trí tuệ AI

Thảo luận về các phương pháp đo lường trí tuệ nhân tạo