Google phát hành công khai Gemini 2.5 'Deep Think' AI, người chiến thắng huy chương Olympiad - nhưng có một điều kiện...
Google phát hành công khai Gemini 2.5 'Deep Think' AI, người chiến thắng huy chương Olympiad - nhưng có một điều kiện...
- 9 min read
Google Phát Hành Công Khai Gemini 2.5 ‘Deep Think’ AI Đạt Huy Chương Olympic - Nhưng Có Một Vấn Đề…
Google đã chính thức ra mắt Gemini 2.5 Deep Think, một biến thể mới của mô hình AI được thiết kế để suy luận sâu hơn và giải quyết vấn đề phức tạp, đã gây xôn xao dư luận tháng trước khi giành huy chương vàng tại Olympic Toán học Quốc tế (IMO) - lần đầu tiên một mô hình AI đạt được kỳ tích này.
Tuy nhiên, điều đáng tiếc là đây không phải là mô hình đã giành huy chương vàng giống hệt nhau. Theo bài đăng trên blog của Google và Logan Kilpatrick, Trưởng nhóm Sản phẩm của Google AI Studio, thực tế đây là phiên bản “đồng” kém mạnh mẽ hơn.
Như Kilpatrick đã đăng trên mạng xã hội X: “Đây là một biến thể của mô hình vàng IMO của chúng tôi, nhanh hơn và được tối ưu hóa hơn cho việc sử dụng hàng ngày. Chúng tôi cũng đang cung cấp mô hình vàng IMO đầy đủ cho một nhóm các nhà toán học để kiểm tra giá trị của các khả năng đầy đủ."
Hiện đã có trên ứng dụng di động Gemini, mô hình đồng này có thể truy cập được cho những người đăng ký gói AI cá nhân đắt nhất của Google, AI Ultra, có giá $249,99 mỗi tháng với chương trình khuyến mãi bắt đầu 3 tháng với mức giá giảm $124,99/tháng cho người đăng ký mới.
Google cũng cho biết trong bài đăng trên blog phát hành của mình rằng họ sẽ mang Deep Think có và không có tích hợp sử dụng công cụ cho “những người thử nghiệm đáng tin cậy” thông qua giao diện lập trình ứng dụng (API) của Gemini “trong những tuần tới”.
Tại sao ‘Deep Think’ lại mạnh mẽ đến vậy
Gemini 2.5 Deep Think xây dựng trên họ mô hình ngôn ngữ lớn (LLM) Gemini, bổ sung các khả năng mới nhằm mục đích suy luận thông qua các vấn đề phức tạp.
Nó sử dụng các kỹ thuật “tư duy song song” để khám phá nhiều ý tưởng đồng thời và bao gồm học tăng cường để tăng cường khả năng giải quyết vấn đề từng bước theo thời gian.
Mô hình này được thiết kế để sử dụng trong các trường hợp được hưởng lợi từ sự cân nhắc mở rộng, chẳng hạn như kiểm tra phỏng đoán toán học, nghiên cứu khoa học, thiết kế thuật toán và các nhiệm vụ lặp đi lặp lại sáng tạo như tinh chỉnh mã và thiết kế.
Những người thử nghiệm sớm, bao gồm các nhà toán học như Michel van Garrel, đã sử dụng nó để thăm dò các vấn đề chưa được giải quyết và tạo ra các bằng chứng tiềm năng.
Ethan Mollick, một người dùng và chuyên gia AI quyền lực, một giáo sư tại Trường Kinh doanh Wharton thuộc Đại học Pennsylvania, cũng đã đăng trên X rằng nó có thể lấy một lời nhắc mà anh thường sử dụng để kiểm tra khả năng của các mô hình mới — “tạo ra thứ gì đó tôi có thể dán vào p5js sẽ khiến tôi giật mình vì sự thông minh của nó trong việc tạo ra thứ gợi lên bảng điều khiển của một con tàu vũ trụ ở một tương lai xa xôi” — và biến nó thành một đồ họa 3D, đây là lần đầu tiên bất kỳ mô hình nào làm được điều đó.
Điểm chuẩn hiệu suất và các trường hợp sử dụng
Google nêu bật một số lĩnh vực ứng dụng chính cho Deep Think:
-
Toán học và khoa học: Mô hình có thể mô phỏng suy luận cho các bằng chứng phức tạp, khám phá các phỏng đoán và giải thích tài liệu khoa học dày đặc
-
Thiết kế mã hóa và thuật toán: Nó hoạt động tốt trên các tác vụ liên quan đến sự đánh đổi hiệu suất, độ phức tạp về thời gian và logic đa bước
-
Phát triển sáng tạo: Trong các tình huống thiết kế như nghệ thuật voxel hoặc xây dựng giao diện người dùng, Deep Think thể hiện sự cải thiện lặp đi lặp lại mạnh mẽ hơn và nâng cao chi tiết
Mô hình này cũng dẫn đầu hiệu suất trong các đánh giá điểm chuẩn như LiveCodeBench V6 (về khả năng mã hóa) và Humanity’s Last Exam (bao gồm toán học, khoa học và suy luận).
Nó vượt trội hơn Gemini 2.5 Pro và các mô hình cạnh tranh như GPT-4 của OpenAI và Grok 4 của xAI với tỷ lệ hai con số trên một số danh mục (Suy luận & Kiến thức, Tạo mã và Toán học IMO 2025).
Gemini 2.5 Deep Think so với Gemini 2.5 Pro
Mặc dù cả Deep Think và Gemini 2.5 Pro đều là một phần của họ mô hình Gemini 2.5, Google định vị Deep Think là một biến thể có khả năng và kỹ năng phân tích cao hơn, đặc biệt khi nói đến suy luận phức tạp và giải quyết vấn đề đa bước.
Sự cải thiện này xuất phát từ việc sử dụng tư duy song song và các kỹ thuật học tăng cường, cho phép mô hình mô phỏng sự cân nhắc nhận thức sâu sắc hơn.
Trong thông báo chính thức của mình, Google mô tả Deep Think là tốt hơn trong việc xử lý các lời nhắc sắc thái, khám phá nhiều giả thuyết và tạo ra các đầu ra tinh tế hơn. Điều này được hỗ trợ bởi các so sánh song song trong quá trình tạo nghệ thuật voxel, trong đó Deep Think thêm nhiều kết cấu, độ trung thực cấu trúc và sự đa dạng về bố cục hơn 2.5 Pro.
Những cải tiến không chỉ mang tính trực quan hoặc giai thoại. Google báo cáo rằng Deep Think vượt trội hơn Gemini 2.5 Pro trên nhiều điểm chuẩn kỹ thuật liên quan đến suy luận, tạo mã và chuyên môn đa miền. Tuy nhiên, những lợi ích này đi kèm với sự đánh đổi về khả năng đáp ứng và chấp nhận lời nhắc.
Đây là bản tóm tắt:
Google lưu ý rằng tỷ lệ từ chối cao hơn của Deep Think là một lĩnh vực đang được tích cực điều tra. Điều này có thể hạn chế tính linh hoạt của nó trong việc xử lý các truy vấn mơ hồ hoặc không chính thức so với 2.5 Pro. Ngược lại, 2.5 Pro vẫn phù hợp hơn cho những người dùng ưu tiên tốc độ và khả năng phản hồi, đặc biệt đối với các tác vụ nhẹ hơn, đa năng.
Sự khác biệt này cho phép người dùng lựa chọn dựa trên các ưu tiên của họ: 2.5 Pro cho tốc độ và tính lưu động, hoặc Deep Think cho sự chặt chẽ và phản ánh.
Không phải là mô hình đoạt huy chương vàng, chỉ là huy chương đồng
Vào tháng 7, Google DeepMind đã gây xôn xao dư luận khi một phiên bản nâng cao hơn của mô hình Gemini Deep Think đạt được trạng thái huy chương vàng chính thức tại IMO 2025 — cuộc thi toán học danh giá nhất thế giới dành cho học sinh trung học.
Hệ thống đã giải quyết năm trong số sáu vấn đề đầy thách thức và trở thành AI đầu tiên nhận được điểm vàng từ IMO.
Demis Hassabis, Giám đốc điều hành của Google DeepMind, đã công bố thành tích này trên X, nói rằng mô hình đã giải quyết các vấn đề từ đầu đến cuối bằng ngôn ngữ tự nhiên — mà không cần dịch sang cú pháp lập trình chính thức.
Hội đồng IMO xác nhận mô hình đã đạt 35 trên tổng số 42 điểm có thể, cao hơn nhiều so với ngưỡng vàng. Các giải pháp của Gemini 2.5 Deep Think được chủ tịch cuộc thi Gregor Dolinar mô tả là rõ ràng, chính xác và trong nhiều trường hợp, dễ theo dõi hơn so với các đối thủ là con người.
Tuy nhiên, Gemini 2.5 Deep Think được phát hành cho người dùng không phải là mô hình cạnh tranh tương tự, mà là một phiên bản có hiệu suất thấp hơn nhưng rõ ràng là nhanh hơn.
Cách truy cập Deep Think ngay bây giờ
Gemini 2.5 Deep Think hiện chỉ có trên ứng dụng di động Google Gemini dành cho iOS và Android cho người dùng trên gói Google AI Ultra, một phần của dòng đăng ký Google One, với giá như sau.
-
Ưu đãi khuyến mãi: $124,99/tháng trong 3 tháng, sau đó tăng lên…
-
Giá tiêu chuẩn: $249,99/tháng
-
Các tính năng đi kèm: 30 TB dung lượng lưu trữ, quyền truy cập vào ứng dụng Gemini với Deep Think và Veo 3, cũng như các công cụ như Flow, Whisk và 12.500 tín dụng AI hàng tháng
Người đăng ký có thể kích hoạt Deep Think trong ứng dụng Gemini bằng cách chọn mô hình 2.5 Pro và bật tùy chọn “Deep Think”.
Nó hỗ trợ một số lượng lời nhắc cố định mỗi ngày và được tích hợp với các khả năng như thực thi mã và Tìm kiếm của Google. Mô hình này cũng tạo ra các đầu ra dài hơn và chi tiết hơn so với các phiên bản tiêu chuẩn.
Gói Google AI Pro cấp thấp hơn, có giá $19,99/tháng (với bản dùng thử miễn phí), không bao gồm quyền truy cập vào Deep Think, cũng như dịch vụ Gemini AI miễn phí.
Tại sao nó lại quan trọng đối với những người ra quyết định kỹ thuật của doanh nghiệp
Gemini 2.5 Deep Think đại diện cho ứng dụng thực tế của một cột mốc nghiên cứu lớn.
Nó cho phép các doanh nghiệp và tổ chức khai thác một mô hình đoạt huy chương Olympic Toán học và để nó tham gia vào đội ngũ nhân viên của họ, mặc dù hiện tại chỉ thông qua một tài khoản người dùng cá nhân.
Đối với các nhà nghiên cứu nhận được mô hình cấp IMO đầy đủ, nó mang đến một cái nhìn thoáng qua về tương lai của AI hợp tác trong toán học. Đối với người đăng ký Ultra, Deep Think cung cấp một bước tiến mạnh mẽ hướng tới hỗ trợ AI có khả năng và nhận biết ngữ cảnh hơn, hiện đang chạy trong lòng bàn tay của họ.
Link bài viết gốc
- Tags:
- Ai
- 02 August 2025
- Venturebeat.com