Tăng tốc khám phá Toán học và Khoa học với Gemini Deep Think

Gemini Deep Think được sử dụng để tăng tốc khám phá trong các lĩnh vực toán học và khoa học.

  • 14 min read
Tăng tốc khám phá Toán học và Khoa học với Gemini Deep Think
Gemini Deep Think được sử dụng để tăng tốc khám phá trong các lĩnh vực toán học và khoa học.

Gemini Deep Think: Định hình lại Tương lai của Nghiên cứu Khoa học

Ngày: 11 tháng 2 năm 2026 Thể loại: Nghiên cứu Tác giả: Thang Luong và Vahab Mirrokni

Tăng tốc Khám phá Toán học và Khoa học với Gemini Deep Think

Gemini Deep Think đang đẩy nhanh các khám phá trong toán học, vật lý và khoa học máy tính bằng cách hoạt động như một người bạn đồng hành khoa học mạnh mẽ cho các nhà nghiên cứu.


Nghe bài viết


Vào mùa hè năm 2025, một phiên bản nâng cao của Gemini Deep Think đã đạt được tiêu chuẩn Huy chương Vàng tại Kỳ thi Toán học Quốc tế (IMO) và sau đó, một phiên bản cập nhật đã đạt được kết quả tương tự tại Cuộc thi Lập trình Quốc tế. Những kết quả này cho thấy mô hình có thể suy luận qua một số bài toán toán học và lập trình đầy thách thức nhất dành cho sinh viên. Kể từ đó, Gemini Deep Think đã chuyển sang các quy trình khoa học, kỹ thuật và doanh nghiệp để giải quyết các thách thức phức tạp, mở hơn.

Trong tuần qua, các nhóm của chúng tôi đã công bố hai bài báo chi tiết một nỗ lực liên ngành để giải quyết các vấn đề nghiên cứu chuyên nghiệp bằng Gemini Deep Think. Những kết quả này bắt nguồn từ sự hợp tác sâu sắc giữa các nhà toán học, nhà vật lý và nhà khoa học máy tính.

Ranh giới của Toán học Thuần túy

Không giống như các bài toán IMO, toán học ở cấp độ nghiên cứu đòi hỏi các kỹ thuật nâng cao từ tài liệu rộng lớn. Mặc dù các mô hình nền tảng có kho kiến thức lớn, sự khan hiếm dữ liệu thường dẫn đến sự hiểu biết hời hợt và ảo giác trong các chủ đề nâng cao.

Để giải quyết vấn đề này, chúng tôi đã xây dựng một tác nhân nghiên cứu toán học (có tên mã nội bộ là Aletheia), được cung cấp bởi Gemini Deep Think. Nó có một bộ xác minh ngôn ngữ tự nhiên để xác định các lỗi trong các giải pháp ứng viên và cho phép quy trình tạo và sửa đổi giải pháp lặp đi lặp lại. Quan trọng nhất, tác nhân này có thể thừa nhận thất bại trong việc giải quyết một vấn đề, một tính năng quan trọng đã cải thiện hiệu quả cho các nhà nghiên cứu.

Ngoài ra, tác nhân nghiên cứu sử dụng Tìm kiếm của Google và duyệt web để điều hướng nghiên cứu phức tạp, ngăn chặn các trích dẫn sai lệch và các lỗi tính toán khi tổng hợp tài liệu đã xuất bản.

Tổng quan về Aletheia, một tác nhân nghiên cứu toán học được cung cấp bởi Gemini Deep Think, minh họa quy trình xác minh giải pháp đa bước. Một đường dẫn tuyến tính trung tâm di chuyển từ “Vấn đề” đến “Trình tạo”, sau đó là “Giải pháp ứng viên”, rồi đến “Bộ xác minh” và cuối cùng là “Đầu ra cuối cùng”. Bộ xác minh hoạt động như một điểm quyết định với ba vòng phản hồi: Đúng: Di chuyển trực tiếp đến “Đầu ra cuối cùng”. Cần sửa đổi nhỏ: Chuyển trở lại qua “Bộ sửa đổi” để cập nhật “Giải pháp ứng viên”. Lỗi nghiêm trọng: Kích hoạt một đường chấm đỏ trở lại “Trình tạo” để bắt đầu lại quy trình.

Kể từ khi đạt tiêu chuẩn Huy chương Vàng IMO vào tháng 7 năm 2025, Gemini Deep Think đã tiến triển nhanh chóng, đạt điểm cao tới 90% trên bài kiểm tra IMO-ProofBench Advanced khi tính toán thời gian suy luận được mở rộng. Chúng tôi đã chứng minh rằng quy luật mở rộng tiếp tục đúng khi chúng ta tiến xa hơn cấp độ Olympiad sang các bài tập cấp độ Tiến sĩ (theo điểm chuẩn FutureMath Basic nội bộ của chúng tôi). Đáng chú ý, Aletheia đã chứng minh rằng chất lượng suy luận cao hơn có thể đạt được với thời gian suy luận thấp hơn.

Biểu đồ A: IMO-ProofBench Nâng cao (Cấp độ Olympiad) Biểu đồ đường thẳng có tiêu đề “IMO-ProofBench Nâng cao (Cấp độ Olympiad)” so sánh hiệu suất của hai phiên bản Gemini Deep Think với một điểm chuẩn có tên Aletheia. Trục y hiển thị phần trăm Điểm (30% đến 90%), và trục x hiển thị Thời gian Suy luận trên thang đo logarit. Phiên bản tháng 1 năm 2026 (xanh nhạt) liên tục vượt trội hơn phiên bản tháng 7 năm 2025 (xanh đậm), cả hai đều cho thấy xu hướng tăng ổn định khi tính toán tăng lên. Phiên bản tháng 1 năm 2026 đạt đỉnh ở khoảng 90% gần đạt đến điểm chuẩn Aletheia (ngôi sao xanh lục) nằm ngay trên 90%.

Biểu đồ B: FutureMath Basic (Bài tập cấp độ Tiến sĩ) Biểu đồ đường thẳng có tiêu đề “(b) FutureMath Basic (Bài tập cấp độ Tiến sĩ)” vẽ biểu đồ điểm của Gemini Deep Think (tháng 1 năm 2026) so với Thời gian Suy luận tăng lên trên thang đo logarit. Trục y biểu thị Phần trăm Điểm (0% đến 45%). Hiệu suất bắt đầu ở 0% và cho thấy xu hướng tăng biến động, đạt đỉnh sớm ở 30% trước khi dao động và cuối cùng tăng lên mức cao nhất khoảng 38%. Một ngôi sao xanh lục biểu thị “Aletheia” được đánh dấu là điểm chuẩn ở khoảng 46%, cao hơn đáng kể so với hiệu suất cao nhất mà mô hình đạt được.

Đối với toán học cấp độ nghiên cứu, Aletheia đã hỗ trợ nhiều tiến bộ, được tạo ra thông qua các mức độ nghiên cứu tự động khác nhau:

  • Nghiên cứu tự động đáng tin cậy. Một bài báo nghiên cứu (Feng26) được tạo ra bởi AI mà không cần bất kỳ sự can thiệp nào của con người, tính toán các hằng số cấu trúc nhất định trong hình học số học gọi là trọng số riêng.
  • Hợp tác do AI hướng dẫn. Một bài báo nghiên cứu (LeeSeo26) chứng minh sự hợp tác giữa con người và AI trong việc chứng minh các giới hạn về hệ thống các hạt tương tác được gọi là tập độc lập.
  • Đánh giá bán tự động rộng rãi (Feng et al., 2026b) của 700 bài toán mở trên cơ sở dữ liệu Giả thuyết Erdős của Bloom, bao gồm cả giải pháp tự động cho bốn câu hỏi mở được liệt kê ở đó. Đối với Erdős-1051, mô hình của chúng tôi đã tự động giải quyết và đóng góp vào một sự khái quát hóa được báo cáo trong một bài báo nghiên cứu (BKKKZ26).

Tác nhân cũng đã đóng góp các mệnh đề trung gian cho hai bài báo khác (FYZ26 và ACGKMP26). Cũng cần lưu ý rằng đã có các công việc trước đây (v.1.26.01.07222) sử dụng Gemini cho toán học cấp độ nghiên cứu ở quy mô nhỏ hơn về mặt hợp tác và số lượng bài toán được giải quyết.

Sau các cuộc thảo luận sâu rộng với cộng đồng toán học, chúng tôi đề xuất một hệ thống phân loại để phân loại nghiên cứu toán học có sự hỗ trợ của AI theo mức độ quan trọng và mức độ đóng góp của AI – góp phần vào cuộc thảo luận rộng hơn về tài liệu, đánh giá và truyền thông có trách nhiệm về kết quả do AI tạo ra. Các công trình Cấp 2 (“chất lượng có thể xuất bản”) đã được gửi đến các tạp chí uy tín. Hiện tại, chúng tôi không tuyên bố bất kỳ kết quả Cấp 3 (“Tiến bộ Lớn”) và Cấp 4 (“Đột phá Đánh dấu”) nào.

Bảng có tiêu đề “Phân loại tất cả các kết quả toán học có sự hỗ trợ của AI được đề cập trong công trình này” phân loại nghiên cứu theo tính mới và loại hình hợp tác. Cấp 0 (Tự động): Erdős-652, 654, 1040 (Feng et al., 2026b). Cấp 1 (Tự động): Erdős-1051 (Feng et al., 2026b). Cấp 2 (Con người + AI): Giới hạn độ phức tạp (ACGKMP26) và Khối lượng Số học (FYZ26). Cấp 2 (Hợp tác): Đa thức Độc lập (LeeSeo26) và Erdős-1051 Khái quát hóa (BKKKZ26). Cấp 2 (Tự động): Trọng số riêng (Feng26). Các Cấp 3 và 4 hiện đang trống.

Các lời nhắc và đầu ra mô hình có sẵn tại đây. Để thảo luận về đóng góp của AI, Thẻ Tương tác Con người-AI của chúng tôi và Tác động Cộng đồng, hãy xem bài báo của chúng tôi.

Mở rộng sang Vật lý và Khoa học Máy tính

Gemini Deep Think cũng đã thể hiện tiềm năng trong khoa học máy tính và vật lý. Bài báo thứ hai xây dựng dựa trên các ý tưởng tác nhân tương tự, và xác định các “công thức” hiệu quả cho sự hợp tác, đặc biệt là mô hình “Cố vấn”, nơi con người hướng dẫn AI thông qua các chu kỳ “Vibe-Proving” lặp đi lặp lại để xác nhận trực giác và tinh chỉnh các bằng chứng. Chúng tôi cũng trình bày chi tiết các kỹ thuật chiến thuật như “nhắc cân bằng” – yêu cầu chứng minh hoặc bác bỏ đồng thời để ngăn chặn thiên vị xác nhận – và xác minh có hỗ trợ mã. Những phương pháp này, kết hợp với khả năng của mô hình trong việc kết nối các lĩnh vực khoa học khác biệt thông qua các mối quan hệ cấu trúc sâu sắc, đang định hình lại cách nghiên cứu lý thuyết được thực hiện. Công việc này xây dựng dựa trên việc triển khai thành công của chúng tôi về phiên bản nâng cao của Gemini Deep Think để hỗ trợ xem xét các bài báo lý thuyết CS cho hội nghị STOC'26.

Sơ đồ luồng có tiêu đề “Lớp Mạng” minh họa quy trình suy luận sâu. Ở trên cùng, một dấu ngoặc có nhãn “Khám phá rộng rãi không gian giải pháp” dẫn vào một biểu tượng bộ lọc. Điều này dẫn vào phần trung tâm “Suy luận sâu” được biểu thị bằng một loạt các nút và mẫu sóng được kết nối. Quá trình kết thúc bằng một biểu tượng con người chỉ vào “Đầu ra”. Một nhãn cuối cùng ở dưới cùng mô tả quá trình là “Chuỗi dài xác minh tự động + con người”.

Hợp tác với các chuyên gia về 18 vấn đề nghiên cứu, một phiên bản nâng cao của Gemini Deep Think đã giúp giải quyết các điểm nghẽn lâu đời trên các lĩnh vực thuật toán, ML và tối ưu hóa tổ hợp, lý thuyết thông tin và kinh tế. Các điểm nổi bật từ bài báo của chúng tôi “Tăng tốc Nghiên cứu Khoa học với Gemini: Các Trường hợp Nghiên cứu và Kỹ thuật Phổ biến” bao gồm (các phần tương ứng trong bài báo):

  1. Vượt qua ranh giới toán học cho các câu đố mạng: Tiến bộ về các vấn đề khoa học máy tính cổ điển như “Max-Cut” (chia mạng hiệu quả) và “Cây Steiner” (kết nối các điểm chiều cao) đã chậm lại. Gemini đã phá vỡ cả hai điểm tắc nghẽn bằng cách suy nghĩ vượt ra ngoài khuôn khổ. Nó đã giải quyết các câu đố thuật toán rời rạc này bằng cách sử dụng các công cụ nâng cao – như Định lý Kirszbraun, lý thuyết đo lường và định lý Stone-Weierstrass – từ các nhánh toán học liên tục hoàn toàn không liên quan. Xem Các phần 4.1 và 4.2.
  2. Giải quyết một giả thuyết mười năm tuổi trong tối ưu hóa trực tuyến dưới dạng phân số: Một bài báo lý thuyết năm 2015 đã đề xuất một quy tắc có vẻ hiển nhiên cho các luồng dữ liệu: sao chép một mục đến luôn có giá trị thấp hơn việc chỉ di chuyển mục gốc. Các chuyên gia đã phải vật lộn trong một thập kỷ để chứng minh điều này. Gemini đã tạo ra một ví dụ phản bác tổ hợp rất cụ thể gồm ba mục, chứng minh một cách chặt chẽ rằng trực giác lâu đời của con người là sai. Xem Phần 3.1.
  3. Tối ưu hóa học máy: Huấn luyện AI để loại bỏ nhiễu thường yêu cầu các kỹ sư phải điều chỉnh thủ công một “hình phạt” toán học. Các nhà nghiên cứu đã tạo ra một kỹ thuật mới thực hiện điều này một cách tự động, nhưng không thể giải thích về mặt toán học tại sao. Gemini đã phân tích các phương trình và chứng minh rằng phương pháp này thành công bằng cách bí mật tạo ra “hình phạt thích ứng” của riêng nó trong quá trình thực hiện. Xem Phần 8.3.
  4. Nâng cấp lý thuyết kinh tế cho AI: Một “Nguyên tắc Tiết lộ” gần đây để đấu giá các mã thông báo tạo AI chỉ hoạt động về mặt toán học khi các giá thầu bị giới hạn ở các số hữu tỷ. Việc mở rộng miền sang các số thực liên tục đã vô hiệu hóa bằng chứng ban đầu. Gemini đã sử dụng các khái niệm hàng đầu về tô pô và lý thuyết thứ tự để mở rộng định lý, bao gồm cả động lực đấu giá thực tế, liên tục. Xem Phần 8.4.
  5. Vật lý của các dây vũ trụ: Tính toán bức xạ hấp dẫn từ các dây vũ trụ đòi hỏi phải tìm các giải pháp giải tích cho các tích phân khó chứa “điểm kỳ dị”. Gemini đã tìm thấy một giải pháp mới sử dụng các đa thức Gegenbauer. Điều này đã tự nhiên hấp thụ các điểm kỳ dị, làm sụp đổ một chuỗi vô hạn thành một dạng đóng, tổng hữu hạn. Xem Phần 6.1.

Các kết quả này, trải rộng trên nhiều lĩnh vực – từ lý thuyết thông tin và độ phức tạp đến mật mã và thiết kế cơ chế – cho thấy AI đang thay đổi cơ bản cách nghiên cứu. Để biết chi tiết, hãy xem bài báo của chúng tôi.

Do quy trình xuất bản theo định hướng hội nghị của khoa học máy tính, chúng tôi mô tả các kết quả này theo quỹ đạo học thuật thay vì một hệ thống phân loại cứng nhắc. Khoảng một nửa nhắm đến các hội nghị mạnh – bao gồm cả việc chấp nhận ICLR'26 – trong khi hầu hết các kết quả còn lại sẽ hình thành các bài nộp cho tạp chí trong tương lai. Ngay cả khi hiệu chỉnh lại lĩnh vực bằng cách xác định lỗi (Phần 3.2) hoặc bác bỏ các giả thuyết (Phần 3.1), những kết quả này làm nổi bật giá trị của AI như một cộng tác viên khoa học cấp cao.

Tương lai của Hợp tác Con người-AI

Dựa trên những đột phá trước đây của Google (1, 2, 3, 4, 5), công trình này chứng minh rằng các mô hình nền tảng tổng quát – được tận dụng với các quy trình suy luận tác nhân – có thể hoạt động như một người bạn đồng hành khoa học mạnh mẽ.

Dưới sự chỉ đạo của các nhà toán học, nhà vật lý và nhà khoa học máy tính chuyên nghiệp, Gemini Deep Think đang chứng tỏ tính hữu dụng của nó trên các lĩnh vực mà toán học, logic và suy luận phức tạp là cốt lõi.

Chúng ta đang chứng kiến một sự thay đổi cơ bản trong quy trình làm việc khoa học. Khi Gemini phát triển, nó hoạt động như một “lực nhân” cho trí tuệ con người, xử lý việc truy xuất kiến thức và xác minh nghiêm ngặt để các nhà khoa học có thể tập trung vào chiều sâu khái niệm và định hướng sáng tạo. Cho dù là tinh chỉnh các bằng chứng, tìm kiếm các phản ví dụ hay liên kết các lĩnh vực không liên quan, AI đang trở thành một cộng tác viên có giá trị trong chương tiếp theo của tiến bộ khoa học.

Lời cảm ơn

Chúng tôi cảm ơn cộng đồng các nhà toán học, nhà vật lý và nhà khoa học máy tính chuyên nghiệp đã giúp đỡ và đưa ra lời khuyên cho dự án này.

Dự án này là một sự hợp tác quy mô lớn giữa Google và thành công của nó là nhờ nỗ lực kết hợp của nhiều cá nhân và nhóm. Thang Luong và Vahab Mirrokni đã dẫn dắt các định hướng nghiên cứu tổng thể với chuyên môn kỹ thuật sâu sắc từ Tony Feng và David Woodruff.

Các tác giả của bài báo đầu tiên “Towards Autonomous Mathematics Research” bao gồm: Tony Feng, Trieu H. Trinh, Garrett Bingham, Dawsen Hwang, Yuri Chervonyi, Junehyuk Jung, Joonkyung Lee, Carlo Pagano, Sang-hyun Kim, Federico Pasqualotto, Sergei Gukov, Jonathan N. Lee, Junsu Kim, Kaiying Hou, Golnaz Ghiasi, Yi Tay, YaGuang Li, Chenkai Kuang, Yuan Liu, Hanzhao (Maggie) Lin, Evan Zheran Liu, Nigamaa Nayakanti, Xiaomeng Yang, Heng-Tze Cheng, Demis Hassabis, Koray Kavukcuoglu, Quoc V. Le, Thang Luong. Chúng tôi cảm ơn các chuyên gia sau đây vì phản hồi và thảo luận về công việc: Jarod Alper, Kevin Barreto, Thomas Bloom, Sourav Chatterjee, Otis Chodosh, Michael Hutchings, Seongbin Jeon, Youngbeom Jin, Aiden Yuchan Jung, Jiwon Kang, Jimin Kim, Vjekoslav Kovač, Daniel Litt, Ciprian Manolescu, Mona Merling, Agustin Moreno, Carl Schildkraut, Johannes Schmitt, Insuk Seo, Jaehyeon Seo, Terence Tao, Cheng-Chiang Tsai, Ravi Vakil, Zhiwei Yun, Shengtong Zhang, Wei Zhang, Yufei Zhao.

Các tác giả của bài báo thứ hai “Accelerating Scientific Research with Gemini: Case Studies and Common Techniques” bao gồm David P. Woodruff, Vincent Cohen-Addad, Lalit Jain, Jieming Mao, Song Zuo, MohammadHossein Bateni, Simina Branzei, Michael P. Brenner, Lin Chen, Ying Feng, Lance Fortnow, Gang Fu, Ziyi Guan, Zahra Hadizadeh, Mohammad T. Hajiaghayi, Mahdi JafariRaviz, Adel Javanmard, Karthik C. S., Ken-ichi Kawarabayashi, Ravi Kumar, Silvio Lattanzi, Euiwoong Lee, Yi Li, Ioannis Panageas, Dimitris Paparas, Benjamin Przybocki, Bernardo Subercaseaux, Ola Svensson, Shayan Taherijam, Xuan Wu, Eylon Yogev, Morteza Zadimoghaddam, Samson Zhou, Yossi Matias, Jeff Dean, James Manyika, Vahab Mirrokni. Danh sách này bao gồm các nhà nghiên cứu của Google xây dựng cơ chế hoạt động dựa trên Gemini, và các cộng tác viên chuyên gia học thuật của chúng tôi xác minh và hợp tác với Gemini. Chúng tôi cũng cảm ơn Corinna Cortes vì đã xem xét kỹ lưỡng bài báo.

Chúng tôi biết ơn sự hỗ trợ nền tảng từ phần còn lại của nhóm DeepThink: Anirudh Baddepudi, Michael Brenner, Irene Cai, Kristen Chiafullo, Paul Covington, Rumen Dangovski, Chenjie Gu, Huan Gui, Vihan Jain, Rajesh Jayaram, Melvin Johnson, Rosemary Ke, Maciej Kula, Nate Kushman, Jane Labanowski, Steve Li, Pol Moreno, Sidharth Mudgal, William Nelson, Ada Maksutaj Oflazer, Sahitya Potluri, Navneet Potti, Shubha Raghvendra, Siamak Shakeri, Archit Sharma, Xinying Song, Mukund Sundararajan, Qijun Tan, Zak Tsai, Theophane Weber, Winnie Xu, Zicheng Xu, Junwen Yao, Shunyu Yao, Adams Yu, Lijun Yu và Honglei Zhuang.

Chúng tôi cảm ơn Quoc Le, Koray Kavukcuoglu, Demis Hassabis, James Manyika, Yossi Matias và Jeff Dean vì đã tài trợ cho dự án này.

Cuối cùng nhưng không kém phần quan trọng, chúng tôi cảm ơn Divy Thakkar, Adam Brown, Vinay Ramasesh, Alex Davies, Thomas Hubert, Eugénie Rives, Pushmeet Kohli, Benoit Schillings vì những phản hồi và hỗ trợ cho dự án.


Bài viết liên quan

  • Phiên bản nâng cao của Gemini với Deep Think chính thức đạt tiêu chuẩn huy chương vàng tại Kỳ thi Toán học Quốc tế

    • Tháng 7 năm 2025 | Nghiên cứu
    • Tìm hiểu thêm
    • Ảnh minh họa bài viết liên quan về Gemini và IMO
  • Gemini đạt cấp độ huy chương vàng tại Chung kết Thế giới Cuộc thi Lập trình Quốc tế

    • Tháng 9 năm 2025 | Nghiên cứu
    • Tìm hiểu thêm
    • Ảnh minh họa bài viết liên quan về Gemini và ICPC

Recommended for You

Gemini 3 Deep Think- Thúc đẩy khoa học, nghiên cứu và kỹ thuật

Gemini 3 Deep Think- Thúc đẩy khoa học, nghiên cứu và kỹ thuật

Tối ưu hóa các mô hình Gemini cho các tác vụ khoa học, nghiên cứu và kỹ thuật phức tạp.

D4RT- Dạy AI nhìn thế giới theo bốn chiều

D4RT- Dạy AI nhìn thế giới theo bốn chiều

D4RT là một hệ thống mới giúp AI hiểu rõ hơn về thế giới động, nơi mọi thứ thay đổi theo thời gian. Nó cho phép AI dự đoán và tương tác với các vật thể chuyển động, giống như cách chúng ta nhìn nhận thế giới thực.