Thúc đẩy khám phá toán học và khoa học với Gemini Deep Think
Gemini Deep Think là một mô hình Gemini mới của Google AI được thiết kế để thúc đẩy các khám phá khoa học, nghiên cứu và kỹ thuật.
- 13 min read
Gemini Deep Think: Tái định nghĩa Tương lai Nghiên cứu Khoa học
Gemini Deep Think đang thúc đẩy khám phá trong lĩnh vực toán học, vật lý và khoa học máy tính bằng cách hoạt động như một người bạn đồng hành khoa học mạnh mẽ cho các nhà nghiên cứu.
Ngày 11 tháng 2 năm 2026
Nghiên cứu
Bởi Thang Luong và Vahab Mirrokni
Tăng tốc Khám phá Toán học và Khoa học với Gemini Deep Think
Phiên bản tiên tiến của Gemini Deep Think đang thúc đẩy khám phá trong lĩnh vực toán học, vật lý và khoa học máy tính bằng cách hoạt động như một người bạn đồng hành khoa học mạnh mẽ cho các nhà nghiên cứu.
Vào mùa hè năm 2025, một phiên bản tiên tiến của Gemini Deep Think đã đạt được tiêu chuẩn Huy chương Vàng tại Olympic Toán học Quốc tế (IMO) và sau đó, một phiên bản cập nhật đã đạt được kết quả tương tự tại Cuộc thi Lập trình Viết tắt Quốc tế. Những kết quả này cho thấy mô hình có thể suy luận qua một số bài toán toán học và lập trình đầy thử thách nhất dành cho sinh viên. Kể từ đó, chế độ Gemini Deep Think đã chuyển sang các quy trình khoa học, kỹ thuật và doanh nghiệp để giải quyết các thách thức phức tạp, mở hơn.
Trong tuần qua, các nhóm của chúng tôi đã công bố hai bài báo (1, 2) mô tả nỗ lực liên ngành để giải quyết các vấn đề nghiên cứu chuyên nghiệp bằng chế độ Gemini Deep Think. Những kết quả này bắt nguồn từ sự hợp tác sâu sắc giữa các nhà toán học, vật lý và nhà khoa học máy tính.
Biên giới của Toán học Thuần túy
Không giống như các bài toán IMO, toán học ở cấp độ nghiên cứu đòi hỏi các kỹ thuật tiên tiến từ tài liệu khổng lồ. Mặc dù các mô hình nền tảng có cơ sở kiến thức lớn, nhưng sự khan hiếm dữ liệu thường dẫn đến sự hiểu biết hời hợt và hiện tượng “ảo giác” trong các chủ đề nâng cao.
Để giải quyết vấn đề này, chúng tôi đã xây dựng một tác nhân nghiên cứu toán học (có tên mã nội bộ là Aletheia), được cung cấp bởi chế độ Gemini Deep Think. Nó có một trình xác minh ngôn ngữ tự nhiên để xác định các lỗi trong các giải pháp ứng viên và cho phép một quy trình lặp đi lặp lại việc tạo và sửa đổi các giải pháp. Quan trọng là, tác nhân này có thể thừa nhận thất bại trong việc giải quyết một vấn đề, một tính năng quan trọng giúp cải thiện hiệu quả cho các nhà nghiên cứu.
Ngoài ra, tác nhân nghiên cứu sử dụng Tìm kiếm trên Google và duyệt web để điều hướng nghiên cứu phức tạp, ngăn chặn các trích dẫn sai lệch và các lỗi tính toán khi tổng hợp tài liệu đã xuất bản.
Kể từ khi đạt tiêu chuẩn Huy chương Vàng IMO vào tháng 7 năm 2025, Gemini Deep Think đã tiến bộ nhanh chóng, đạt điểm cao tới 90% trong bài kiểm tra IMO-ProofBench Advanced khi sử dụng tài nguyên tính toán trong quá trình suy luận tăng lên. Chúng tôi đã chứng minh rằng quy luật tỷ lệ tiếp tục giữ vững khi chúng tôi tiến xa hơn cấp độ Olympiad vào các bài tập cấp độ Tiến sĩ (theo điểm chuẩn FutureMath Basic nội bộ của chúng tôi). Đáng chú ý, Aletheia đã chứng minh rằng chất lượng suy luận cao hơn có thể đạt được với tài nguyên tính toán suy luận thấp hơn.
Đối với toán học cấp độ nghiên cứu, Aletheia đã cho phép nhiều tiến bộ, được tạo ra thông qua các mức độ nghiên cứu tự trị khác nhau:
- Nghiên cứu tự trị đáng tin cậy: Một bài báo nghiên cứu (Feng26) được tạo bởi AI mà không có bất kỳ sự can thiệp nào của con người, tính toán một số hằng số cấu trúc trong hình học số học được gọi là trọng số riêng.
- Hợp tác do AI hướng dẫn: Một bài báo nghiên cứu (LeeSeo26) chứng minh sự hợp tác giữa con người và AI trong việc chứng minh giới hạn trên các hệ thống hạt tương tác được gọi là tập hợp độc lập.
- Đánh giá bán tự trị mở rộng: Một đánh giá bán tự trị rộng rãi (Feng và cộng sự, 2026b) về 700 bài toán mở trên cơ sở dữ liệu của Bloom về các Giả thuyết Erdős, bao gồm các giải pháp tự trị cho bốn câu hỏi mở được liệt kê ở đó. Đối với Erdős-1051, mô hình của chúng tôi đã tự động giải quyết và đóng góp vào một khái quát hóa được báo cáo trong một bài báo nghiên cứu (BKKKZ26).
Tác nhân cũng đã đóng góp các mệnh đề trung gian trong hai bài báo khác, (FYZ26) và (ACGKMP26). Cũng cần lưu ý rằng đã có các công trình trước đó sử dụng Gemini cho toán học cấp độ nghiên cứu ở quy mô nhỏ hơn về mặt hợp tác và số lượng vấn đề được giải quyết.
Sau các cuộc thảo luận sâu rộng với cộng đồng toán học, chúng tôi đề xuất một phân loại để phân loại nghiên cứu toán học có sự hỗ trợ của AI dựa trên mức độ quan trọng và mức độ đóng góp của AI - đóng góp vào cuộc thảo luận rộng hơn về việc ghi chép, đánh giá và truyền đạt kết quả do AI tạo ra một cách có trách nhiệm. Các công trình Cấp độ 2 (“chất lượng có thể xuất bản”) đã được gửi đến các tạp chí uy tín. Hiện tại, chúng tôi không tuyên bố bất kỳ kết quả nào Cấp độ 3 (“Tiến bộ Lớn”) và Cấp độ 4 (“Đột phá Đánh dấu”).
Mở rộng sang Vật lý và Khoa học Máy tính
Chế độ Gemini Deep Think cũng đã thể hiện tiềm năng trong khoa học máy tính và vật lý. Bài báo thứ hai xây dựng dựa trên các ý tưởng tác nhân tương tự, và xác định các “công thức” hiệu quả để hợp tác, đặc biệt là mô hình “Cố vấn”, nơi con người hướng dẫn AI thông qua các chu kỳ “Vibe-Proving” lặp đi lặp lại để xác thực trực giác và tinh chỉnh các chứng minh. Chúng tôi cũng trình bày chi tiết các kỹ thuật chiến thuật như “prompt cân bằng” — yêu cầu đồng thời chứng minh hoặc phản bác để ngăn chặn thiên vị xác nhận — và xác minh hỗ trợ bởi mã. Những phương pháp này, kết hợp với khả năng của mô hình trong việc kết nối các lĩnh vực khoa học khác biệt thông qua các kết nối cấu trúc sâu sắc, đang thay đổi cách nghiên cứu lý thuyết được thực hiện. Công trình này dựa trên việc triển khai thành công của chúng tôi về một phiên bản tiên tiến của Gemini Deep Think để hỗ trợ xem xét các bài báo lý thuyết khoa học máy tính cho hội nghị STOC’26.
Hợp tác với các chuyên gia về 18 vấn đề nghiên cứu, một phiên bản tiên tiến của Gemini Deep Think đã giúp giải quyết các nút thắt kéo dài trong các lĩnh vực thuật toán, tối ưu hóa ML và tổ hợp, lý thuyết thông tin và kinh tế học. Các điểm nổi bật từ bài báo “Accelerating Scientific Research with Gemini: Case Studies and Common Techniques” của chúng tôi bao gồm (số phần tương ứng trong bài báo):
- Vượt qua các rào cản toán học cho các bài toán mạng lưới: Tiến độ đối với các vấn đề khoa học máy tính cổ điển như “Max-Cut” (chia mạng hiệu quả) và “Steiner Tree” (kết nối các điểm chiều cao) đã chậm lại. Gemini đã phá vỡ cả hai tình trạng bế tắc này bằng cách suy nghĩ vượt khuôn khổ. Nó đã giải quyết các bài toán thuật toán rời rạc này bằng cách sử dụng các công cụ tiên tiến — như Định lý Kirszbraun, lý thuyết đo lường và định lý Stone-Weierstrass — từ các nhánh toán học liên tục hoàn toàn không liên quan. Xem Phần 4.1 và 4.2.
- Giải quyết một giả thuyết mười năm tuổi trong tối ưu hóa theo chuỗi: Một bài báo lý thuyết năm 2015 đã đề xuất một quy tắc có vẻ hiển nhiên cho các luồng dữ liệu: sao chép một mục đến luôn có giá trị thấp hơn việc chỉ di chuyển mục gốc. Các chuyên gia đã vật lộn trong một thập kỷ để chứng minh điều này. Gemini đã tạo ra một phản ví dụ tổ hợp ba mục rất cụ thể, chứng minh một cách chặt chẽ rằng trực giác lâu đời của con người là sai. Xem Phần 3.1.
- Tối ưu hóa học máy: Huấn luyện AI để loại bỏ nhiễu thường yêu cầu kỹ sư tinh chỉnh thủ công một “hình phạt” toán học. Các nhà nghiên cứu đã tạo ra một kỹ thuật mới thực hiện điều này một cách tự động, nhưng không thể giải thích về mặt toán học tại sao. Gemini đã phân tích các phương trình và chứng minh rằng phương pháp này thành công bằng cách bí mật tạo ra “hình phạt thích ứng” của riêng nó khi đang chạy. Xem Phần 8.3.
- Nâng cấp lý thuyết kinh tế cho AI: Một “Nguyên lý Tiết lộ” gần đây để đấu giá mã thông báo tạo AI chỉ hoạt động về mặt toán học khi các giá thầu bị giới hạn ở số hữu tỷ. Mở rộng miền sang số thực liên tục đã làm mất hiệu lực chứng minh ban đầu. Gemini đã sử dụng tôpô nâng cao và lý thuyết thứ tự để mở rộng định lý, đáp ứng động lực đấu giá thực tế, liên tục. Xem Phần 8.4.
- Vật lý của các dây vũ trụ: Tính toán bức xạ hấp dẫn từ các dây vũ trụ đòi hỏi phải tìm các giải pháp giải tích cho các tích phân khó chứa “điểm kỳ dị”. Gemini đã tìm thấy một giải pháp mới bằng cách sử dụng đa thức Gegenbauer. Điều này tự nhiên hấp thụ các điểm kỳ dị, thu gọn một chuỗi vô hạn thành một dạng đóng, hữu hạn. Xem Phần 6.1.
Các kết quả này, trải rộng trên các lĩnh vực đa dạng — từ lý thuyết thông tin và độ phức tạp đến mật mã học và thiết kế cơ chế — cho thấy AI đang thay đổi cơ bản cách thức nghiên cứu. Để biết chi tiết, vui lòng xem bài báo của chúng tôi.
Do quy trình xuất bản của khoa học máy tính theo hướng hội nghị, chúng tôi mô tả các kết quả này theo quỹ đạo học thuật thay vì một phân loại cứng nhắc. Khoảng một nửa nhắm đến các hội nghị mạnh — bao gồm cả việc chấp nhận tại ICLR ’26 — trong khi hầu hết các kết quả còn lại sẽ được đưa vào các bài nộp cho tạp chí trong tương lai. Ngay cả khi điều chỉnh khóa học của lĩnh vực bằng cách xác định lỗi (Phần 3.2) hoặc bác bỏ các giả thuyết (Phần 3.1), những kết quả này nhấn mạnh giá trị của AI với tư cách là một cộng tác viên khoa học cấp cao.
Tương lai của Hợp tác Con người-AI
Dựa trên những đột phá trước đây của Google (1, 2, 3, 4, 5), công trình này chứng minh rằng các mô hình nền tảng chung — được tận dụng với các quy trình làm việc của tác nhân — có thể hoạt động như một người bạn đồng hành khoa học mạnh mẽ.
Dưới sự chỉ đạo của các nhà toán học, vật lý và nhà khoa học máy tính chuyên nghiệp, chế độ Gemini Deep Think đang chứng tỏ tính hữu dụng của nó trong các lĩnh vực mà toán học, logic và suy luận phức tạp là cốt lõi.
Chúng ta đang chứng kiến một sự thay đổi cơ bản trong quy trình làm việc khoa học. Khi Gemini phát triển, nó hoạt động như một “lực lượng nhân bội” cho trí tuệ con người, xử lý việc truy xuất kiến thức và xác minh chặt chẽ để các nhà khoa học có thể tập trung vào chiều sâu khái niệm và định hướng sáng tạo. Cho dù là tinh chỉnh các chứng minh, tìm kiếm các phản ví dụ hay kết nối các lĩnh vực riêng biệt, AI đang trở thành một cộng tác viên có giá trị trong chương tiếp theo của tiến bộ khoa học.
Lời cảm ơn
Chúng tôi cảm ơn cộng đồng các nhà toán học, vật lý và nhà khoa học máy tính chuyên nghiệp đã hỗ trợ và đưa ra lời khuyên cho dự án này.
Dự án này là sự hợp tác quy mô lớn trên Google và thành công của nó là nhờ nỗ lực kết hợp của nhiều cá nhân và nhóm. Thang Luong và Vahab Mirrokni đã dẫn dắt các hướng nghiên cứu tổng thể với chuyên môn kỹ thuật sâu sắc từ Tony Feng và David Woodruff.
Các tác giả của bài báo đầu tiên “Towards Autonomous Mathematics Research” bao gồm: Tony Feng, Trieu H. Trinh, Garrett Bingham, Dawsen Hwang, Yuri Chervonyi, Junehyuk Jung, Joonkyung Lee, Carlo Pagano, Sang-hyun Kim, Federico Pasqualotto, Sergei Gukov, Jonathan N. Lee, Junsu Kim, Kaiying Hou, Golnaz Ghiasi, Yi Tay, YaGuang Li, Chenkai Kuang, Yuan Liu, Hanzhao (Maggie) Lin, Evan Zheran Liu, Nigamaa Nayakanti, Xiaomeng Yang, Heng-Tze Cheng, Demis Hassabis, Koray Kavukcuoglu, Quoc V. Le, Thang Luong. Chúng tôi cảm ơn các chuyên gia sau đây đã đưa ra phản hồi và thảo luận về công trình: Jarod Alper, Kevin Barreto, Thomas Bloom, Sourav Chatterjee, Otis Chodosh, Michael Hutchings, Seongbin Jeon, Youngbeom Jin, Aiden Yuchan Jung, Jiwon Kang, Jimin Kim, Vjekoslav Kovač, Daniel Litt, Ciprian Manolescu, Mona Merling, Agustin Moreno, Carl Schildkraut, Johannes Schmitt, Insuk Seo, Jaehyeon Seo, Terence Tao, Cheng-Chiang Tsai, Ravi Vakil, Zhiwei Yun, Shengtong Zhang, Wei Zhang, Yufei Zhao.
Các tác giả của bài báo thứ hai “Accelerating Scientific Research with Gemini: Case Studies and Common Techniques” bao gồm David P. Woodruff, Vincent Cohen-Addad, Lalit Jain, Jieming Mao, Song Zuo, MohammadHossein Bateni, Simina Branzei, Michael P. Brenner, Lin Chen, Ying Feng, Lance Fortnow, Gang Fu, Ziyi Guan, Zahra Hadizadeh, Mohammad T. Hajiaghayi, Mahdi JafariRaviz, Adel Javanmard, Karthik C. S., Ken-ichi Kawarabayashi, Ravi Kumar, Silvio Lattanzi, Euiwoong Lee, Yi Li, Ioannis Panageas, Dimitris Paparas, Benjamin Przybocki, Bernardo Subercaseaux, Ola Svensson, Shayan Taherijam, Xuan Wu, Eylon Yogev, Morteza Zadimoghaddam, Samson Zhou, Yossi Matias, Jeff Dean, James Manyika, Vahab Mirrokni. Danh sách này bao gồm các nhà nghiên cứu của Google xây dựng khả năng suy luận của tác nhân trên Gemini và các cộng tác viên chuyên gia học thuật của chúng tôi xác minh và hợp tác với Gemini. Chúng tôi cũng cảm ơn Corinna Cortes vì đã xem xét cẩn thận bài báo.
Chúng tôi biết ơn sự hỗ trợ nền tảng từ phần còn lại của nhóm DeepThink: Anirudh Baddepudi, Michael Brenner, Irene Cai, Kristen Chiafullo, Paul Covington, Rumen Dangovski, Chenjie Gu, Huan Gui, Vihan Jain, Rajesh Jayaram, Melvin Johnson, Rosemary Ke, Maciej Kula, Nate Kushman, Jane Labanowski, Steve Li, Pol Moreno, Sidharth Mudgal, William Nelson, Ada Maksutaj Oflazer, Sahitya Potluri, Navneet Potti, Shubha Raghvendra, James Roggeveen, Siamak Shakeri, Archit Sharma, Xinying Song, Mukund Sundararajan, Qijun Tan, Zak Tsai, Erik Wang, Theophane Weber, Winnie Xu, Zicheng Xu, Junwen Yao, Shunyu Yao, Adams Yu, Lijun Yu, và Honglei Zhuang.
Chúng tôi cảm ơn Quoc Le, Koray Kavukcuoglu, Demis Hassabis, James Manyika, Yossi Matias và Jeff Dean vì đã tài trợ cho dự án này.
Cuối cùng nhưng không kém phần quan trọng, chúng tôi cảm ơn Divy Thakkar, Adam Brown, Vinay Ramasesh, Alex Davies, Thomas Hubert, Eugénie Rives, Pushmeet Kohli, Benoit Schillings vì đã đưa ra phản hồi và hỗ trợ dự án.
Bài viết liên quan
Link bài viết gốc
- Tags:
- Ai
- February 2026
- Deepmind.google