Google DeepMind làm nên lịch sử AI với chiến thắng huy chương vàng tại cuộc thi toán khó khăn nhất thế giới

Bài viết mô tả Google DeepMind làm nên lịch sử AI với chiến thắng huy chương vàng tại cuộc thi toán khó khăn nhất thế giới.

  • 11 min read
Google DeepMind làm nên lịch sử AI với chiến thắng huy chương vàng tại cuộc thi toán khó khăn nhất thế giới
Bài viết mô tả Google DeepMind làm nên lịch sử AI với chiến thắng huy chương vàng tại cuộc thi toán khó khăn nhất thế giới.

Google DeepMind làm nên lịch sử AI với huy chương vàng tại cuộc thi toán khó nhất thế giới

Robot đoạt huy chương

Bạn muốn có những thông tin chuyên sâu hơn trong hộp thư đến của mình? Hãy đăng ký nhận bản tin hàng tuần của chúng tôi để chỉ nhận những gì quan trọng đối với các nhà lãnh đạo về AI, dữ liệu và bảo mật doanh nghiệp. Đăng ký ngay

Google DeepMind vừa công bố rằng một phiên bản tiên tiến của mô hình trí tuệ nhân tạo Gemini của họ đã chính thức đạt được hiệu suất ở cấp độ huy chương vàng tại Kỳ thi Olympic Toán học Quốc tế, giải quyết năm trong số sáu bài toán đặc biệt khó và được công nhận là hệ thống AI đầu tiên nhận được đánh giá cấp độ vàng chính thức từ các nhà tổ chức cuộc thi.

Chiến thắng này thúc đẩy lĩnh vực suy luận AI và đưa Google vượt lên dẫn đầu trong cuộc chiến ngày càng gay gắt giữa các gã khổng lồ công nghệ đang xây dựng trí tuệ nhân tạo thế hệ tiếp theo. Quan trọng hơn, nó chứng minh rằng AI giờ đây có thể giải quyết các bài toán toán học phức tạp bằng cách sử dụng khả năng hiểu ngôn ngữ tự nhiên thay vì yêu cầu các ngôn ngữ lập trình chuyên dụng.

Video về Gemini DeepMind

“Kết quả chính thức đã có - Gemini đã đạt được cấp độ huy chương vàng trong Kỳ thi Olympic Toán học Quốc tế!” Demis Hassabis, Giám đốc điều hành của Google DeepMind, đã viết trên nền tảng truyền thông xã hội X vào sáng thứ Hai. “Một phiên bản nâng cao đã có thể giải quyết 5 trong số 6 bài toán. Tiến bộ đáng kinh ngạc.”

Kỳ thi Olympic Toán học Quốc tế, được tổ chức hàng năm kể từ năm 1959, được coi là cuộc thi toán học uy tín nhất thế giới dành cho học sinh trước khi vào đại học. Mỗi quốc gia tham gia cử sáu nhà toán học trẻ ưu tú tham gia giải quyết sáu bài toán đặc biệt khó bao gồm đại số, tổ hợp, hình học và lý thuyết số. Thông thường, chỉ có khoảng 8% người tham gia là con người kiếm được huy chương vàng.

Chuỗi Sự kiện AI Impact Trở Lại San Francisco - Ngày 5 tháng 8

Giai đoạn tiếp theo của AI đã đến - bạn đã sẵn sàng chưa? Hãy tham gia cùng các nhà lãnh đạo từ Block, GSK và SAP để có cái nhìn độc quyền về cách các tác nhân tự trị đang định hình lại quy trình làm việc của doanh nghiệp - từ việc ra quyết định theo thời gian thực đến tự động hóa đầu cuối.

Đảm bảo vị trí của bạn ngay bây giờ - không gian có hạn: https://bit.ly/3GuuPLF

Cách Gemini Deep Think của Google DeepMind giải quyết những bài toán khó nhất

Thành công mới nhất của Google vượt xa hiệu suất năm 2024, khi các hệ thống AlphaProofAlphaGeometry kết hợp của công ty đã giành được huy chương bạc bằng cách giải quyết bốn trong số sáu bài toán. Hệ thống trước đó yêu cầu các chuyên gia là con người trước tiên phải dịch các bài toán ngôn ngữ tự nhiên thành các ngôn ngữ lập trình dành riêng cho từng lĩnh vực và sau đó diễn giải đầu ra toán học của AI.

Bước đột phá năm nay đến từ Gemini Deep Think, một hệ thống lý luận nâng cao sử dụng những gì các nhà nghiên cứu gọi là “suy nghĩ song song”. Không giống như các mô hình AI truyền thống tuân theo một chuỗi suy luận duy nhất, Deep Think đồng thời khám phá nhiều giải pháp khả thi trước khi đưa ra câu trả lời cuối cùng.

Hassabis giải thích trong một bài đăng tiếp theo trên trang mạng xã hội X, nhấn mạnh rằng hệ thống đã hoàn thành công việc của mình trong giới hạn thời gian tiêu chuẩn 4,5 giờ của cuộc thi, “Mô hình của chúng tôi hoạt động từ đầu đến cuối bằng ngôn ngữ tự nhiên, tạo ra các bằng chứng toán học chặt chẽ trực tiếp từ các mô tả bài toán chính thức”.

Mô hình này đạt được 35 trên tổng số 42 điểm có thể, thoải mái vượt quá ngưỡng huy chương vàng. Theo Chủ tịch IMO, GS.TS. Gregor Dolinar, các giải pháp là “đáng kinh ngạc trên nhiều phương diện” và được các giám khảo cuộc thi nhận thấy là “rõ ràng, chính xác và hầu hết đều dễ theo dõi”.

OpenAI đối mặt với phản ứng dữ dội vì bỏ qua các quy tắc thi đấu chính thức

Thông báo này được đưa ra trong bối cảnh căng thẳng ngày càng gia tăng trong ngành AI về các hoạt động cạnh tranh và tính minh bạch. Cách tiếp cận thận trọng của Google DeepMind đối với việc công bố kết quả đã nhận được sự khen ngợi từ cộng đồng AI, đặc biệt là so với cách xử lý các thành tích tương tự của đối thủ OpenAI.

Hassabis viết, “Nhân tiện, chúng tôi đã không công bố vào thứ Sáu vì chúng tôi tôn trọng yêu cầu ban đầu của Hội đồng IMO rằng tất cả các phòng thí nghiệm AI chỉ chia sẻ kết quả của họ sau khi kết quả chính thức đã được xác minh bởi các chuyên gia độc lập và các sinh viên đã nhận được sự hoan nghênh mà họ xứng đáng”, dường như ám chỉ đến thông báo trước đó của OpenAI về hiệu suất Olympic của riêng họ.

Người dùng mạng xã hội đã nhanh chóng nhận thấy sự khác biệt. “Bạn thấy đấy? OpenAI đã bỏ qua yêu cầu của IMO. Thật đáng xấu hổ. Không đẳng cấp. Hoàn toàn thiếu tôn trọng,” một người dùng viết. “Google DeepMind đã hành động một cách chính trực, phù hợp với nhân loại.”

Sự chỉ trích bắt nguồn từ quyết định của OpenAI khi công bố kết quả Olympic toán học của riêng mình mà không tham gia vào quy trình đánh giá IMO chính thức. Thay vào đó, OpenAI đã có một hội đồng gồm những người tham gia IMO trước đây chấm điểm hiệu suất AI của họ, một cách tiếp cận mà một số người trong cộng đồng cho là thiếu độ tin cậy.

Một nhà phê bình viết: “OpenAI có lẽ là công ty tệ nhất trên hành tinh vào lúc này”, trong khi những người khác cho rằng công ty cần “coi trọng mọi thứ” và “đáng tin hơn”.

Bên trong các phương pháp đào tạo đã thúc đẩy sự thành thạo toán học của Gemini

Thành công của Google DeepMind dường như bắt nguồn từ các kỹ thuật đào tạo mới vượt xa các phương pháp truyền thống. Nhóm nghiên cứu đã sử dụng các phương pháp học tăng cường nâng cao được thiết kế để tận dụng suy luận nhiều bước, giải quyết vấn đề và dữ liệu chứng minh định lý. Mô hình này cũng được cung cấp quyền truy cập vào một bộ sưu tập các giải pháp toán học chất lượng cao được tuyển chọn và nhận được hướng dẫn cụ thể về cách tiếp cận các bài toán theo phong cách IMO.

Thành tựu kỹ thuật đã gây ấn tượng với các nhà nghiên cứu AI, những người đã lưu ý đến những ý nghĩa rộng lớn hơn của nó. Elyss Wren, một nhà quan sát AI, đã viết: “Không chỉ giải toán… mà còn hiểu các bài toán được mô tả bằng ngôn ngữ và áp dụng logic trừu tượng vào các trường hợp mới”. “Đây không phải là trí nhớ máy móc - đây là nhận thức mới nổi trong chuyển động.”

Ethan Mollick, một giáo sư tại Trường Wharton, người nghiên cứu về AI, đã nhấn mạnh tầm quan trọng của việc sử dụng một mô hình đa năng thay vì các công cụ chuyên dụng. Ông viết: “Ngày càng có nhiều bằng chứng về khả năng của LLM trong việc khái quát hóa để giải quyết các vấn đề mới”, đồng thời nhấn mạnh sự khác biệt này so với các phương pháp trước đây yêu cầu phần mềm toán học chuyên dụng.

Mô hình này đã thể hiện khả năng suy luận đặc biệt ấn tượng trong một bài toán mà nhiều đối thủ là con người đã áp dụng các khái niệm toán học cấp cao. Theo nhà nghiên cứu Junehyuk Jung của DeepMind, Gemini “đã đưa ra một quan sát xuất sắc và chỉ sử dụng lý thuyết số sơ cấp để tạo ra một bằng chứng độc lập”, tìm ra một giải pháp thanh lịch hơn nhiều người tham gia là con người.

Chiến thắng của Google DeepMind có ý nghĩa gì đối với cuộc đua AI trị giá 200 tỷ đô la

Bước đột phá này đến vào thời điểm quan trọng trong ngành AI, nơi các công ty đang chạy đua để chứng minh khả năng suy luận vượt trội. Thành công này có ý nghĩa thực tế ngay lập tức: Google có kế hoạch cung cấp một phiên bản mô hình Deep Think này cho các nhà toán học để thử nghiệm trước khi triển khai cho những người đăng ký Google AI Ultra, những người trả 250 đô la hàng tháng để truy cập vào các mô hình AI tiên tiến nhất của công ty.

Thời điểm này cũng làm nổi bật sự cạnh tranh ngày càng gay gắt giữa các phòng thí nghiệm AI lớn. Trong khi Google ăn mừng cách tiếp cận có phương pháp, được xác minh chính thức của mình, thì tranh cãi xung quanh thông báo của OpenAI phản ánh những căng thẳng rộng lớn hơn về tính minh bạch và độ tin cậy trong phát triển AI.

Động lực cạnh tranh này mở rộng ra ngoài khả năng suy luận toán học. Những tuần gần đây, nhiều công ty AI đã công bố các khả năng đột phá, mặc dù không phải tất cả đều được đón nhận tích cực. xAI của Elon Musk gần đây đã ra mắt Grok 4, mà công ty tuyên bố là “AI thông minh nhất thế giới”, mặc dù điểm số trên bảng xếp hạng cho thấy nó tụt hậu so với các mô hình từ Google và OpenAI. Ngoài ra, Grok còn phải đối mặt với những lời chỉ trích về các tính năng gây tranh cãi bao gồm người bạn đồng hành AI được tình dục hóa và các tập tạo nội dung bài Do Thái.

Bình minh của AI tư duy như con người — với những hậu quả thực tế

Chiến thắng Olympic toán học vượt xa quyền khoe khoang cạnh tranh. Hiệu suất của Gemini chứng minh rằng các hệ thống AI giờ đây có thể phù hợp với khả năng suy luận ở cấp độ con người trong các nhiệm vụ phức tạp đòi hỏi sự sáng tạo, tư duy trừu tượng và khả năng tổng hợp thông tin chi tiết trên nhiều lĩnh vực.

Nhóm DeepMind lưu ý trong thông báo kỹ thuật của họ: “Đây là một tiến bộ đáng kể so với kết quả đột phá của năm ngoái”. Sự tiến triển từ việc yêu cầu các ngôn ngữ hình thức chuyên dụng sang hoạt động hoàn toàn bằng ngôn ngữ tự nhiên cho thấy rằng các hệ thống AI đang trở nên trực quan và dễ tiếp cận hơn.

Đối với các doanh nghiệp, sự phát triển này báo hiệu rằng AI có thể sớm giải quyết các vấn đề phân tích phức tạp trên nhiều ngành khác nhau mà không cần lập trình chuyên dụng hoặc kiến thức chuyên môn về lĩnh vực này. Khả năng suy luận thông qua các thách thức phức tạp bằng ngôn ngữ hàng ngày có thể dân chủ hóa các khả năng phân tích phức tạp trong các tổ chức.

Tuy nhiên, vẫn còn những câu hỏi về việc liệu những khả năng suy luận này có được chuyển đổi hiệu quả sang những thách thức thực tế phức tạp hơn hay không. Olympic toán học cung cấp các bài toán được xác định rõ ràng với các tiêu chí thành công rõ ràng — khác xa so với các quyết định mơ hồ, nhiều mặt định hình hầu hết các nỗ lực kinh doanh và khoa học.

Google DeepMind có kế hoạch quay trở lại cuộc thi năm sau “để tìm kiếm điểm số hoàn hảo”. Công ty tin rằng các hệ thống AI kết hợp khả năng sử dụng ngôn ngữ tự nhiên trôi chảy với khả năng suy luận chặt chẽ “sẽ trở thành những công cụ vô giá cho các nhà toán học, nhà khoa học, kỹ sư và nhà nghiên cứu, giúp chúng ta nâng cao kiến thức của nhân loại trên con đường dẫn đến AGI”.

Nhưng có lẽ chi tiết cho thấy nhiều điều nhất đã xuất hiện từ chính cuộc thi: khi đối mặt với bài toán khó nhất của cuộc thi, Gemini đã bắt đầu từ một giả thuyết không chính xác và không bao giờ phục hồi. Chỉ có năm học sinh là con người giải được bài toán đó một cách chính xác. Cuối cùng, có vẻ như ngay cả AI giành huy chương vàng vẫn còn điều gì đó để học hỏi từ các nhà toán học tuổi teen.

Recommended for You

Sự cố mạng lớn của Crowdstrike sau 1 năm- những bài học mà doanh nghiệp có thể học để cải thiện bảo mật

Sự cố mạng lớn của Crowdstrike sau 1 năm- những bài học mà doanh nghiệp có thể học để cải thiện bảo mật

Bài viết thảo luận về những bài học mà các doanh nghiệp có thể học hỏi từ sự cố mạng lớn của Crowdstrike để cải thiện bảo mật.

5 câu hỏi quan trọng mà nhà phát triển của bạn nên hỏi về MCP

5 câu hỏi quan trọng mà nhà phát triển của bạn nên hỏi về MCP

Bài viết thảo luận về 5 câu hỏi quan trọng mà các nhà phát triển nên hỏi về MCP (Marketplace Connect Platform) để hiểu rõ hơn về nền tảng này và cách tận dụng nó một cách hiệu quả.