Từ trò chơi đến sinh học và hơn thế nữa- 10 năm tác động của AlphaGo

Nhìn lại một thập kỷ kể từ cột mốc quan trọng của AlphaGo trong lĩnh vực nghiên cứu AI

March 12, 2026
6 min read

Từ trò chơi đến sinh học và hơn thế nữa- 10 năm tác động của AlphaGo — Nhìn lại một thập kỷ kể từ cột mốc quan trọng của AlphaGo trong lĩnh vực nghiên cứu AI

Từ trò chơi đến sinh học và xa hơn nữa: 10 năm tạo tác động của AlphaGo

Ngày 10 tháng 3 năm 2026 Tác giả: Demis Hassabis

(Video: Những thước phim ghi lại hành trình 10 năm của AlphaGo)

Mười năm trước, hệ thống AI AlphaGo của chúng tôi đã trở thành chương trình đầu tiên đánh bại một nhà vô địch thế giới ở trò chơi Go (Cờ vây) phức tạp – một cột mốc quan trọng trong lĩnh vực này mà nhiều chuyên gia từng nghĩ phải mất cả thập kỷ nữa mới đạt được.

Thành tựu này mở ra thời kỳ hiện đại của trí tuệ nhân tạo (AI). Với một nước đi sáng tạo mang tên “Nước đi 37”, AlphaGo đã chứng minh tiềm năng to lớn của AI và báo hiệu rằng chúng ta đã nắm giữ các kỹ thuật cần thiết để bắt đầu giải quyết những vấn đề khoa học thực tiễn.

Ngày nay, bước đột phá này vẫn tiếp tục định hướng công việc của chúng tôi trong việc xây dựng các hệ thống tiến tới trí tuệ nhân tạo tổng quát (AGI). Chúng tôi tin rằng AGI sẽ là công nghệ sâu sắc nhất từng được phát minh và có khả năng trở thành công cụ tối thượng để thúc đẩy khoa học, y học và năng suất lao động.

Tia sáng sáng tạo

Năm 2016, hơn 200 triệu người đã theo dõi AlphaGo đối đầu với nhà vô địch cờ vây Lee Sae Dol tại Seoul. Trận đấu được định nghĩa bởi “Nước đi 37” ở ván thứ hai, một nước đi phi truyền thống đến mức các bình luận viên chuyên nghiệp ban đầu tưởng rằng đó là một sai lầm. Nhưng nó đã chứng tỏ là nước đi mang tính quyết định. Khoảng 100 nước đi sau đó, quân cờ nằm đúng vị trí để AlphaGo thắng ván đấu. Đó là màn trình diễn của khả năng dự đoán đáng kinh ngạc và khả năng vượt qua việc bắt chước các chuyên gia con người để tìm ra những chiến lược hoàn toàn mới của hệ thống AI.

(Video: Phim tài liệu về AlphaGo trên YouTube)

Cờ vây từ lâu đã là “bãi thử” cho nghiên cứu AI vì độ phức tạp của nó. Có tới 10^170 vị trí có thể xảy ra trên bàn cờ – nhiều hơn số lượng nguyên tử trong vũ trụ quan sát được.

Để giải quyết trò chơi này, AlphaGo đã sử dụng các mạng thần kinh sâu kết hợp với tìm kiếm nâng cao và học tăng cường (reinforcement learning) – một phương pháp AI mà DeepMind đã tiên phong.

AlphaGo học mô hình các nước đi hợp lý bằng cách trước hết học từ các ván đấu của chuyên gia con người, sau đó tự chơi hàng trăm nghìn ván đấu với chính mình, tự cải thiện khi những chiến lược thắng lợi mạnh nhất được củng cố. Hệ thống sau đó chỉ xem xét những con đường khả thi nhất và từ tập hợp nhỏ các nước đi đó, tìm ra nước đi có khả năng dẫn đến chiến thắng cao nhất.

Sau AlphaGo, chúng tôi đã xây dựng AlphaGo Zero, hệ thống tự học trò chơi từ đầu mà không cần dữ liệu con người và trở thành người chơi mạnh nhất trong lịch sử. Sau đó, chúng tôi khái quát hóa hệ thống hơn nữa với AlphaZero, giúp nó tự học để làm chủ bất kỳ trò chơi thông tin hoàn hảo dành cho 2 người nào, bao gồm cờ vây, cờ vua và shogi.

“Tôi tin rằng bài học lớn nhất mà AlphaGo mang lại là một bản xem trước mang tính quyết định của kỷ nguyên AI — chứng minh rằng đó không phải là một tương lai xa xôi, mơ hồ, mà là một thực tế đang hiện hữu trước cửa nhà chúng ta. Nó đóng vai trò như một ’lộ trình từ tương lai’, gửi một tín hiệu rõ ràng đến nhân loại về cách thế giới sắp thay đổi.” — Kiện tướng cờ vây Lee Sae Dol, Phó giáo sư tại UNIST

Xúc tác cho những đột phá khoa học

Bằng cách chứng minh khả năng điều hướng không gian tìm kiếm khổng lồ trên bàn cờ vây, AlphaGo đã chứng minh tiềm năng của AI trong việc giúp chúng ta hiểu rõ hơn về những phức tạp rộng lớn của thế giới vật lý. Chúng tôi bắt đầu bằng việc giải quyết vấn đề gấp cuộn protein (protein folding), một thách thức lớn trong 50 năm qua.

Năm 2020, chúng tôi đã giải quyết vấn đề khoa học lâu đời này với hệ thống AlphaFold 2. Kể từ đó, chúng tôi đã gấp cấu trúc cho tất cả 200 triệu protein được khoa học biết đến và cung cấp miễn phí cho các nhà khoa học. Hiện nay, hơn 3 triệu nhà nghiên cứu trên toàn thế giới sử dụng cơ sở dữ liệu AlphaFold để đẩy nhanh công việc về mọi thứ, từ vắc-xin sốt rét đến enzyme tiêu thụ nhựa.

Kể từ chiến thắng của AlphaGo, chúng tôi đã áp dụng phương pháp đột phá của nó vào nhiều lĩnh vực khoa học và toán học khác, bao gồm:

Lập luận toán học: AlphaProof đã học cách chứng minh các tuyên bố toán học chính thức. Cùng với AlphaGeometry 2, hệ thống này đã đạt chuẩn huy chương bạc tại Olympic Toán học Quốc tế (IMO).
Gemini: Phiên bản nâng cao với chế độ Deep Think của Gemini đã đạt chuẩn huy chương vàng tại kỳ thi IMO năm 2025.
Khám phá thuật toán: Tác nhân lập trình AlphaEvolve đã tìm ra cách mới để nhân ma trận – một phép toán nền tảng cho mạng thần kinh.
Cộng tác khoa học: Chúng tôi đang tích hợp các nguyên tắc tìm kiếm và lập luận của AlphaGo vào một AI đồng khoa học.

Ngoài ra, chúng tôi đã sử dụng AI để hiểu rõ hơn về bộ gen, thúc đẩy nghiên cứu năng lượng nhiệt hạch, cải thiện dự báo thời tiết và nhiều lĩnh vực khác.

Tương lai của trí tuệ

Để một AI thực sự mang tính tổng quát, nó cần hiểu thế giới vật lý. Chúng tôi đã xây dựng Gemini để trở nên đa phương thức ngay từ đầu, hiểu cả ngôn ngữ, âm thanh, video, hình ảnh và mã nguồn.

Thế hệ AI tiếp theo sẽ cần khả năng gọi đến các công cụ chuyên dụng. Chúng tôi tin rằng sự kết hợp giữa các mô hình thế giới của Gemini, kỹ thuật tìm kiếm và lập kế hoạch của AlphaGo, cùng khả năng sử dụng công cụ chuyên dụng sẽ là yếu tố then chốt cho AGI.

Mười năm sau chiến thắng huyền thoại của AlphaGo, mục tiêu cuối cùng của chúng tôi đang ở phía chân trời. Tia sáng sáng tạo lần đầu xuất hiện trong Nước đi 37 đã xúc tác cho những đột phá đang hội tụ để mở đường tới AGI - và mở ra một kỷ nguyên vàng mới của khám phá khoa học.

(Video: Nhìn lại trận đấu đánh dấu cuộc cách mạng AI hiện đại)

Tìm hiểu thêm về AlphaGo | Xem phim tài liệu về AlphaGo trên YouTube

AI Today - SkyAI