SIMA 2- Một Tác Nhân Chơi, Suy Luận và Học Hỏi Cùng Bạn trong Thế Giới 3D Ảo

Nghiên cứu

  • 10 min read
SIMA 2- Một Tác Nhân Chơi, Suy Luận và Học Hỏi Cùng Bạn trong Thế Giới 3D Ảo
Nghiên cứu

SIMA 2: Một Agent AI mạnh mẽ cho Thế giới ảo 3D, được cung cấp bởi Gemini

Google DeepMind vừa giới thiệu SIMA 2, một bước tiến quan trọng trong việc phát triển các tác nhân AI đa năng và hữu ích. Bằng cách tích hợp sức mạnh của các mô hình Gemini, SIMA 2 đã tiến hóa từ một tác nhân tuân theo chỉ dẫn đơn thuần trở thành một người bạn đồng hành chơi game tương tác.

SIMA 2 không chỉ có thể thực hiện các hướng dẫn bằng ngôn ngữ tự nhiên trong thế giới ảo mà còn có khả năng suy nghĩ về mục tiêu của mình, trò chuyện với người dùng và tự cải thiện theo thời gian. Đây là một bước tiến đáng kể hướng tới Trí tuệ Nhân tạo Tổng quát (AGI), với những tác động quan trọng cho tương lai của ngành robot và trí tuệ nhân tạo hóa thân.

Sức mạnh của Lý luận

SIMA phiên bản đầu tiên đã học cách thực hiện hơn 600 kỹ năng theo hướng dẫn bằng ngôn ngữ, như “quay trái”, “leo thang” và “mở bản đồ” trong một loạt các trò chơi điện tử thương mại. Nó hoạt động trong các môi trường này giống như một con người, bằng cách “nhìn” vào màn hình và sử dụng bàn phím cùng chuột ảo để di chuyển, mà không cần truy cập vào cơ chế hoạt động bên trong của trò chơi.

Với SIMA 2, chúng tôi đã vượt qua giới hạn của việc chỉ tuân theo hướng dẫn. Bằng cách tích hợp mô hình Gemini làm cốt lõi cho tác nhân, SIMA 2 không chỉ đơn thuần phản hồi hướng dẫn, mà còn có thể suy nghĩ và lý luận về chúng.

Các ví dụ về khả năng lý luận của SIMA 2:

SIMA 2 được đào tạo bằng cách kết hợp các video minh họa của con người với các nhãn ngôn ngữ cũng như các nhãn do Gemini tạo ra. Kết quả là, SIMA 2 giờ đây có thể giải thích cho người dùng về ý định của mình và trình bày chi tiết các bước đang thực hiện để hoàn thành mục tiêu.

Bước nhảy vọt về Hiệu suất Tổng quát hóa

Việc tích hợp Gemini cũng mang lại sự cải thiện về khả năng tổng quát hóa và độ tin cậy. SIMA 2 có thể hiểu các hướng dẫn phức tạp và tinh tế hơn so với phiên bản trước và thành công hơn đáng kể trong việc thực hiện chúng, đặc biệt là trong các tình huống hoặc trò chơi mà nó chưa từng được đào tạo, chẳng hạn như trò chơi sinh tồn Viking mới, ASKA, hoặc MineDojo – một bản triển khai nghiên cứu của trò chơi Minecraft nổi tiếng thế giới mở.

SIMA 2 có khả năng hiểu các nhiệm vụ dài và phức tạp:

SIMA 2 có thể hiểu các lời nhắc đa phương thức:

SIMA 2 có thể hiểu các ngôn ngữ khác nhau và thậm chí cả biểu tượng cảm xúc:

Hơn nữa, khả năng chuyển giao các khái niệm đã học – ví dụ, áp dụng sự hiểu biết về “khai thác” trong một trò chơi vào “thu hoạch” trong một trò chơi khác – là nền tảng để đạt được loại hình tổng quát hóa rộng rãi như trong nhận thức của con người. Trên thực tế, nhờ khả năng này, hiệu suất của SIMA 2 đã gần hơn đáng kể so với người chơi con người trong một loạt các nhiệm vụ.

Hướng tới Tự Cải thiện Đa Tác vụ, Có Khả năng Mở rộng

Một trong những khả năng mới thú vị nhất của SIMA 2 là khả năng tự cải thiện. Chúng tôi đã quan sát thấy rằng, trong quá trình đào tạo, các tác nhân SIMA 2 có thể thực hiện các nhiệm vụ ngày càng phức tạp và mới, được thúc đẩy bởi thử và sai cũng như phản hồi dựa trên Gemini.

Ví dụ, sau khi ban đầu học từ các video minh họa của con người, SIMA 2 có thể chuyển sang học trong các trò chơi mới hoàn toàn thông qua việc chơi tự định hướng, phát triển kỹ năng của mình trong các thế giới chưa từng thấy trước đây mà không cần thêm dữ liệu do con người tạo ra. Trong quá trình đào tạo tiếp theo, dữ liệu kinh nghiệm do chính SIMA 2 tạo ra có thể được sử dụng để đào tạo phiên bản tiếp theo, thậm chí còn có năng lực hơn của tác nhân. Chúng tôi thậm chí còn có thể tận dụng khả năng tự cải thiện của SIMA 2 trong môi trường Genie được tạo ra mới – một cột mốc quan trọng hướng tới việc đào tạo các tác nhân tổng quát trên các thế giới đa dạng, được tạo ra.

Chu trình cải thiện liên tục này mở đường cho một tương lai nơi các tác nhân có thể học hỏi và phát triển với sự can thiệp tối thiểu của con người, trở thành những người học mở trong AI hóa thân.

Nhìn về Tương lai: Hành trình đến Trí tuệ Hóa thân Tổng quát

Khả năng hoạt động của SIMA 2 trên các môi trường chơi game đa dạng là một sân thử nghiệm quan trọng cho trí tuệ tổng quát, cho phép các tác nhân thành thạo các kỹ năng, thực hành lý luận phức tạp và học hỏi liên tục thông qua việc chơi tự định hướng.

Mặc dù SIMA 2 là một bước tiến quan trọng hướng tới trí tuệ hóa thân tổng quát, tương tác và đa năng, nhưng nó về cơ bản là một nỗ lực nghiên cứu và những hạn chế hiện tại của nó nêu bật các lĩnh vực quan trọng cho công việc trong tương lai. Chúng tôi nhận thấy rằng các tác nhân vẫn gặp khó khăn với các nhiệm vụ dài hạn, phức tạp đòi hỏi lý luận và xác minh mục tiêu nhiều bước. SIMA 2 cũng có một bộ nhớ tương đối ngắn về các tương tác của nó – nó phải sử dụng một cửa sổ ngữ cảnh giới hạn để đạt được tương tác độ trễ thấp. Cuối cùng, việc thực hiện các hành động chính xác, cấp thấp thông qua giao diện bàn phím và chuột cũng như đạt được sự hiểu biết trực quan mạnh mẽ về các cảnh 3D phức tạp vẫn là những thách thức mở mà toàn bộ lĩnh vực đang tiếp tục giải quyết.

Nghiên cứu này cung cấp một sự xác nhận cơ bản cho một con đường mới trong AI hướng hành động. SIMA 2 xác nhận rằng một AI được đào tạo cho năng lực rộng, tận dụng dữ liệu đa thế giới đa dạng và khả năng lý luận mạnh mẽ của Gemini, có thể hợp nhất thành công các khả năng của nhiều hệ thống chuyên biệt thành một tác nhân mạch lạc, tổng quát.

SIMA 2 cũng cung cấp một con đường vững chắc hướng tới ứng dụng trong lĩnh vực robot. Các kỹ năng mà nó đã học – từ điều hướng, sử dụng công cụ đến thực hiện nhiệm vụ hợp tác – là một số khối xây dựng cơ bản cho sự hóa thân vật lý của trí tuệ cần thiết cho các trợ lý AI tương lai trong thế giới vật chất.

Phát triển có trách nhiệm

SIMA 2 là một tác nhân tương tác, lấy con người làm trung tâm, rất thú vị khi tương tác, đặc biệt là theo cách giải thích lý luận của nó một cách hấp dẫn. Giống như tất cả các công nghệ tiên tiến và nền tảng của chúng tôi, chúng tôi vẫn cam kết sâu sắc với việc phát triển SIMA 2 một cách có trách nhiệm ngay từ đầu. Điều này đặc biệt đúng với các đổi mới kỹ thuật của nó, đặc biệt là khả năng tự cải thiện.

Khi chúng tôi xây dựng SIMA 2, chúng tôi đã làm việc với Nhóm Phát triển & Đổi mới có Trách nhiệm của chúng tôi. Khi chúng tôi tiếp tục khám phá các ứng dụng tiềm năng, chúng tôi đang công bố SIMA 2 dưới dạng xem trước nghiên cứu giới hạn và cung cấp quyền truy cập sớm cho một nhóm nhỏ các học giả và nhà phát triển game. Cách tiếp cận này cho phép chúng tôi thu thập phản hồi quan trọng và các góc nhìn liên ngành khi chúng tôi khám phá lĩnh vực mới này và tiếp tục xây dựng sự hiểu biết của chúng tôi về rủi ro và các biện pháp giảm thiểu phù hợp. Chúng tôi mong muốn được làm việc thêm với cộng đồng để phát triển công nghệ này một cách có trách nhiệm.

Tìm hiểu thêm về SIMA

Báo cáo Kỹ thuật SIMA – Sắp ra mắt

Lời cảm ơn

Nghiên cứu này được phát triển bởi nhóm SIMA 2: Maria Abi Raad, John Agapiou, Frederic Besse, Andrew Bolt, Sarah Chakera, Harris Chan, Jeff Clune, Alexandra Cordell, Martin Engelcke, Ryan Faulkner, Maxime Gazeau, Arne Olav Hallingstad, Tim Harley, Ed Hirst, Drew Hudson, Laura Kampis, Sheleem Kashem, Thomas Keck, Matija Kecman, Oscar Knagg, Alexander Lerchner, Bonnie Li, Yulan Liu, Cong Lu, Maria Loks-Thompson, Joseph Marino, Kay McKinney, Piermaria Mendolicchio, Anna Mitenkova, Alexandre Moufarek, Fabio Pardo, Ollie Purkiss, David Reichert, John Reid, Tyson Roberts, Daniel P. Sawyer, Tim Scholtes, Daniel Slater, Hubert Soyer, Kaustubh Sridhar, Peter Stys, Tayfun Terzi, Davide Vercelli, Bojan Vujatovic, Jane X. Wang, Luyu Wang, Duncan Williams và Lei M. Zhang.

Để ghi nhận sự lãnh đạo, hướng dẫn và hỗ trợ của họ, chúng tôi cảm ơn: Satinder Singh Baveja, Adrian Bolton, Zoubin Ghahramani, Raia Hadsell, Demis Hassabis, Shane Legg, Volodymyr Mnih và Daan Wierstra.

Với lòng biết ơn sâu sắc đối với những người đóng góp một phần và các thành viên cũ: Alex Cullum, Karol Gregor, Rosemary Ke, Junkyung Kim, Matthew Jackson, Andrew Lampinen, Loic Matthey, Hannah Openshaw và Zhengdong Wang.

Xin chân thành cảm ơn tất cả các nhà phát triển game đã hợp tác với chúng tôi: Coffee Stain (Valheim, Satisfactory, Goat Simulator 3), Foulball Hangover (Hydroneer), Hello Games (No Man’s Sky), Keen Software House (Space Engineers), RubberbandGames (Wobbly Life), Strange Loop Games (Eco), Thunderful Games (ASKA, The Gunk, Steamworld Build), Digixart (Road 96), và Tuxedo Labs & Saber Interactive (Teardown).

Chúng tôi cảm ơn Vika Koriakin, Duncan Smith, Nilesh Ray, Matt Miller, Leen Verburgh, Ashyana Kachra, Phil Esposito, Dimple Vijaykumar, Piers Wingfield, Lucie Kerley vì sự hợp tác vô giá của họ trong việc phát triển và hoàn thiện các thành phần chính của dự án này.

Chúng tôi cũng xin cảm ơn Jack Parker-Holder, Shlomi Fruchter và phần còn lại của nhóm Genie đã cho phép truy cập mô hình Genie 3.

Chúng tôi xin ghi nhận các nhóm trong Google và Google DeepMind đã đóng góp vào nỗ lực này, bao gồm Pháp lý, Tiếp thị, Truyền thông, Hội đồng Trách nhiệm và An toàn, Phát triển và Đổi mới Có Trách nhiệm, Chính sách, Chiến lược và Hoạt động, cũng như các nhóm Kinh doanh và Phát triển Doanh nghiệp của chúng tôi. Chúng tôi cũng xin cảm ơn tất cả các nhóm GDM không được đề cập ở đây vì sự hỗ trợ liên tục của họ.

Cuối cùng, chúng tôi dành công trình này để tưởng nhớ các đồng nghiệp của chúng tôi Felix Hill và Fabio Pardo, những người có đóng góp cho lĩnh vực của chúng tôi tiếp tục truyền cảm hứng cho chúng tôi.

Bài viết liên quan

Recommended for You

Dạy AI nhìn thế giới giống chúng ta hơn

Dạy AI nhìn thế giới giống chúng ta hơn

Nghiên cứu

Ánh xạ, mô hình hóa và hiểu về tự nhiên bằng AI

Ánh xạ, mô hình hóa và hiểu về tự nhiên bằng AI

Khám phá cách AI đang được sử dụng để lập bản đồ, mô hình hóa và hiểu về thế giới tự nhiên.