Tăng cường quan hệ đối tác với Viện An toàn AI Vương quốc Anh
Trách nhiệm & An toàn
- 7 min read
Làm sâu sắc hơn nghiên cứu An toàn AI với Viện An ninh AI Vương quốc Anh (AISI)
Google DeepMind và Viện An ninh AI Vương quốc Anh (AISI) tăng cường hợp tác thông qua một quan hệ đối tác nghiên cứu mới, tập trung vào các lĩnh vực nghiên cứu an toàn quan trọng như giám sát quy trình suy luận của AI và đánh giá.
Ngày 11 tháng 12 năm 2025 Trách nhiệm & An toàn William Isaac và Owen Larter
Hôm nay, chúng tôi công bố mối quan hệ đối tác được mở rộng với Viện An ninh AI Vương quốc Anh (AISI) thông qua một Biên bản Ghi nhớ mới tập trung vào nghiên cứu an toàn và bảo mật nền tảng, nhằm giúp đảm bảo AI được phát triển an toàn và mang lại lợi ích cho mọi người.
Quan hệ đối tác nghiên cứu với AISI là một phần quan trọng trong sự hợp tác rộng lớn hơn của chúng tôi với chính phủ Vương quốc Anh nhằm thúc đẩy tiến bộ AI an toàn và có lợi.
Xây dựng dựa trên nền tảng hợp tác
AI có tiềm năng to lớn để mang lại lợi ích cho nhân loại bằng cách giúp điều trị bệnh, thúc đẩy khám phá khoa học, tạo ra sự thịnh vượng kinh tế và giải quyết vấn đề biến đổi khí hậu. Để những lợi ích này có thể được hiện thực hóa, chúng ta phải đặt an toàn và trách nhiệm vào trung tâm của sự phát triển. Đánh giá các mô hình của chúng tôi dựa trên phổ rộng các rủi ro tiềm ẩn vẫn là một phần quan trọng trong chiến lược an toàn của chúng tôi, và các mối quan hệ đối tác bên ngoài là một yếu tố quan trọng trong công việc này.
Đó là lý do tại sao chúng tôi đã hợp tác với AISI của Vương quốc Anh kể từ khi thành lập vào tháng 11 năm 2023 để thử nghiệm các mô hình mạnh mẽ nhất của chúng tôi. Chúng tôi cam kết sâu sắc với mục tiêu của AISI Vương quốc Anh là trang bị cho các chính phủ, ngành công nghiệp và xã hội rộng lớn hơn một sự hiểu biết khoa học về các rủi ro tiềm ẩn do AI tiên tiến gây ra cũng như các giải pháp và biện pháp giảm thiểu tiềm năng.
Chúng tôi đang tích cực làm việc với AISI để xây dựng các đánh giá mạnh mẽ hơn cho các mô hình AI, và các nhóm của chúng tôi đã hợp tác trong nghiên cứu an toàn để thúc đẩy lĩnh vực này phát triển, bao gồm cả công việc gần đây về Giám sát Chuỗi Suy luận: Cơ hội mới và mong manh cho An toàn AI. Phát huy thành công này, hôm nay chúng tôi đang mở rộng quan hệ đối tác của mình từ thử nghiệm sang bao gồm nghiên cứu rộng hơn, nền tảng hơn trong nhiều lĩnh vực.
Quan hệ đối tác bao gồm những gì
Theo quan hệ đối tác nghiên cứu mới này, chúng tôi đang mở rộng sự hợp tác của mình để bao gồm:
- Chia sẻ quyền truy cập vào các mô hình, dữ liệu và ý tưởng độc quyền của chúng tôi để đẩy nhanh tiến độ nghiên cứu.
- Báo cáo và ấn phẩm chung chia sẻ phát hiện với cộng đồng nghiên cứu.
- Nghiên cứu an ninh và an toàn hợp tác hơn, kết hợp chuyên môn của các nhóm chúng tôi.
- Các cuộc thảo luận kỹ thuật để giải quyết các thách thức an toàn phức tạp.
Các lĩnh vực nghiên cứu chính
Nghiên cứu chung của chúng tôi với AISI tập trung vào các lĩnh vực quan trọng mà chuyên môn, các nhóm liên ngành và nhiều năm nghiên cứu tiên phong có trách nhiệm của Google DeepMind có thể giúp làm cho các hệ thống AI trở nên an toàn và bảo mật hơn:
Giám sát quy trình suy luận của AI
Chúng tôi sẽ làm việc về các kỹ thuật để giám sát “suy nghĩ” của hệ thống AI, còn được gọi là chuỗi suy luận (CoT). Công việc này xây dựng dựa trên nghiên cứu trước đây của Google DeepMind cũng như sự hợp tác gần đây của chúng tôi về chủ đề này với AISI, OpenAI, Anthropic và các đối tác khác. Giám sát CoT giúp chúng tôi hiểu cách một hệ thống AI tạo ra câu trả lời của nó, bổ sung cho nghiên cứu khả năng diễn giải.
Hiểu tác động xã hội và cảm xúc
Chúng tôi sẽ hợp tác để điều tra các tác động đạo đức của sự không tương thích về mặt xã hội và cảm xúc; đó là, tiềm năng của các mô hình AI hành xử theo cách không phù hợp với hạnh phúc con người, ngay cả khi chúng tuân thủ chính xác các chỉ dẫn. Nghiên cứu này sẽ dựa trên công việc hiện có của Google DeepMind đã giúp xác định lĩnh vực an toàn AI quan trọng này.
Đánh giá hệ thống kinh tế
Chúng tôi sẽ khám phá tác động tiềm tàng của AI đối với các hệ thống kinh tế bằng cách mô phỏng các nhiệm vụ trong thế giới thực trên các môi trường khác nhau. Các chuyên gia sẽ chấm điểm và xác thực các nhiệm vụ này, sau đó chúng sẽ được phân loại theo các khía cạnh như độ phức tạp hoặc tính đại diện, để giúp dự đoán các yếu tố như tác động thị trường lao động dài hạn.
Cùng nhau làm việc để hiện thực hóa lợi ích của AI
Quan hệ đối tác của chúng tôi với AISI là một yếu tố trong cách chúng tôi hướng tới việc hiện thực hóa lợi ích của AI cho nhân loại đồng thời giảm thiểu rủi ro tiềm ẩn. Chiến lược rộng lớn hơn của chúng tôi bao gồm nghiên cứu về tầm nhìn xa, đào tạo an toàn mở rộng đi đôi với phát triển năng lực, thử nghiệm nghiêm ngặt các mô hình của chúng tôi và phát triển các công cụ và khung tốt hơn để hiểu và giảm thiểu rủi ro.
Các quy trình quản trị nội bộ mạnh mẽ cũng rất cần thiết cho việc phát triển AI an toàn và có trách nhiệm, cũng như hợp tác với các chuyên gia bên ngoài độc lập, những người mang đến những góc nhìn mới mẻ và chuyên môn đa dạng cho công việc của chúng tôi. Hội đồng Trách nhiệm và An toàn của Google DeepMind làm việc trên các nhóm để giám sát các rủi ro mới nổi, xem xét các đánh giá về đạo đức và an toàn, đồng thời triển khai các biện pháp kỹ thuật và chính sách liên quan. Chúng tôi cũng hợp tác với các chuyên gia bên ngoài khác như Apollo Research, Vaultis, Dreadnode và nhiều hơn nữa, để tiến hành thử nghiệm và đánh giá mở rộng các mô hình của chúng tôi, bao gồm cả Gemini 3, mô hình thông minh và an toàn nhất của chúng tôi cho đến nay.
Ngoài ra, Google DeepMind là thành viên sáng lập đáng tự hào của Diễn đàn Mô hình Tiên phong, cũng như Đối tác về AI, nơi chúng tôi tập trung vào việc đảm bảo phát triển an toàn và có trách nhiệm các mô hình AI tiên phong và tăng cường hợp tác về các vấn đề an toàn quan trọng.
Chúng tôi hy vọng quan hệ đối tác được mở rộng với AISI sẽ cho phép chúng tôi xây dựng các phương pháp mạnh mẽ hơn cho an toàn AI vì lợi ích không chỉ của các tổ chức của chúng tôi mà còn của ngành công nghiệp rộng lớn hơn và tất cả những người tương tác với hệ thống AI.
Bài viết liên quan
Tăng cường quan hệ đối tác của chúng tôi với chính phủ Vương quốc Anh để hỗ trợ sự thịnh vượng và an ninh trong kỷ nguyên AI Tháng 12 năm 2025 Trách nhiệm & An toàn Tìm hiểu thêm
Hội nghị thượng đỉnh An toàn AI: Cập nhật về cách tiếp cận của chúng tôi đối với an toàn và trách nhiệm Tháng 10 năm 2023 Tìm hiểu thêm
Link bài viết gốc
- Tags:
- Ai
- December 2025
- Deepmind.google