Chia sẻ khuôn khổ tuân thủ của chúng tôi đối với Đạo luật Minh bạch về AI Tiên tiến của California

Chúng tôi tuân thủ khuôn khổ pháp lý về AI của California để đảm bảo tính minh bạch và trách nhiệm giải trình.

  • 6 min read
Chia sẻ khuôn khổ tuân thủ của chúng tôi đối với Đạo luật Minh bạch về AI Tiên tiến của California
Chúng tôi tuân thủ khuôn khổ pháp lý về AI của California để đảm bảo tính minh bạch và trách nhiệm giải trình.

Chia sẻ khung tuân thủ của chúng tôi về Đạo luật Minh bạch về AI Tiên tiến của California

Ngày 1 tháng 1, Đạo luật Minh bạch về AI Tiên tiến của California (SB 53) sẽ có hiệu lực. Đạo luật này thiết lập các yêu cầu đầu tiên của quốc gia về an toàn và minh bạch AI tiên tiến đối với các rủi ro thảm khốc.

Mặc dù chúng tôi đã ủng hộ một khuôn khổ liên bang từ lâu, Anthropic đã ủng hộ SB 53 vì chúng tôi tin rằng các nhà phát triển AI tiên tiến như chúng tôi nên minh bạch về cách họ đánh giá và quản lý những rủi ro này. Quan trọng hơn, luật cân bằng giữa nhu cầu về các biện pháp an toàn mạnh mẽ, báo cáo sự cố và bảo vệ người tố giác — đồng thời bảo tồn tính linh hoạt trong cách các nhà phát triển triển khai các biện pháp an toàn của họ và miễn trừ các công ty nhỏ hơn khỏi các gánh nặng pháp lý không cần thiết.

Một trong những yêu cầu chính của luật là các nhà phát triển AI tiên tiến phải công bố một khuôn khổ mô tả cách họ đánh giá và quản lý các rủi ro thảm khốc. Khung Tuân thủ AI Tiên tiến (FCF) của chúng tôi hiện đã có sẵn cho công chúng, tại đây. Dưới đây, chúng tôi thảo luận về những gì có trong đó và nêu bật những gì chúng tôi nghĩ nên diễn ra tiếp theo cho sự minh bạch của AI tiên tiến.

Những gì có trong Khung Tuân thủ AI Tiên tiến của chúng tôi

FCF của chúng tôi mô tả cách chúng tôi đánh giá và giảm thiểu các mối đe dọa tấn công mạng, hóa học, sinh học, phóng xạ và hạt nhân, cũng như rủi ro phá hoại AI và mất kiểm soát, đối với các mô hình tiên tiến của chúng tôi. Khung này cũng trình bày hệ thống phân cấp của chúng tôi để đánh giá khả năng của mô hình đối với các loại rủi ro này và giải thích cách tiếp cận của chúng tôi đối với các biện pháp giảm thiểu. Nó cũng bao gồm cách chúng tôi bảo vệ trọng số mô hình và phản ứng với các sự cố an toàn.

Phần lớn những gì có trong FCF phản ánh sự phát triển của các biện pháp mà chúng tôi đã tuân theo trong nhiều năm. Kể từ năm 2023, Chính sách Mở rộng Trách nhiệm (RSP) của chúng tôi đã nêu ra cách tiếp cận của chúng tôi để quản lý các rủi ro cực đoan từ các hệ thống AI tiên tiến và thông báo cho các quyết định của chúng tôi về phát triển và triển khai AI. Chúng tôi cũng phát hành các thẻ hệ thống chi tiết khi chúng tôi ra mắt các mô hình mới, mô tả khả năng, đánh giá an toàn và đánh giá rủi ro. Các phòng thí nghiệm khác đã áp dụng các phương pháp tương tự một cách tự nguyện. Theo luật mới có hiệu lực vào ngày 1 tháng 1, các loại biện pháp minh bạch đó là bắt buộc đối với những người xây dựng các hệ thống AI mạnh mẽ nhất ở California.

Trong tương lai, FCF sẽ đóng vai trò là khung tuân thủ của chúng tôi đối với SB 53 và các yêu cầu pháp lý khác. RSP sẽ vẫn là chính sách an toàn tự nguyện của chúng tôi, phản ánh những gì chúng tôi tin là các biện pháp tốt nhất khi bối cảnh AI phát triển, ngay cả khi điều đó vượt quá hoặc khác với các yêu cầu pháp lý hiện hành.

Nhu cầu về một tiêu chuẩn liên bang

Việc triển khai SB 53 là một thời điểm quan trọng. Bằng cách chính thức hóa các biện pháp minh bạch có thể đạt được mà các phòng thí nghiệm có trách nhiệm đã tự nguyện tuân theo, luật đảm bảo rằng các cam kết này không thể bị từ bỏ một cách lặng lẽ sau này khi các mô hình trở nên mạnh mẽ hơn hoặc khi cạnh tranh gia tăng. Bây giờ, một khuôn khổ minh bạch AI liên bang quy định các biện pháp này là cần thiết để đảm bảo tính nhất quán trên toàn quốc.

Đầu năm nay, chúng tôi đã đề xuất một khuôn khổ cho luật liên bang. Nó nhấn mạnh khả năng hiển thị công khai về các biện pháp an toàn, mà không cố gắng khóa chặt các phương pháp kỹ thuật cụ thể có thể không còn phù hợp theo thời gian. Các nguyên tắc cốt lõi của khuôn khổ của chúng tôi bao gồm:

  • Yêu cầu một khuôn khổ phát triển an toàn công khai: Các nhà phát triển được đề cập nên công bố một khuôn khổ nêu rõ cách họ đánh giá và giảm thiểu các rủi ro nghiêm trọng, bao gồm các tác hại hóa học, sinh học, phóng xạ và hạt nhân, cũng như các tác hại từ sự tự chủ của mô hình không phù hợp.
  • Công bố thẻ hệ thống khi triển khai: Tài liệu tóm tắt các thủ tục kiểm tra, đánh giá, kết quả và các biện pháp giảm thiểu nên được công khai khi các mô hình được triển khai và cập nhật nếu các mô hình được sửa đổi đáng kể.
  • Bảo vệ người tố giác: Sẽ là hành vi vi phạm pháp luật rõ ràng đối với một phòng thí nghiệm nói dối về việc tuân thủ khuôn khổ của mình hoặc trừng phạt các nhân viên nêu lên các mối lo ngại về vi phạm.
  • Các tiêu chuẩn minh bạch linh hoạt: Một khuôn khổ minh bạch AI khả thi nên có một bộ tiêu chuẩn tối thiểu để nó có thể tăng cường an ninh và an toàn công cộng trong khi thích ứng với bản chất phát triển của AI. Các tiêu chuẩn nên là các yêu cầu linh hoạt, nhẹ nhàng có thể thích ứng khi các biện pháp tốt nhất được nhất trí xuất hiện.
  • Giới hạn áp dụng cho các nhà phát triển mô hình lớn nhất: Để tránh gánh nặng cho hệ sinh thái khởi nghiệp và các nhà phát triển nhỏ hơn với các mô hình có rủi ro thấp gây ra tác hại thảm khốc, các yêu cầu chỉ nên áp dụng cho các nhà phát triển tiên tiến đã thành lập đang xây dựng các mô hình mạnh mẽ nhất.

Khi các hệ thống AI ngày càng mạnh mẽ hơn, công chúng xứng đáng được nhìn thấy cách chúng đang được phát triển và những biện pháp bảo vệ nào đang được áp dụng. Chúng tôi mong muốn được làm việc với Quốc hội và chính quyền để phát triển một khuôn khổ minh bạch quốc gia đảm bảo an toàn đồng thời bảo tồn vị thế dẫn đầu về AI của Mỹ.


Recommended for You

Anthropic mua lại Bun khi Claude Code đạt mốc 1 tỷ đô la

Anthropic mua lại Bun khi Claude Code đạt mốc 1 tỷ đô la

Anthropic mua lại Bun, đánh dấu một cột mốc quan trọng cho Claude Code.

Giới thiệu Claude Opus 4.5

Giới thiệu Claude Opus 4.5

Mô hình tốt nhất thế giới cho lập trình, tác tử và sử dụng máy tính, với những cải tiến đáng kể cho các tác vụ hàng ngày như bản trình bày và bảng tính. Claude Opus 4.5 mang lại hiệu suất tiên tiến và hiệu quả mã thông báo được cải thiện đáng kể.