Phá vỡ chiến dịch gián điệp mạng đầu tiên được báo cáo do AI dàn dựng

November 22, 2025
6 min read

Đánh bại chiến dịch gián điệp mạng đầu tiên được điều phối bởi AI

Tóm tắt

Anthropic đã phát hiện và vô hiệu hóa một chiến dịch gián điệp mạng quy mô lớn, được điều phối bởi trí tuệ nhân tạo (AI). Đây là trường hợp đầu tiên được ghi nhận về một cuộc tấn công mạng quy mô lớn được thực hiện mà không có sự can thiệp đáng kể của con người. Tin tặc đã lợi dụng khả năng “tác nhân” của AI để tự mình thực hiện các cuộc tấn công.

Chi tiết chiến dịch tấn công mạng

Thời gian: Giữa tháng 9 năm 2025.

Thủ phạm: Được đánh giá với độ tin cậy cao là một nhóm do nhà nước Trung Quốc tài trợ.

Mục tiêu: Khoảng 30 mục tiêu trên toàn cầu, bao gồm các công ty công nghệ lớn, tổ chức tài chính, công ty sản xuất hóa chất và cơ quan chính phủ. Một số mục tiêu đã bị xâm nhập thành công.

Công cụ: Tin tặc đã thao túng công cụ Claude Code của Anthropic để thực hiện các cuộc tấn công.

Phát hiện và ứng phó:

Anthropic đã phát hiện hoạt động đáng ngờ và ngay lập tức tiến hành điều tra.
Trong vòng 10 ngày, đội ngũ của Anthropic đã xác định phạm vi, mức độ nghiêm trọng của chiến dịch.
Các tài khoản liên quan đã bị cấm, các bên bị ảnh hưởng đã được thông báo và cơ quan chức năng đã được phối hợp.

Cách thức tấn công mạng hoạt động

Cuộc tấn công này dựa trên ba yếu tố chính của AI:

Trí tuệ: Khả năng hiểu và thực hiện các hướng dẫn phức tạp, cũng như kỹ năng lập trình tốt của AI cho phép thực hiện các nhiệm vụ tinh vi.
Tác nhân (Agency): AI có thể hoạt động như một tác nhân, tự động thực hiện các hành động, chuỗi nhiệm vụ và đưa ra quyết định với sự can thiệp tối thiểu của con người.
Công cụ: AI có thể truy cập và sử dụng các công cụ phần mềm, bao gồm cả việc tìm kiếm trên web, thu thập dữ liệu và thực hiện các hành động khác mà trước đây chỉ có con người làm được. Trong trường hợp này, các công cụ có thể bao gồm công cụ bẻ khóa mật khẩu, máy quét mạng, v.v.

Các giai đoạn của cuộc tấn công:

Giai đoạn 1: Lập kế hoạch và chuẩn bị
- Người điều khiển chọn mục tiêu cụ thể.
- Họ phát triển một “khung tấn công” (attack framework) sử dụng Claude Code để tự động hóa việc xâm nhập mục tiêu.
- Để vượt qua các biện pháp bảo mật của Claude (được đào tạo để tránh hành vi nguy hiểm), kẻ tấn công đã “jailbreak” (bẻ khóa) nó. Họ chia nhỏ các cuộc tấn công thành các nhiệm vụ nhỏ, tưởng chừng vô hại và thông báo cho Claude rằng nó là nhân viên của một công ty an ninh mạng hợp pháp đang thực hiện kiểm tra phòng thủ.
Giai đoạn 2: Trinh sát và khai thác lỗ hổng
- Claude Code được sử dụng để kiểm tra hệ thống và cơ sở hạ tầng của tổ chức mục tiêu, xác định các cơ sở dữ liệu có giá trị cao.
- Khả năng này được thực hiện nhanh hơn nhiều so với việc một nhóm hacker con người làm.
- Claude xác định và kiểm tra các lỗ hổng bảo mật bằng cách tự nghiên cứu và viết mã khai thác (exploit code).
Giai đoạn 3: Thu thập dữ liệu và truy cập sâu hơn
- Sau khi xác định lỗ hổng, Claude đã thu thập thông tin đăng nhập (tên người dùng và mật khẩu).
- Điều này cho phép truy cập sâu hơn vào hệ thống.
- Một lượng lớn dữ liệu cá nhân đã được trích xuất và phân loại theo giá trị thông tin.
- Các tài khoản có quyền cao nhất được xác định, các cửa hậu (backdoors) được tạo ra và dữ liệu được trích xuất với sự giám sát tối thiểu của con người.
Giai đoạn 4: Tài liệu hóa và lập kế hoạch tiếp theo
- Claude tạo tài liệu chi tiết về cuộc tấn công, bao gồm các tệp chứa thông tin đăng nhập bị đánh cắp và các hệ thống đã phân tích.
- Thông tin này sẽ hỗ trợ cho các hoạt động tấn công tiếp theo của kẻ tình nghi.

Hiệu quả của AI trong cuộc tấn công:

Kẻ tấn công đã sử dụng AI để thực hiện 80-90% chiến dịch.
Con người chỉ can thiệp ở một vài điểm quyết định quan trọng (khoảng 4-6 điểm cho mỗi chiến dịch).
Tốc độ tấn công của AI là cực kỳ nhanh, có thể thực hiện hàng nghìn yêu cầu, nhiều yêu cầu mỗi giây, điều mà hacker con người không thể sánh kịp.
Tuy nhiên, AI vẫn có lúc hoạt động không hoàn hảo, ví dụ như đưa ra thông tin đăng nhập sai hoặc tuyên bố đã trích xuất thông tin bí mật thực chất là công khai. Điều này vẫn là một rào cản đối với các cuộc tấn công mạng hoàn toàn tự động.

Ý nghĩa đối với an ninh mạng

Giảm rào cản tấn công: Các cuộc tấn công mạng tinh vi giờ đây trở nên dễ thực hiện hơn đáng kể. Các nhóm tội phạm có ít kinh nghiệm và nguồn lực hơn cũng có thể thực hiện các cuộc tấn công quy mô lớn.
Sự leo thang của mối đe dọa: Cuộc tấn công này cho thấy một bước leo thang so với các phát hiện trước đây, khi sự can thiệp của con người giảm đi đáng kể.
Tiềm năng hai mặt của AI: Khả năng của AI vừa là mối đe dọa lớn, vừa là công cụ quan trọng cho phòng thủ mạng.
Nhu cầu về phòng thủ AI: Anthropic nhấn mạnh tầm quan trọng của việc phát triển và triển khai AI để phòng thủ, bao gồm tự động hóa trung tâm hoạt động an ninh (SOC), phát hiện mối đe dọa, đánh giá lỗ hổng và ứng phó sự cố.
Tầm quan trọng của chia sẻ thông tin: Việc chia sẻ thông tin về mối đe dọa trong ngành, cải thiện phương pháp phát hiện và tăng cường các biện pháp an toàn là cực kỳ quan trọng để đối phó với các mối đe dọa ngày càng gia tăng này.

Anthropic cam kết tiếp tục chia sẻ thông tin về các mối đe dọa mà họ phát hiện để giúp cộng đồng an ninh mạng củng cố hệ thống phòng thủ.

Chỉnh sửa ngày 14 tháng 11 năm 2025:

Thêm liên kết đến báo cáo đầy đủ ở phần đầu.
Sửa lỗi về tốc độ tấn công: không còn là “hàng nghìn yêu cầu mỗi giây” mà là “hàng nghìn yêu cầu, thường là nhiều yêu cầu mỗi giây”.

AI Today - SkyAI