Bài viết này do AI tạo ra, có thể mắc sai sót.
Điểm khác biệt lớn nhất của Cyber Defense Benchmark so với các bài test bảo mật AI trước đây: nó không dùng câu hỏi trắc nghiệm hay dataset tĩnh. Thay vào đó, AI được đặt vào môi trường doanh nghiệp mô phỏng với dữ liệu telemetry thật, phải tự đọc log, đặt giả thuyết, truy vết tấn công và xác định mối đe doạ — giống hệt cách một chuyên gia SOC (Security Operations Center) làm việc hằng ngày.
Benchmark bao gồm hàng chục kỹ thuật tấn công theo framework MITRE ATT&CK, trải qua nhiều giai đoạn, buộc AI phải kết nối tín hiệu xuyên suốt thời gian và nhiều hệ thống. Bài test cũng thay đổi ngữ cảnh liên tục để tránh AI "học thuộc" pattern.
Kết quả rất đáng lo: Claude Opus 4.6 (model mạnh nhất trong bài test) chỉ phát hiện được một phần bằng chứng tấn công. Nhiều model khác thậm chí bỏ sót toàn bộ các loại hoạt động độc hại. Nghiên cứu học thuật độc lập cũng xác nhận: ngay cả model hàng đầu cũng chỉ phát hiện được một phần nhỏ sự kiện độc hại trong kịch bản thực tế.
Nói cách khác: AI hiện tại rất giỏi trả lời câu hỏi có cấu trúc, nhưng khi phải tự điều tra chuỗi tấn công phức tạp, liên tục thay đổi và không có hướng dẫn trước — chúng gần như bất lực.
Đây là phát hiện đáng lo ngại nhất. Các nghiên cứu gần đây cho thấy AI frontier đã có thể thực hiện tấn công mạng nhiều bước trong môi trường mô phỏng, với rất ít công cụ hỗ trợ. Trong khi đó, khả năng phòng thủ lại tụt hậu rõ rệt.
Hệ quả: kẻ tấn công có thể dùng AI để tự động hoá và mở rộng quy mô tấn công, còn bên phòng thủ vẫn phải dựa vào chuyên gia con người và công cụ rời rạc. Ngay cả khi AI phát hiện lỗ hổng, nó có thể đánh giá sai mức độ nghiêm trọng hoặc không biết xử lý đúng cách — cho thấy khoảng cách giữa "phát hiện" và "hiểu" vẫn rất lớn.
Kết luận của Simbian không phải "AI vô dụng cho bảo mật", mà là AI không thể làm một mình. Model cần được trang bị thêm:
Simbian cho biết khi kết hợp model với các lớp hỗ trợ này, độ chính xác phát hiện tăng đáng kể so với dùng model "trần". Điều này phù hợp với xu hướng chung: sức mạnh model chỉ là một phần, phần còn lại nằm ở cách thiết kế hệ thống xung quanh nó.
Benchmark này là lời cảnh tỉnh cho ai nghĩ rằng cứ gắn AI vào SOC là xong. Thực tế cho thấy: AI tấn công đang tiến nhanh hơn AI phòng thủ, và khoảng cách này sẽ ngày càng nguy hiểm nếu không được giải quyết. Đối với doanh nghiệp, bài học rõ ràng: đừng mua AI bảo mật chỉ vì nó dùng model "frontier" — hãy hỏi nó được tích hợp như thế nào, có workflow phòng thủ ra sao, và con người đóng vai trò gì trong chuỗi quyết định.