Trong một năm, Anthropic đã phân tích 832 trường hợp lạm dụng AI cho mục đích tấn công mạng, từ viết mã độc đến xâm nhập sâu vào hệ thống. Báo cáo này không chỉ vạch trần các chiến thuật mới của tin tặc mà còn chỉ ra những lỗ hổng trong các khung phòng thủ hiện tại như MITRE ATT&CK, đặt ra yêu cầu cấp thiết về việc phải suy nghĩ lại cách chúng ta bảo vệ không gian mạng.
Bài viết được biên tập + bổ sung research từ nhiều nguồn. Đọc bài gốc tại Anthropic News →

Anthropic chính thức công khai chương trình tiền thưởng tìm lỗi bảo mật (bug bounty) trên nền tảng HackerOne, mời gọi cộng đồng hacker toàn cầu tham gia. Sau giai đoạn thử nghiệm riêng tư thành công, động thái này mở ra cơ hội cho bất kỳ ai cũng có thể báo cáo lỗ hổng trong các mô hình AI như Claude và nhận phần thưởng giá trị, đánh dấu một bước tiến quan trọng trong việc xây dựng AI an toàn và minh bạch.
07/05/2026

Anthropic và Amazon vừa công bố mở rộng hợp tác chiến lược, một bước đi quan trọng trong cuộc đua AI. Với cam kết hạ tầng trị giá 100 tỷ USD và khoản đầu tư lên tới 25 tỷ USD từ Amazon, Anthropic sẽ có thêm 5 gigawatt năng lực tính toán. Thỏa thuận này không chỉ củng cố vị thế của Claude trên nền tảng AWS mà còn hứa hẹn nâng cao hiệu suất và khả năng tiếp cận cho người dùng toàn cầu.
04/05/2026
Research powered by Tavily.

Anthropic và NEC đang hợp tác để xây dựng một trong những lực lượng kỹ sư AI lớn nhất Nhật Bản. NEC sẽ tích hợp Claude vào các hoạt động nội bộ và phát triển các sản phẩm AI chuyên biệt cho thị trường Nhật Bản, đặc biệt trong các lĩnh vực tài chính, sản xuất và chính phủ địa phương. Sự hợp tác này nhằm mục đích đáp ứng các tiêu chuẩn cao về an toàn, độ tin cậy và chất lượng.
04/05/2026

AI đang giúp tin tặc tự động hóa các công đoạn phức tạp và thực hiện những kỹ thuật tấn công tinh vi mà trước đây chỉ dành cho chuyên gia. Thay vì chỉ dùng AI cho các bước chuẩn bị, kẻ xấu ngày càng ứng dụng nó vào sâu bên trong chu trình tấn công, làm tăng mức độ nguy hiểm tổng thể của các chiến dịch và xóa nhòa ranh giới kỹ năng.
Trong một nghiên cứu kéo dài từ tháng 3 năm 2025 đến tháng 3 năm 2026, Anthropic đã phân tích 832 tài khoản bị cấm vì hoạt động mạng độc hại. Kết quả cho thấy một bức tranh đáng lo ngại về cách AI đang được vũ khí hóa. Theo Anthropic News (2026), có tới 67.3% số tài khoản được nghiên cứu đã sử dụng AI để viết mã độc. Con số này cho thấy AI đã trở thành một công cụ phổ biến cho giai đoạn chuẩn bị tấn công.
Tuy nhiên, điều đáng báo động hơn là việc AI được sử dụng cho các hoạt động phức tạp hơn. Chẳng hạn, 6.5% các tác nhân đã dùng AI để hỗ trợ "di chuyển ngang" (lateral movement) - một kỹ thuật tinh vi để điều hướng sâu bên trong một mạng đã bị xâm nhập. Trước đây, những kỹ thuật như vậy đòi hỏi kiến thức chuyên sâu và nhiều công sức. Giờ đây, AI đang hạ thấp rào cản đó.

Sự gia tăng mức độ nguy hiểm được thể hiện qua các con số cụ thể. Trong sáu tháng đầu của giai đoạn phân tích, 33% các tác nhân độc hại được phân loại có rủi ro từ trung bình trở lên. Theo Anthropic News (2026), con số này đã tăng vọt lên 56% trong sáu tháng tiếp theo. Sự gia tăng gần 1.7 lần này cho thấy tin tặc không chỉ sử dụng AI nhiều hơn mà còn sử dụng nó hiệu quả hơn để gia tăng mối đe dọa. Như nhận định của Vietnamnet (2026), sự phát triển không kiểm soát của các mô hình AI có thể trở thành một "cơn ác mộng" đối với an ninh mạng toàn cầu.
Ban đầu, AI được dùng nhiều nhất cho giai đoạn chuẩn bị, như viết mã độc. Tuy nhiên, xu hướng đang dịch chuyển rõ rệt. Tin tặc ngày càng dùng AI cho các hoạt động "hậu xâm nhập" (post-compromise) như khám phá tài khoản trong hệ thống bị tấn công. Điều này cho thấy AI đang được tích hợp sâu hơn vào các giai đoạn cốt lõi của một cuộc tấn công mạng.
Nghiên cứu của Anthropic đã chỉ ra một sự thay đổi chiến thuật đáng chú ý. Việc sử dụng AI cho các email lừa đảo (phishing), một kỹ thuật phổ biến để giành quyền truy cập ban đầu, đã giảm 8.6% trong giai đoạn nghiên cứu. Ngược lại, việc sử dụng AI để khám phá tài khoản (account discovery) - tức là xác định các tài khoản hợp lệ bên trong một môi trường đã bị xâm nhập - lại tăng 8.9%. Theo Anthropic News (2026), sự dịch chuyển này cho thấy tin tặc đang ngày càng áp dụng AI sâu hơn trong vòng đời tấn công.

Những kỹ thuật hậu xâm nhập này từng là lãnh địa của các nhóm tin tặc có tổ chức và kỹ năng cao. Chúng đòi hỏi sự kiên nhẫn, kiến thức sâu về mạng và khả năng ẩn mình. Giờ đây, AI có thể thực hiện các hoạt động này thay cho những kẻ tấn công ít tinh vi hơn. Một kẻ tấn công nghiệp dư có thể yêu cầu AI quét toàn bộ mạng nội bộ, tìm kiếm các tài khoản có đặc quyền cao, và liệt kê các lỗ hổng tiềm tàng. Điều này làm gia tăng đáng kể bề mặt tấn công và rút ngắn thời gian từ lúc xâm nhập đến lúc gây ra thiệt hại thực sự.
Các chuyên gia an ninh mạng từ lâu đã lo ngại về khả năng AI tự động hóa toàn bộ chuỗi tấn công. Theo IBM (2026), khả năng mở rộng quy mô và tự động hóa của AI là yếu tố làm thay đổi sâu sắc bối cảnh an ninh mạng. Dữ liệu từ Anthropic cho thấy nỗi lo này đang dần trở thành hiện thực.
Các phương pháp truyền thống để đánh giá rủi ro, như dựa vào số lượng kỹ thuật hay công cụ tin tặc sử dụng, đang trở nên lỗi thời. Giờ đây, AI có thể thực hiện các nhiệm vụ kỹ thuật cao thay cho kẻ tấn công. Điều này xóa nhòa mối tương quan giữa kỹ năng thực tế của tin tặc và mức độ nguy hiểm mà họ gây ra cho hệ thống.
Trước đây, các đội ngũ an ninh có thể phần nào đánh giá mức độ nghiêm trọng của một mối đe dọa bằng cách phân tích sự phức tạp của cuộc tấn công. Một cuộc tấn công sử dụng nhiều kỹ thuật tinh vi thường được cho là đến từ một tác nhân có kỹ năng cao và nguồn lực dồi dào. Tuy nhiên, phân tích của Anthropic cho thấy các tín hiệu này không còn đáng tin cậy. Một tin tặc có kỹ năng thấp giờ đây có thể sử dụng một mô hình AI để thực hiện một chuỗi tấn công phức tạp mà họ không thực sự hiểu rõ.

Thực tế này được chứng minh qua sự gia tăng đột biến của các tác nhân nguy hiểm. Như đã đề cập, tỷ lệ các tác nhân được xếp hạng rủi ro từ trung bình đến cao đã tăng từ 33% lên 56% chỉ trong vòng sáu tháng vào cuối năm 2025. Theo Anthropic News (2026), điều này cho thấy các phương pháp đánh giá rủi ro cũ không còn hiệu quả trong việc phân biệt các mối đe dọa. Một hệ thống phòng thủ có thể đánh giá thấp một cuộc tấn công chỉ vì nó có vẻ được thực hiện một cách vụng về, trong khi thực chất có một AI mạnh mẽ đang điều khiển phía sau.
Các chuyên gia công nghệ cũng đồng tình với nhận định này. Theo Twit.tv (2026), các công cụ AI như Claude đang định hình lại tương lai của phần mềm, và điều này cũng đúng với cả phần mềm độc hại. Việc AI có thể tự động xâu chuỗi các phần của cuộc tấn công có nghĩa là cách phòng thủ truyền thống, vốn tập trung vào việc chặn từng kỹ thuật riêng lẻ, sẽ không còn đủ hiệu quả.
Khung MITRE ATT&CK, một cơ sở dữ liệu uy tín về chiến thuật của tin tặc, hiện không còn phản ánh đầy đủ các mối đe dọa do AI hỗ trợ. Báo cáo của Anthropic chỉ ra rằng các công cụ và hoạt động mới do AI tạo ra chưa được ghi nhận trong khung này. Điều này tạo ra một "điểm mù" trong hệ thống phòng thủ và phân tích an ninh mạng hiện tại.
MITRE ATT&CK là một kiến thức nền tảng toàn cầu về các chiến thuật và kỹ thuật của đối thủ dựa trên quan sát thực tế. Các tổ chức an ninh trên toàn thế giới dựa vào nó để phát triển các mô hình mối đe dọa và phương pháp phòng thủ cụ thể. Tuy nhiên, khi Anthropic cố gắng ánh xạ 832 trường hợp tấn công bằng AI vào khung này, họ đã phát hiện ra những thiếu sót đáng kể.
Vấn đề cốt lõi là ATT&CK được thiết kế để mô tả hành động của con người, hoặc các công cụ do con người trực tiếp điều khiển. Nó không được xây dựng để nắm bắt các hành vi mới do AI tạo ra. Ví dụ, một AI có thể tự động thử nghiệm hàng ngàn biến thể mã độc khác nhau trong vài phút để tìm ra phiên bản có thể vượt qua phần mềm chống virus. Hành động này rất khó để mô tả bằng các kỹ thuật hiện có trong ATT&CK. Theo báo cáo của Anthropic (2026), khung này không nắm bắt đầy đủ các công cụ và hoạt động làm cho những kẻ tấn công được hỗ trợ bởi AI trở nên nguy hiểm.

Sự thiếu hụt này có hậu quả nghiêm trọng. Nếu các đội an ninh chỉ dựa vào ATT&CK để xây dựng hệ thống phòng thủ, họ có thể bỏ lỡ các dấu hiệu tấn công tinh vi của AI. Điều này tạo ra một cảm giác an toàn giả tạo, trong khi kẻ tấn công đang khai thác những điểm mù mà các hệ thống giám sát không thể nhìn thấy. Việc 67.3% kẻ tấn công dùng AI viết mã độc (Theo Anthropic News, 2026) cho thấy quy mô của vấn đề mà các hệ thống phòng thủ dựa trên signature truyền thống phải đối mặt.
Để phòng thủ hiệu quả, chúng ta cần một cách tiếp cận đa chiều. Điều này bao gồm việc liên tục nghiên cứu và lập bản đồ các mối đe dọa mới, cập nhật các khung an ninh như MITRE ATT&CK, và phát triển công cụ giám sát có khả năng phát hiện hành vi bất thường do AI thực hiện. Sự hợp tác giữa các công ty AI và cộng đồng an ninh là chìa khóa.
Trước hết, cần có thêm các nghiên cứu như báo cáo của Anthropic. Việc chủ động lập bản đồ các cách thức AI có thể bị lạm dụng, được thực hiện bởi các nhóm như Frontier Red Team của Anthropic, là vô cùng quan trọng. Thay vì chờ đợi các cuộc tấn công xảy ra, các nhóm này mô phỏng các kịch bản tấn công để tìm ra lỗ hổng và phương pháp phòng thủ trước. Đây là một cách tiếp cận chủ động để đi trước tin tặc một bước.
Thứ hai, các khung kiến thức chung như MITRE ATT&CK cần được cập nhật khẩn trương. Cần có sự hợp tác giữa các công ty AI như Anthropic và các tổ chức như MITRE để bổ sung các kỹ thuật và chiến thuật mới liên quan đến AI. Điều này sẽ giúp toàn bộ ngành an ninh mạng có một ngôn ngữ chung và một cơ sở kiến thức thống nhất để đối phó với các mối đe dọa mới.

Cuối cùng, cần phát triển các công nghệ phòng thủ thế hệ mới. Các hệ thống phòng thủ không thể chỉ dựa vào việc phát hiện các chữ ký mã độc đã biết. Thay vào đó, chúng cần tập trung vào việc phân tích hành vi. Các hệ thống giám sát được tăng cường bởi AI có thể học hỏi các mẫu hành vi bình thường của một mạng và cảnh báo khi có bất kỳ hoạt động bất thường nào, ngay cả khi nó không khớp với bất kỳ mẫu tấn công đã biết nào. Việc 56% tác nhân độc hại được xếp hạng rủi ro cao vào cuối năm 2025 (Theo Anthropic News, 2026) nhấn mạnh sự cấp thiết của việc này. Cuộc chạy đua vũ trang giữa tấn công và phòng thủ mạng đã bước sang một kỷ nguyên mới, và AI đang ở trung tâm của cuộc chiến đó.