Chỉ trong tháng đầu tiên, Dự án Glasswing, sáng kiến an ninh mạng AI của Anthropic, đã gây chấn động khi phát hiện hơn 10.000 lỗ hổng nghiêm trọng trong các phần mềm thiết yếu. Sử dụng mô hình Claude Mythos tiên tiến, dự án này không chỉ chứng tỏ sức mạnh vượt trội của AI trong việc bảo vệ hạ tầng số mà còn mở ra một kỷ nguyên mới về an ninh chủ động, nơi máy móc và con người hợp tác để vá các lỗ hổng trước khi chúng bị khai thác.
Bài viết được biên tập + bổ sung research từ nhiều nguồn. Đọc bài gốc tại Twitter / X →

Dự án Glasswing là một sáng kiến an ninh mạng hợp tác do Anthropic dẫn đầu, nhằm sử dụng trí tuệ nhân tạo để tìm và sửa các lỗ hổng trong phần mềm mã nguồn mở quan trọng. Mục tiêu chính là tăng cường an ninh cho hạ tầng kỹ thuật số toàn cầu bằng cách chủ động xác định các điểm yếu trước khi tin tặc có thể khai thác chúng, góp phần xây dựng một hệ sinh thái công nghệ an toàn hơn.
Trong một thông báo quan trọng, Anthropic đã chia sẻ kết quả ban đầu đầy ấn tượng. "Tháng trước, chúng tôi đã khởi động Project Glasswing, sáng kiến an ninh mạng AI hợp tác của mình. Kể từ đó, chúng tôi và các đối tác đã tìm thấy hơn mười nghìn lỗ hổng có mức độ nghiêm trọng cao hoặc cực kỳ nghiêm trọng trong các phần mềm thiết yếu," theo Anthropic trên X (2026). Con số này cho thấy quy mô và tiềm năng to lớn của việc áp dụng AI vào lĩnh vực bảo mật. Dự án không chỉ dừng lại ở việc phát hiện mà còn hướng tới việc tạo ra các bản vá tự động, giảm bớt gánh nặng cho các nhà phát triển và bảo trì phần mềm. Theo Anthropic (2026), sự hợp tác giữa các nhà nghiên cứu, người bảo trì mã nguồn mở và chính phủ đóng vai trò thiết yếu trong nỗ lực chung này.


Trí tuệ nhân tạo, đặc biệt là mô hình Claude Mythos, đã chứng tỏ hiệu quả vượt trội trong việc phát hiện lỗ hổng. Nó có khả năng phân tích mã nguồn ở quy mô lớn và xác định các mẫu phức tạp mà con người có thể bỏ sót. Chỉ trong tháng đầu tiên, dự án đã phát hiện hơn 10.000 lỗ hổng nghiêm trọng, một con số mà các nhóm chuyên gia bảo mật phải mất nhiều năm mới có thể đạt được.
Sức mạnh này được thể hiện rõ qua các bài kiểm tra hiệu suất. Theo dữ liệu từ Anthropic (2026), mô hình Mythos Preview đạt tỷ lệ tái tạo thành công lỗ hổng bảo mật lên tới 83.1% trong môi trường CyberGym, vượt xa con số 66.6% của mô hình Opus 4.6 mạnh mẽ trước đó. Sự chênh lệch này cho thấy một bước nhảy vọt về khả năng suy luận và phân tích mã của AI. Theo Futurum Group (2026), việc AI đạt đến ngưỡng hiệu suất này đánh dấu một sự thay đổi cơ bản trong cách tiếp cận bảo mật ứng dụng. Nó cho phép các tổ chức chuyển từ thế bị động sang chủ động, tìm và vá lỗ hổng trước khi chúng trở thành mối đe dọa thực sự.


Việc sử dụng AI trong an ninh mạng là cực kỳ quan trọng vì nó giải quyết được hai thách thức lớn: quy mô và tốc độ. Hệ sinh thái phần mềm hiện đại vô cùng phức tạp với hàng tỷ dòng mã, tạo ra một bề mặt tấn công khổng lồ. AI có thể quét và phân tích lượng mã này nhanh hơn con người hàng nghìn lần, giúp phát hiện lỗ hổng ở quy mô lớn và với tốc độ chưa từng có.
Tội phạm mạng đang gây ra thiệt hại kinh tế khổng lồ trên toàn cầu. Theo Anthropic (2026), các mô hình AI tiên tiến hiện nay đang trở nên cạnh tranh với những chuyên gia giỏi nhất trong việc tìm và khai thác lỗ hổng. Điều này có nghĩa là các tác nhân xấu cũng có thể sử dụng AI. Do đó, việc phát triển các AI phòng thủ như Claude Mythos là một cuộc chạy đua vũ trang công nghệ. Theo CyberScoop (2026), sáng kiến này cho thấy các gã khổng lồ công nghệ đang nghiêm túc trong việc dùng AI để củng cố các phần mềm mã nguồn mở vốn là nền tảng của internet. Việc tự động hóa quá trình săn lùng lỗ hổng giúp giải phóng các chuyên gia con người để họ tập trung vào các mối đe dọa phức tạp hơn.
Claude Mythos là một mô hình AI tiên phong được Anthropic phát triển đặc biệt cho các tác vụ phức tạp như an ninh mạng. Điểm đặc biệt của nó là khả năng suy luận đa bước, sử dụng công cụ và tự sửa lỗi trong quá trình làm việc. Nó không chỉ đọc mã mà còn hiểu được ngữ cảnh, logic và các tương tác tiềm ẩn có thể dẫn đến lỗ hổng, kể cả các lỗ hổng zero-day tồn tại hàng chục năm.
Hiệu suất của Mythos thực sự đáng kinh ngạc. Trong bộ kiểm tra SWE-bench Verified, một thước đo tiêu chuẩn về khả năng sửa lỗi kỹ thuật phần mềm, Mythos Preview đã đạt điểm số lên tới 93.9% (theo anthropic.com, 2026). Đây là một kết quả vượt trội, cho thấy khả năng của nó gần như tương đương với các kỹ sư phần mềm chuyên nghiệp trong một số tác vụ. Tuy nhiên, chính vì sức mạnh này mà Mythos mang tính lưỡng dụng. Theo NBC News (2026), Anthropic đã quyết định không phát hành rộng rãi mô hình này do lo ngại nó có thể bị lạm dụng để tự động tìm và khai thác lỗ hổng cho mục đích xấu. Thay vào đó, họ chỉ cung cấp quyền truy cập cho các đối tác tin cậy trong khuôn khổ Dự án Glasswing.

Sự hợp tác là nền tảng cốt lõi của Dự án Glasswing, bởi không một tổ chức nào có thể đơn độc bảo vệ toàn bộ hệ sinh thái kỹ thuật số. Anthropic đã quy tụ các đối tác hàng đầu từ nhiều lĩnh vực, bao gồm các công ty công nghệ lớn, các chuyên gia an ninh mạng và cộng đồng mã nguồn mở. Cách tiếp cận này giúp tối đa hóa tác động và đảm bảo các lỗ hổng được xử lý một cách có trách nhiệm.
Mỗi đối tác mang đến một thế mạnh riêng. Chẳng hạn, các công ty như Google và Microsoft cung cấp hạ tầng đám mây và chuyên môn về bảo mật sản phẩm. Các công ty an ninh mạng như CrowdStrike và Palo Alto Networks đóng góp kiến thức sâu rộng về các mối đe dọa. Theo CrowdStrike (2026), với tư cách là thành viên sáng lập, họ nhấn mạnh tầm quan trọng của việc hợp tác để khai thác sức mạnh của AI tiên tiến nhằm bảo vệ hệ sinh thái. Để đảm bảo khả năng phân tích sâu, Anthropic (2026) cho biết mỗi tác vụ trong dự án có ngân sách lên tới 1 triệu token. Sự phối hợp này tạo ra một vòng lặp tích cực: AI phát hiện lỗ hổng, các chuyên gia xác minh và các nhà bảo trì mã nguồn mở tạo ra bản vá, giúp củng cố toàn bộ cộng đồng.

Tương lai của an ninh mạng với AI hứa hẹn một sự chuyển đổi từ phòng thủ bị động sang bảo vệ chủ động và dự đoán. Thay vì chỉ phản ứng sau khi một cuộc tấn công xảy ra, các hệ thống AI như Claude Mythos sẽ liên tục rà soát mã nguồn và cơ sở hạ tầng để tìm kiếm và vá các điểm yếu tiềm tàng. Điều này sẽ làm giảm đáng kể bề mặt tấn công cho tin tặc.
Các mô hình AI sẽ ngày càng trở nên tự chủ hơn, hoạt động như những "nhà phân tích bảo mật tự động" làm việc 24/7. Trong các bài kiểm tra chuyên sâu, Mythos Preview đạt hiệu suất 92.1% khi được cung cấp thêm thời gian xử lý (theo anthropic.com, 2026), cho thấy tiềm năng khi AI được tối ưu hóa. Theo Channel Insider (2026), sự phát triển này báo hiệu một sự thay đổi lớn cho các nhà cung cấp dịch vụ công nghệ, đòi hỏi họ phải tích hợp các giải pháp an ninh do AI điều khiển vào danh mục sản phẩm của mình. Cuối cùng, sự kết hợp giữa trí tuệ con người và sức mạnh tính toán của AI sẽ tạo ra một lớp phòng thủ vững chắc hơn bao giờ hết cho thế giới số.

Anthropic đã bổ nhiệm Vas Narasimhan, CEO của Novartis, vào Hội đồng Quản trị thông qua Quỹ Tín thác Lợi ích Dài hạn. Động thái chiến lược này nhấn mạnh cam kết của Anthropic trong việc phát triển AI một cách an toàn và có trách nhiệm, đặc biệt là trong các lĩnh vực y tế và khoa học sự sống, đồng thời củng cố cấu trúc quản trị độc đáo của công ty.
04/05/2026

Anthropic vừa ra mắt Claude Opus 4.7, một phiên bản cải tiến đáng kể so với Opus 4.6, đặc biệt trong lĩnh vực kỹ thuật phần mềm và khả năng thị giác. Mô hình này có thể xử lý các tác vụ mã hóa phức tạp, chú ý đến hướng dẫn và tự kiểm tra đầu ra. Opus 4.7 cũng tích hợp các biện pháp bảo vệ an ninh mạng tiên tiến, đồng thời duy trì mức giá như phiên bản trước.
04/05/2026

Anthropic và Amazon vừa công bố mở rộng hợp tác chiến lược, một bước đi quan trọng trong cuộc đua AI. Với cam kết hạ tầng trị giá 100 tỷ USD và khoản đầu tư lên tới 25 tỷ USD từ Amazon, Anthropic sẽ có thêm 5 gigawatt năng lực tính toán. Thỏa thuận này không chỉ củng cố vị thế của Claude trên nền tảng AWS mà còn hứa hẹn nâng cao hiệu suất và khả năng tiếp cận cho người dùng toàn cầu.
04/05/2026

Anthropic và NEC đang hợp tác để xây dựng một trong những lực lượng kỹ sư AI lớn nhất Nhật Bản. NEC sẽ tích hợp Claude vào các hoạt động nội bộ và phát triển các sản phẩm AI chuyên biệt cho thị trường Nhật Bản, đặc biệt trong các lĩnh vực tài chính, sản xuất và chính phủ địa phương. Sự hợp tác này nhằm mục đích đáp ứng các tiêu chuẩn cao về an toàn, độ tin cậy và chất lượng.
04/05/2026