Sau thời gian tạm ngưng do lệnh kiểm soát xuất khẩu của Mỹ, mô hình AI Fable 5 của Anthropic đã chính thức được triển khai lại trên toàn cầu từ ngày 1/7/2026. Quan trọng hơn, sự kiện này thúc đẩy Anthropic cùng các đối tác công nghệ hàng đầu như Amazon, Google và Microsoft đề xuất một khuôn khổ chung toàn ngành để đánh giá và xử lý các cuộc tấn tấn công jailbreak, một bước tiến quan trọng cho an toàn AI.
Bài viết được biên tập + bổ sung research từ nhiều nguồn. Đọc bài gốc tại Anthropic News →

Anthropic đã bổ nhiệm Vas Narasimhan, CEO của Novartis, vào Hội đồng Quản trị thông qua Quỹ Tín thác Lợi ích Dài hạn. Động thái chiến lược này nhấn mạnh cam kết của Anthropic trong việc phát triển AI một cách an toàn và có trách nhiệm, đặc biệt là trong các lĩnh vực y tế và khoa học sự sống, đồng thời củng cố cấu trúc quản trị độc đáo của công ty.
04/05/2026

Anthropic vừa ra mắt Claude Opus 4.7, một phiên bản cải tiến đáng kể so với Opus 4.6, đặc biệt trong lĩnh vực kỹ thuật phần mềm và khả năng thị giác. Mô hình này có thể xử lý các tác vụ mã hóa phức tạp, chú ý đến hướng dẫn và tự kiểm tra đầu ra. Opus 4.7 cũng tích hợp các biện pháp bảo vệ an ninh mạng tiên tiến, đồng thời duy trì mức giá như phiên bản trước.
04/05/2026

Research powered by Tavily.
Anthropic và Amazon vừa công bố mở rộng hợp tác chiến lược, một bước đi quan trọng trong cuộc đua AI. Với cam kết hạ tầng trị giá 100 tỷ USD và khoản đầu tư lên tới 25 tỷ USD từ Amazon, Anthropic sẽ có thêm 5 gigawatt năng lực tính toán. Thỏa thuận này không chỉ củng cố vị thế của Claude trên nền tảng AWS mà còn hứa hẹn nâng cao hiệu suất và khả năng tiếp cận cho người dùng toàn cầu.
04/05/2026

Fable 5 là một mô hình AI thế hệ mới của Anthropic, được thiết kế với các lớp bảo vệ mạnh mẽ để sử dụng rộng rãi. Nó đã bị tạm ngưng truy cập toàn cầu vào ngày 12 tháng 6 năm 2026 do lệnh kiểm soát xuất khẩu của chính phủ Mỹ. Lệnh này được ban hành sau khi các nhà nghiên cứu của Amazon phát hiện ra một phương pháp vượt qua hàng rào bảo vệ của Fable 5.
Cụ thể, phương pháp này cho phép mô hình xác định các lỗ hổng phần mềm, một khả năng có thể bị lạm dụng. Do không có cách xác minh quốc tịch người dùng theo thời gian thực, Anthropic đã phải tạm dừng quyền truy cập đối với tất cả người dùng để tuân thủ quy định. Sự kiện này diễn ra chỉ ba ngày sau khi Fable 5 và Mythos 5 (một phiên bản ít lớp bảo vệ hơn dành cho nghiên cứu an ninh mạng) được ra mắt. Theo Anthropic News (2026), sự cố này đã nhấn mạnh sự cần thiết của các quy trình an toàn nghiêm ngặt. Tốc độ tăng trưởng chóng mặt của Anthropic, với doanh thu dự kiến hàng năm vượt 30 tỷ đô la vào cuối năm 2026, tăng từ 9 tỷ đô la vào cuối năm 2025, cho thấy tầm quan trọng của việc duy trì niềm tin và an toàn.


Anthropic đã hành động nhanh chóng để cập nhật các biện pháp bảo vệ và khắc phục lỗ hổng được phát hiện. Công ty đã tinh chỉnh các bộ phân loại an toàn để ngăn chặn kỹ thuật tấn công cụ thể. Sau khi chứng minh hiệu quả của các bản vá này với chính phủ Mỹ, lệnh kiểm soát xuất khẩu đã được dỡ bỏ vào ngày 30 tháng 6 năm 2026, mở đường cho việc triển khai lại.
Quá trình này cho thấy khả năng phản ứng nhanh nhạy của Anthropic. Công ty đã làm việc chặt chẽ với các cơ quan chính phủ để đảm bảo các mô hình của mình tuân thủ các tiêu chuẩn an toàn cao nhất. Theo Anthropic News (2026), các biện pháp bảo vệ mới đã được xác minh là có thể chặn kỹ thuật được báo cáo trong hơn 99% các trường hợp. Sự hợp tác hiệu quả này cho phép Fable 5 trở lại với người dùng toàn cầu chỉ sau hơn hai tuần bị hạn chế. Theo Fortune (2026), cách tiếp cận chủ động của Anthropic trong việc giải quyết các vấn đề an toàn tiềm ẩn đã giúp họ giải quyết tình hình một cách xây dựng và nhanh chóng.

Đây là một sáng kiến do Anthropic đề xuất cùng với các đối tác lớn như Amazon, Microsoft và Google. Mục tiêu là tạo ra một tiêu chuẩn chung để đánh giá mức độ nghiêm trọng của các cuộc tấn công jailbreak. Khuôn khổ này sẽ giúp các nhà phát triển AI phân loại rủi ro, ưu tiên các bản vá lỗi và truyền đạt thông tin về mối đe dọa một cách nhất quán.
Hiện tại, ngành AI thiếu một ngôn ngữ chung để mô tả các lỗ hổng. Điều này gây khó khăn trong việc phối hợp và ứng phó. Lấy cảm hứng từ Hệ thống Chấm điểm Lỗ hổng Chung (CVSS) trong an ninh mạng, khuôn khổ mới sẽ cung cấp một thang đo tiêu chuẩn. Theo FinancialJuice trên X (2026), sự hợp tác này quy tụ những gã khổng lồ công nghệ để giải quyết một thách thức chung, thể hiện sự trưởng thành của ngành. Việc các công ty lớn như Microsoft và Google xác nhận Claude vẫn có sẵn cho khách hàng ngoài lĩnh vực quốc phòng vào năm 2026 nhấn mạnh tầm quan trọng của các tiêu chuẩn an toàn rõ ràng.


Người dùng trên toàn cầu có thể truy cập lại Fable 5 từ ngày 1 tháng 7 năm 2026. Mô hình này có sẵn trên các nền tảng của Anthropic như Claude.ai, Claude Code và Claude Cowork. Đối với người dùng các gói trả phí Pro, Max và Team, Fable 5 được tích hợp vào giới hạn sử dụng hàng tuần cho đến ngày 7 tháng 7, sau đó sẽ được cung cấp qua tín dụng.
Sự trở lại này mang đến cho người dùng quyền truy cập vào một trong những mô hình AI tiên tiến nhất hiện nay. Anthropic cũng đang nỗ lực để đưa Fable 5 lên các nền tảng đám mây lớn. Theo Anthropic News (2026), quyền truy cập trên AWS, Google Cloud và Microsoft Foundry sẽ được kích hoạt lại nhanh nhất có thể. Đặc biệt, trong tuần đầu tiên, người dùng các gói trả phí có thể sử dụng Fable 5 cho tới 50% giới hạn sử dụng hàng tuần của họ trong năm 2026. Điều này cho phép một lượng lớn người dùng trải nghiệm sức mạnh của mô hình mới mà không tốn thêm chi phí.


Sự hợp tác này thể hiện một bước tiến lớn trong việc quản lý rủi ro AI một cách có trách nhiệm. Nó quy tụ các đối thủ cạnh tranh để giải quyết một thách thức chung về an toàn, thay vì hành động đơn lẻ. Các khoản đầu tư khổng lồ từ Google và Amazon vào Anthropic củng cố niềm tin vào cách tiếp cận ưu tiên an toàn của công ty, định vị Claude là một lựa chọn đáng tin cậy.
Sự kiện này không chỉ là về việc sửa một lỗi. Nó còn là chất xúc tác cho sự hợp tác sâu rộng hơn trong khuôn khổ Project Glasswing. Theo một báo cáo trên YouTube (2026), Google đã cam kết đầu tư lên tới 40 tỷ đô la vào Anthropic, trong khi Amazon cũng cam kết 25 tỷ đô la. Những con số này cho thấy AI an toàn không chỉ là một yêu cầu kỹ thuật mà còn là một lợi thế chiến lược. Theo The Last Watchdog (2026), việc ngành công nghiệp tự giác thiết lập các tiêu chuẩn an toàn là một dấu hiệu tích cực, cho thấy sự chủ động trong việc quản lý rủi ro thay vì chờ đợi các quy định từ bên ngoài.
Sự kiện Fable 5 và khuôn khổ đánh giá jailbreak được đề xuất sẽ định hình lại tương lai của an toàn AI. Nó thúc đẩy ngành công nghiệp hướng tới một cách tiếp cận minh bạch và hợp tác hơn. Thay vì giữ kín các lỗ hổng, các công ty được khuyến khích chia sẻ thông tin để cùng nhau xây dựng hệ thống phòng thủ vững chắc hơn cho toàn ngành.
Trong tương lai, chúng ta có thể mong đợi các quy trình kiểm tra trước khi phát hành sẽ nghiêm ngặt hơn. Việc chia sẻ thông tin về các mối đe dọa và kỹ thuật tấn công sẽ trở nên phổ biến. Anthropic đang tăng cường hợp tác với chính phủ Mỹ về thử nghiệm, chia sẻ thông tin và nghiên cứu. Theo Anthropic News (2026), công ty cam kết chia sẻ chuyên môn về red-teaming để thúc đẩy sự phát triển của ngành đánh giá AI. Sự thay đổi này không chỉ giúp các mô hình như Claude an toàn hơn mà còn xây dựng niềm tin của công chúng vào công nghệ AI nói chung.