Gần đây, cộng đồng lập trình viên ghi nhận chất lượng Claude Code sụt giảm. Anthropic đã điều tra và xác định ba thay đổi kỹ thuật là nguyên nhân: nỗ lực suy luận, bộ nhớ phiên và lệnh hệ thống. Bài viết này phân tích sâu từng sự cố, các giải pháp đã triển khai và cam kết của Anthropic nhằm đảm bảo chất lượng mô hình ổn định.
Bài viết được biên tập + bổ sung research từ nhiều nguồn. Đọc bài gốc tại Anthropic Engineering →

Anthropic đã xác định ba thay đổi kỹ thuật riêng biệt là nguyên nhân chính gây ra sự sụt giảm chất lượng của Claude Code. Các sự cố này bao gồm việc giảm mức độ suy luận mặc định, một lỗi trong cơ chế xóa bộ nhớ phiên và một lệnh hệ thống mới nhằm giảm tính dài dòng. Những thay đổi này, diễn ra vào các thời điểm khác nhau, đã tạo ra hiệu ứng cộng hưởng, gây ra sự suy giảm chất lượng không nhất quán và khó chẩn đoán.
Theo báo cáo từ Anthropic Engineering (2026), các sự cố này chỉ ảnh hưởng đến các sản phẩm như Claude Code, Claude Agent SDK và Claude Cowork. Giao diện lập trình ứng dụng (API) không bị tác động. Sự chồng chéo của các vấn đề đã khiến việc xác định nguyên nhân trở nên khó khăn hơn. Ban đầu, các báo cáo từ người dùng khó phân biệt với sự biến động thông thường trong phản hồi. Các bài kiểm tra nội bộ ban đầu cũng không tái tạo được các lỗi này.


Việc thay đổi mức độ suy luận mặc định từ `high` xuống `medium` đã làm giảm khả năng tư duy sâu của Claude Code, khiến mô hình có vẻ kém thông minh hơn. Thay đổi này được thực hiện vào ngày 4 tháng 3 nhằm giảm độ trễ rất cao mà một số người dùng gặp phải. Tuy nhiên, sự đánh đổi này đã không mang lại hiệu quả như mong đợi và gây ra phản ứng tiêu cực từ cộng đồng.
Theo GenK (2026), sự thay đổi này được thực hiện ", với lý do một số người dùng phản ánh giao diện bị đứng hình vì mô hình suy nghĩ quá lâu. Ngay sau khi triển khai, cộng đồng lập trình viên báo cáo Claude Code cảm giác kém thông minh hơn rõ rệt." Phản hồi này cho thấy người dùng ưu tiên chất lượng và trí thông minh hơn là tốc độ phản hồi tức thì cho các tác vụ phức tạp. Nhận thấy sai lầm, Anthropic đã hoàn tác thay đổi này vào ngày 7 tháng 4, khôi phục mức suy luận mặc định về `high` cho Sonnet 4.6 và Opus 4.6.

Một lỗi trong cơ chế quản lý bộ nhớ phiên đã khiến Claude liên tục xóa các suy nghĩ cũ của mình sau mỗi lượt tương tác, thay vì chỉ một lần khi tiếp tục phiên. Điều này làm cho Claude có vẻ hay quên, lặp lại và không thể duy trì bối cảnh trong các cuộc trò chuyện kéo dài. Lỗi này xuất hiện vào ngày 26 tháng 3 và được khắc phục vào ngày 10 tháng 4.
Mục đích ban đầu của tính năng này là giảm độ trễ khi người dùng quay lại một phiên đã không hoạt động trong hơn một giờ. Tuy nhiên, lỗi triển khai đã gây ra tác dụng phụ nghiêm trọng. Theo GenK (2026), tác động của lỗi này rất rõ rệt: độ dài phản hồi trung bình giảm từ 2.200 ký tự vào tháng 1 xuống chỉ còn 600 ký tự vào tháng 3, tức giảm tới 73%. Điều này cho thấy mô hình đã mất đi khả năng xử lý và ghi nhớ thông tin trong ngữ cảnh dài.


Một lệnh hệ thống được thêm vào ngày 16 tháng 4 nhằm giảm bớt sự dài dòng trong các câu trả lời đã vô tình làm suy giảm chất lượng mã nguồn do Claude tạo ra. Khi kết hợp với các thay đổi khác trong câu lệnh, nó khiến mô hình ưu tiên sự ngắn gọn hơn là tính chính xác và đầy đủ của mã, dẫn đến các đoạn code kém chất lượng và thiếu bối cảnh.
Theo Anthropic Engineering (2026), các bài đánh giá sâu hơn cho thấy chất lượng lập trình đã giảm 3% trên cả Opus 4.6 và Opus 4.7 sau khi lệnh này được triển khai. Người dùng nhận thấy Claude có xu hướng "sửa luôn không cần hiểu bối cảnh", một hành vi đi ngược lại với khả năng lập trình dựa trên ngữ cảnh vốn là thế mạnh của nó. Nhận ra tác động tiêu cực, Anthropic đã nhanh chóng hoàn tác thay đổi này vào ngày 20 tháng 4, chỉ bốn ngày sau khi triển khai.

Anthropic đã khắc phục toàn bộ ba sự cố vào ngày 20 tháng 4 và đặt lại giới hạn sử dụng cho tất cả người đăng ký như một lời xin lỗi. Công ty cam kết sẽ cải thiện quy trình giám sát và đánh giá nội bộ để ngăn chặn các vấn đề tương tự trong tương lai. Điều này bao gồm việc mở rộng bộ đánh giá và theo dõi chặt chẽ hơn các phản hồi của người dùng.
Sự cố này là một lời nhắc nhở quan trọng về sự phức tạp trong việc duy trì và cải tiến các mô hình AI quy mô lớn. Theo một chuyên gia được GenK (2026) trích dẫn, "Sáu tháng trước, Claude đứng một mình ở tầng năng lực suy luận và thực thi. Nhưng các đối thủ cần được theo dõi và đánh giá rất cẩn thận. Anthropic không còn đơn độc ở tầng năng lực mà Opus từng chiếm giữ." Điều này nhấn mạnh sự cạnh tranh ngày càng gay gắt và sự cần thiết phải liên tục đổi mới một cách cẩn trọng. Anthropic khẳng định họ rất coi trọng các báo cáo về sự suy giảm chất lượng và không bao giờ cố ý làm giảm hiệu suất của các mô hình.


Anthropic vừa ra mắt Claude Opus 4.8, phiên bản nâng cấp mạnh mẽ với khả năng phán đoán sắc bén và hiệu suất vượt trội. Mô hình này không chỉ cải thiện trên các benchmark quan trọng mà còn giới thiệu các tính năng mới như "dynamic workflows" trong Claude Code và chế độ nhanh hiệu quả hơn, hứa hẹn trở thành một cộng tác viên AI đắc lực.
02/06/2026

Dự án Glasswing của Anthropic, với sự tham gia của 50 đối tác, đã sử dụng AI Claude Mythos Preview để phát hiện hơn mười nghìn lỗ hổng bảo mật nghiêm trọng. Cập nhật ban đầu này cho thấy tiềm năng to lớn của AI trong việc bảo vệ phần mềm quan trọng, đồng thời đặt ra thách thức mới về việc xác minh và vá lỗi ở quy mô lớn.
22/05/2026

Anthropic và Amazon vừa công bố mở rộng hợp tác chiến lược, một bước đi quan trọng trong cuộc đua AI. Với cam kết hạ tầng trị giá 100 tỷ USD và khoản đầu tư lên tới 25 tỷ USD từ Amazon, Anthropic sẽ có thêm 5 gigawatt năng lực tính toán. Thỏa thuận này không chỉ củng cố vị thế của Claude trên nền tảng AWS mà còn hứa hẹn nâng cao hiệu suất và khả năng tiếp cận cho người dùng toàn cầu.
04/05/2026