Claude Code: Anthropic Giải Trình Sự Cố Suy Giảm Chất Lượng

Nguyên nhân gốc rễ khiến chất lượng Claude Code suy giảm là gì?

Cập nhật về các vấn đề chất lượng Claude Code gần đây

Anthropic đã xác định ba thay đổi kỹ thuật riêng biệt là nguyên nhân chính gây ra sự sụt giảm chất lượng của Claude Code. Các sự cố này bao gồm việc giảm mức độ suy luận mặc định, một lỗi trong cơ chế xóa bộ nhớ phiên và một lệnh hệ thống mới nhằm giảm tính dài dòng. Những thay đổi này, diễn ra vào các thời điểm khác nhau, đã tạo ra hiệu ứng cộng hưởng, gây ra sự suy giảm chất lượng không nhất quán và khó chẩn đoán.

Theo báo cáo từ Anthropic Engineering (2026), các sự cố này chỉ ảnh hưởng đến các sản phẩm như Claude Code, Claude Agent SDK và Claude Cowork. Giao diện lập trình ứng dụng (API) không bị tác động. Sự chồng chéo của các vấn đề đã khiến việc xác định nguyên nhân trở nên khó khăn hơn. Ban đầu, các báo cáo từ người dùng khó phân biệt với sự biến động thông thường trong phản hồi. Các bài kiểm tra nội bộ ban đầu cũng không tái tạo được các lỗi này.

Giao diện dòng lệnh hiển thị mã code phức tạp — Các vấn đề chất lượng của Claude Code bắt nguồn từ ba thay đổi kỹ thuật riêng biệt.

Thay đổi "mức độ suy luận" đã ảnh hưởng đến Claude Code như thế nào?

Việc thay đổi mức độ suy luận mặc định từ `high` xuống `medium` đã làm giảm khả năng tư duy sâu của Claude Code, khiến mô hình có vẻ kém thông minh hơn. Thay đổi này được thực hiện vào ngày 4 tháng 3 nhằm giảm độ trễ rất cao mà một số người dùng gặp phải. Tuy nhiên, sự đánh đổi này đã không mang lại hiệu quả như mong đợi và gây ra phản ứng tiêu cực từ cộng đồng.

Theo GenK (2026), sự thay đổi này được thực hiện ", với lý do một số người dùng phản ánh giao diện bị đứng hình vì mô hình suy nghĩ quá lâu. Ngay sau khi triển khai, cộng đồng lập trình viên báo cáo Claude Code cảm giác kém thông minh hơn rõ rệt." Phản hồi này cho thấy người dùng ưu tiên chất lượng và trí thông minh hơn là tốc độ phản hồi tức thì cho các tác vụ phức tạp. Nhận thấy sai lầm, Anthropic đã hoàn tác thay đổi này vào ngày 7 tháng 4, khôi phục mức suy luận mặc định về `high` cho Sonnet 4.6 và Opus 4.6.

Lỗi "bộ nhớ phiên" đã khiến Claude trở nên hay quên ra sao?

Một lỗi trong cơ chế quản lý bộ nhớ phiên đã khiến Claude liên tục xóa các suy nghĩ cũ của mình sau mỗi lượt tương tác, thay vì chỉ một lần khi tiếp tục phiên. Điều này làm cho Claude có vẻ hay quên, lặp lại và không thể duy trì bối cảnh trong các cuộc trò chuyện kéo dài. Lỗi này xuất hiện vào ngày 26 tháng 3 và được khắc phục vào ngày 10 tháng 4.

Mục đích ban đầu của tính năng này là giảm độ trễ khi người dùng quay lại một phiên đã không hoạt động trong hơn một giờ. Tuy nhiên, lỗi triển khai đã gây ra tác dụng phụ nghiêm trọng. Theo GenK (2026), tác động của lỗi này rất rõ rệt: độ dài phản hồi trung bình giảm từ 2.200 ký tự vào tháng 1 xuống chỉ còn 600 ký tự vào tháng 3, tức giảm tới 73%. Điều này cho thấy mô hình đã mất đi khả năng xử lý và ghi nhớ thông tin trong ngữ cảnh dài.

Biểu đồ đường thể hiện sự sụt giảm hiệu suất theo thời gian — Biểu đồ minh họa sự sụt giảm hiệu suất có thể do các lỗi kỹ thuật gây ra.

Lệnh hệ thống giảm dài dòng đã vô tình làm hại chất lượng code như thế nào?

Một lệnh hệ thống được thêm vào ngày 16 tháng 4 nhằm giảm bớt sự dài dòng trong các câu trả lời đã vô tình làm suy giảm chất lượng mã nguồn do Claude tạo ra. Khi kết hợp với các thay đổi khác trong câu lệnh, nó khiến mô hình ưu tiên sự ngắn gọn hơn là tính chính xác và đầy đủ của mã, dẫn đến các đoạn code kém chất lượng và thiếu bối cảnh.

Theo Anthropic Engineering (2026), các bài đánh giá sâu hơn cho thấy chất lượng lập trình đã giảm 3% trên cả Opus 4.6 và Opus 4.7 sau khi lệnh này được triển khai. Người dùng nhận thấy Claude có xu hướng "sửa luôn không cần hiểu bối cảnh", một hành vi đi ngược lại với khả năng lập trình dựa trên ngữ cảnh vốn là thế mạnh của nó. Nhận ra tác động tiêu cực, Anthropic đã nhanh chóng hoàn tác thay đổi này vào ngày 20 tháng 4, chỉ bốn ngày sau khi triển khai.

Anthropic đã thực hiện những giải pháp nào và cam kết gì cho tương lai?

Anthropic đã khắc phục toàn bộ ba sự cố vào ngày 20 tháng 4 và đặt lại giới hạn sử dụng cho tất cả người đăng ký như một lời xin lỗi. Công ty cam kết sẽ cải thiện quy trình giám sát và đánh giá nội bộ để ngăn chặn các vấn đề tương tự trong tương lai. Điều này bao gồm việc mở rộng bộ đánh giá và theo dõi chặt chẽ hơn các phản hồi của người dùng.

Sự cố này là một lời nhắc nhở quan trọng về sự phức tạp trong việc duy trì và cải tiến các mô hình AI quy mô lớn. Theo một chuyên gia được GenK (2026) trích dẫn, "Sáu tháng trước, Claude đứng một mình ở tầng năng lực suy luận và thực thi. Nhưng các đối thủ cần được theo dõi và đánh giá rất cẩn thận. Anthropic không còn đơn độc ở tầng năng lực mà Opus từng chiếm giữ." Điều này nhấn mạnh sự cạnh tranh ngày càng gay gắt và sự cần thiết phải liên tục đổi mới một cách cẩn trọng. Anthropic khẳng định họ rất coi trọng các báo cáo về sự suy giảm chất lượng và không bao giờ cố ý làm giảm hiệu suất của các mô hình.

Hình ảnh trừu tượng về mạng nơ-ron nhân tạo — Anthropic cam kết cải tiến quy trình đánh giá để đảm bảo chất lượng mô hình AI ổn định.

Cập nhật về các vấn đề chất lượng Claude Code gần đây

Nguyên nhân gốc rễ khiến chất lượng Claude Code suy giảm là gì?

Thay đổi "mức độ suy luận" đã ảnh hưởng đến Claude Code như thế nào?

Lỗi "bộ nhớ phiên" đã khiến Claude trở nên hay quên ra sao?

Lệnh hệ thống giảm dài dòng đã vô tình làm hại chất lượng code như thế nào?

Anthropic đã thực hiện những giải pháp nào và cam kết gì cho tương lai?

Bài liên quan

Giới thiệu Claude Opus 4.8

Cập nhật ban đầu về Dự án Glasswing của Anthropic

Anthropic và Amazon mở rộng hợp tác, bổ sung 5 gigawatt năng lực tính toán

Anthropic và NEC hợp tác xây dựng lực lượng kỹ sư AI lớn nhất Nhật Bản