Boris Cherny từ Anthropic thông báo Claude Code sẽ sớm có lệnh `/usage`, một công cụ mạnh mẽ để theo dõi chi tiết mức tiêu thụ token. Tính năng này sẽ phân tích việc sử dụng của Skills, Agents, và MCPs, giúp các nhà phát triển quản lý tài nguyên, tối ưu hóa chi phí và nâng cao hiệu suất. Lệnh `/usage` sẽ được triển khai trước trên CLI, sau đó là phiên bản Desktop.
Bài viết được biên tập + bổ sung research từ nhiều nguồn. Đọc bài gốc tại Twitter / X →
Lệnh `/usage` là một tính năng mới sắp ra mắt trong Claude Code, cho phép người dùng xem chi tiết mức tiêu thụ token. Nó phân tích việc sử dụng token của các thành phần như Skills, Agents, MCPs (Multi-Claude Prompts) và Plugins. Tính năng này giúp nhà phát triển hiểu rõ tài nguyên đang được phân bổ ở đâu, từ đó tối ưu hóa hiệu suất và chi phí trong các dự án lập trình.
Theo Boris Cherny, thuộc bộ phận Quan hệ Nhà phát triển của Anthropic, tính năng này sẽ được triển khai trong phiên bản tiếp theo của Claude Code. Người dùng chỉ cần chạy lệnh `/usage` ngay trong giao diện dòng lệnh (CLI) để nhận được một báo cáo phân tích. Báo cáo này sẽ chỉ rõ mỗi Skill (lệnh tùy chỉnh), Agent (tác tử tự động) hay MCP đã tiêu thụ bao nhiêu token trong một phiên làm việc. Đây là một bước tiến quan trọng hướng tới sự minh bạch và khả năng kiểm soát trong lập trình với AI.

Sự cần thiết của công cụ này càng trở nên rõ ràng khi AI ngày càng tham gia sâu vào quá trình viết mã. Theo Latent.space (2026), một số công ty khởi nghiệp series A báo cáo rằng khoảng 85% mã nguồn của họ được tạo ra bởi AI. Khi khối lượng mã do AI tạo ra tăng lên, việc quản lý "chi phí" token của mỗi yêu cầu trở thành yếu tố sống còn để duy trì hiệu quả dự án. Theo Boris Cherny trên X (2026), việc cung cấp công cụ này trực tiếp cho người dùng là ưu tiên hàng đầu của Anthropic.
Theo dõi token rất quan trọng vì nó ảnh hưởng trực tiếp đến chi phí, hiệu suất và khả năng gỡ lỗi. Việc biết chính xác thành phần nào tiêu thụ nhiều token nhất giúp nhà phát triển tối ưu hóa mã lệnh, quản lý ngân sách hiệu quả và đảm bảo mô hình hoạt động trong giới hạn ngữ cảnh cho phép, tránh các lỗi không mong muốn và tăng năng suất.
Về mặt chi phí, mỗi token đều có giá. Đối với các dự án lớn hoặc các đội ngũ phát triển, chi phí này có thể tăng lên nhanh chóng. Lệnh `/usage` hoạt động như một công cụ kế toán, cho phép các trưởng nhóm kỹ thuật phân bổ ngân sách và theo dõi chi tiêu một cách chính xác. Theo Medium (2026), việc quản lý hạn ngạch token là một yếu tố kinh tế cốt lõi khi sử dụng Claude Code. Về hiệu suất, các mô hình ngôn ngữ lớn có giới hạn về cửa sổ ngữ cảnh. Việc gửi quá nhiều token trong một yêu cầu có thể làm giảm chất lượng đầu ra hoặc gây ra lỗi. Bằng cách theo dõi token, nhà phát triển có thể giữ cho các yêu cầu của mình gọn gàng và hiệu quả. Điều này đặc biệt quan trọng khi năng suất là mục tiêu hàng đầu. Theo Latent.space (2026), việc tăng năng suất của một kỹ sư lên 70% mang lại giá trị kinh tế rất lớn, và các công cụ tối ưu hóa như `/usage` đóng góp trực tiếp vào mục tiêu này.
Lệnh `/usage` sẽ thay đổi cách các nhà phát triển xây dựng và tối ưu hóa Skills, Agents và MCPs. Bằng cách cung cấp dữ liệu sử dụng token chi tiết, nó cho phép họ xác định các thành phần "đắt đỏ" và tái cấu trúc chúng để tiết kiệm chi phí hơn. Điều này khuyến khích việc tạo ra các agent hiệu quả, thực hiện tác vụ phức tạp với ít token hơn.
Ví dụ, một nhà phát triển có thể tạo ra một Agent phức tạp để tự động tái cấu trúc mã nguồn. Trước đây, họ chỉ có thể đoán chừng Agent này tiêu tốn bao nhiêu token. Với `/usage`, họ có thể thấy con số chính xác. Nếu Agent đó quá "tham lam", họ có thể chia nhỏ nó thành các Skills đơn giản hơn hoặc tối ưu hóa các câu lệnh bên trong. Điều này thúc đẩy một văn hóa kỹ thuật tập trung vào hiệu quả. Trong bối cảnh mà theo Latent.space (2026), có tới 80-90% mã nguồn trong một số dự án được viết bởi AI, việc tối ưu hóa từng thành phần trở nên cực kỳ quan trọng.

Theo InfoQ (2026), việc tìm hiểu quy trình làm việc của chính những người tạo ra Claude Code cho thấy họ rất chú trọng đến việc tối ưu hóa từng thành phần. Lệnh `/usage` chính là công cụ để phổ biến tư duy này đến cộng đồng người dùng rộng lớn hơn, biến việc tối ưu hóa token từ một nghệ thuật thành một khoa học.
Tích hợp phân tích token vào quy trình làm việc mang lại ba lợi ích chính: quản lý chi phí dự đoán được, gỡ lỗi nhanh hơn và cải thiện hiệu suất ứng dụng. Nhà phát triển có thể xác định các "điểm nóng" tiêu thụ token, ngăn ngừa việc vượt ngân sách và tối ưu hóa các lời gọi AI để có thời gian phản hồi nhanh hơn và kết quả chính xác hơn.
Thứ nhất, quản lý chi phí trở nên minh bạch. Các đội có thể đặt ra các giới hạn và cảnh báo dựa trên dữ liệu từ `/usage`. Thứ hai, việc gỡ lỗi trở nên dễ dàng hơn. Khi một Agent hoạt động không như mong đợi, việc kiểm tra mức sử dụng token có thể là manh mối đầu tiên. Có thể Agent đã đạt đến giới hạn ngữ cảnh, hoặc một Skill cụ thể đang gửi đi quá nhiều thông tin không cần thiết. Thứ ba, hiệu suất được cải thiện. Các nhà phát triển có thể thử nghiệm A/B các phiên bản khác nhau của một câu lệnh để xem phiên bản nào sử dụng ít token hơn mà vẫn cho kết quả tương tự. Theo Boris Tane (2026), ông không nhận thấy sự suy giảm hiệu suất mà mọi người thường nói đến sau khi sử dụng 50% cửa sổ ngữ cảnh, cho thấy việc quản lý tốt có thể mang lại hiệu quả cao. Việc hiểu cách Claude Code phù hợp với quy trình làm việc là rất quan trọng. Theo Every.to (2026), các nhà nghiên cứu và quản lý sản phẩm cũng đang học cách tích hợp Claude Code vào công việc của họ, và các công cụ phân tích như `/usage` sẽ giúp quá trình này dễ dàng hơn.

Lộ trình phát triển của Claude Code tập trung vào việc trao quyền cho nhà phát triển với các công cụ mạnh mẽ và minh bạch. Lệnh `/usage` là một ví dụ, ra mắt trước trên giao diện dòng lệnh (CLI) và sau đó là phiên bản Desktop. Tương lai có thể bao gồm các công cụ phân tích sâu hơn, tích hợp chặt chẽ hơn với các IDE và khả năng mở rộng cửa sổ ngữ cảnh.
Chiến lược "CLI first" cho thấy Anthropic đang ưu tiên nhóm người dùng chuyên nghiệp, những người thường làm việc trong môi trường terminal. Sau khi nhận phản hồi và hoàn thiện tính năng trên CLI, họ sẽ triển khai nó trên ứng dụng Desktop cho một lượng người dùng lớn hơn. Boris Cherny đã xác nhận điều này trong thông báo của mình: "In the next version of Claude Code: run /usage to see a breakdown of which Skills, Agents, MCPs, and Plugins are using your tokens CLI today, coming to Desktop next". Nhìn xa hơn, cộng đồng đang rất mong chờ những cải tiến về giới hạn ngữ cảnh. Theo Latent.space (2026), các nhà phát triển đang mơ về một cửa sổ ngữ cảnh lên tới 100 triệu token, điều này sẽ thay đổi hoàn toàn cách chúng ta xây dựng các ứng dụng AI. Mặc dù đây là một mục tiêu đầy tham vọng, các công cụ như `/usage` là bước đệm cần thiết, giúp chúng ta học cách quản lý tài nguyên hiệu quả ngay cả khi chúng trở nên dồi dào hơn trong tương lai.

Anthropic vừa ra mắt Agent View cho Claude Code, một bước tiến đột phá trong việc quản lý các hệ thống AI đa tác nhân. Theo Boris Cherny từ Anthropic, đây là "cách tốt nhất để nâng cấp từ 1 tác nhân lên nhiều tác nhân". Tính năng này hợp nhất tất cả các phiên làm việc của AI vào một dashboard, loại bỏ sự cồng kềnh của việc chuyển đổi qua lại giữa các terminal và tăng cường hiệu suất đáng kể cho lập trình viên.
14/05/2026

Anthropic vừa ra mắt Claude Opus 4.7, một phiên bản cải tiến đáng kể so với Opus 4.6, đặc biệt trong lĩnh vực kỹ thuật phần mềm và khả năng thị giác. Mô hình này có thể xử lý các tác vụ mã hóa phức tạp, chú ý đến hướng dẫn và tự kiểm tra đầu ra. Opus 4.7 cũng tích hợp các biện pháp bảo vệ an ninh mạng tiên tiến, đồng thời duy trì mức giá như phiên bản trước.
04/05/2026

Anthropic và Amazon vừa công bố mở rộng hợp tác chiến lược, một bước đi quan trọng trong cuộc đua AI. Với cam kết hạ tầng trị giá 100 tỷ USD và khoản đầu tư lên tới 25 tỷ USD từ Amazon, Anthropic sẽ có thêm 5 gigawatt năng lực tính toán. Thỏa thuận này không chỉ củng cố vị thế của Claude trên nền tảng AWS mà còn hứa hẹn nâng cao hiệu suất và khả năng tiếp cận cho người dùng toàn cầu.
04/05/2026

Anthropic và NEC đang hợp tác để xây dựng một trong những lực lượng kỹ sư AI lớn nhất Nhật Bản. NEC sẽ tích hợp Claude vào các hoạt động nội bộ và phát triển các sản phẩm AI chuyên biệt cho thị trường Nhật Bản, đặc biệt trong các lĩnh vực tài chính, sản xuất và chính phủ địa phương. Sự hợp tác này nhằm mục đích đáp ứng các tiêu chuẩn cao về an toàn, độ tin cậy và chất lượng.
04/05/2026