Claude Code: Lệnh /usage mới giúp theo dõi token chi tiết

Lệnh /usage trong Claude Code là gì và nó hoạt động như thế nào?

Lệnh `/usage` là một tính năng mới sắp ra mắt trong Claude Code, cho phép người dùng xem chi tiết mức tiêu thụ token. Nó phân tích việc sử dụng token của các thành phần như Skills, Agents, MCPs (Multi-Claude Prompts) và Plugins. Tính năng này giúp nhà phát triển hiểu rõ tài nguyên đang được phân bổ ở đâu, từ đó tối ưu hóa hiệu suất và chi phí trong các dự án lập trình.

Theo Boris Cherny, thuộc bộ phận Quan hệ Nhà phát triển của Anthropic, tính năng này sẽ được triển khai trong phiên bản tiếp theo của Claude Code. Người dùng chỉ cần chạy lệnh `/usage` ngay trong giao diện dòng lệnh (CLI) để nhận được một báo cáo phân tích. Báo cáo này sẽ chỉ rõ mỗi Skill (lệnh tùy chỉnh), Agent (tác tử tự động) hay MCP đã tiêu thụ bao nhiêu token trong một phiên làm việc. Đây là một bước tiến quan trọng hướng tới sự minh bạch và khả năng kiểm soát trong lập trình với AI.

Thông báo của Boris Cherny về lệnh /usage trên X — Thông báo chính thức từ Boris Cherny trên X về việc ra mắt lệnh /usage cho Claude Code.

Sự cần thiết của công cụ này càng trở nên rõ ràng khi AI ngày càng tham gia sâu vào quá trình viết mã. Theo Latent.space (2026), một số công ty khởi nghiệp series A báo cáo rằng khoảng 85% mã nguồn của họ được tạo ra bởi AI. Khi khối lượng mã do AI tạo ra tăng lên, việc quản lý "chi phí" token của mỗi yêu cầu trở thành yếu tố sống còn để duy trì hiệu quả dự án. Theo Boris Cherny trên X (2026), việc cung cấp công cụ này trực tiếp cho người dùng là ưu tiên hàng đầu của Anthropic.

Tại sao việc theo dõi token lại quan trọng đối với nhà phát triển?

Theo dõi token rất quan trọng vì nó ảnh hưởng trực tiếp đến chi phí, hiệu suất và khả năng gỡ lỗi. Việc biết chính xác thành phần nào tiêu thụ nhiều token nhất giúp nhà phát triển tối ưu hóa mã lệnh, quản lý ngân sách hiệu quả và đảm bảo mô hình hoạt động trong giới hạn ngữ cảnh cho phép, tránh các lỗi không mong muốn và tăng năng suất.

Về mặt chi phí, mỗi token đều có giá. Đối với các dự án lớn hoặc các đội ngũ phát triển, chi phí này có thể tăng lên nhanh chóng. Lệnh `/usage` hoạt động như một công cụ kế toán, cho phép các trưởng nhóm kỹ thuật phân bổ ngân sách và theo dõi chi tiêu một cách chính xác. Theo Medium (2026), việc quản lý hạn ngạch token là một yếu tố kinh tế cốt lõi khi sử dụng Claude Code. Về hiệu suất, các mô hình ngôn ngữ lớn có giới hạn về cửa sổ ngữ cảnh. Việc gửi quá nhiều token trong một yêu cầu có thể làm giảm chất lượng đầu ra hoặc gây ra lỗi. Bằng cách theo dõi token, nhà phát triển có thể giữ cho các yêu cầu của mình gọn gàng và hiệu quả. Điều này đặc biệt quan trọng khi năng suất là mục tiêu hàng đầu. Theo Latent.space (2026), việc tăng năng suất của một kỹ sư lên 70% mang lại giá trị kinh tế rất lớn, và các công cụ tối ưu hóa như `/usage` đóng góp trực tiếp vào mục tiêu này.

Lệnh `/usage` sẽ tác động đến việc sử dụng Skills, Agents và MCPs ra sao?

Lệnh `/usage` sẽ thay đổi cách các nhà phát triển xây dựng và tối ưu hóa Skills, Agents và MCPs. Bằng cách cung cấp dữ liệu sử dụng token chi tiết, nó cho phép họ xác định các thành phần "đắt đỏ" và tái cấu trúc chúng để tiết kiệm chi phí hơn. Điều này khuyến khích việc tạo ra các agent hiệu quả, thực hiện tác vụ phức tạp với ít token hơn.

Ví dụ, một nhà phát triển có thể tạo ra một Agent phức tạp để tự động tái cấu trúc mã nguồn. Trước đây, họ chỉ có thể đoán chừng Agent này tiêu tốn bao nhiêu token. Với `/usage`, họ có thể thấy con số chính xác. Nếu Agent đó quá "tham lam", họ có thể chia nhỏ nó thành các Skills đơn giản hơn hoặc tối ưu hóa các câu lệnh bên trong. Điều này thúc đẩy một văn hóa kỹ thuật tập trung vào hiệu quả. Trong bối cảnh mà theo Latent.space (2026), có tới 80-90% mã nguồn trong một số dự án được viết bởi AI, việc tối ưu hóa từng thành phần trở nên cực kỳ quan trọng.

Giao diện dòng lệnh của Claude Code với các lệnh tùy chỉnh — Claude Code cho phép tạo các lệnh tùy chỉnh (Skills) để tự động hóa quy trình làm việc.

Theo InfoQ (2026), việc tìm hiểu quy trình làm việc của chính những người tạo ra Claude Code cho thấy họ rất chú trọng đến việc tối ưu hóa từng thành phần. Lệnh `/usage` chính là công cụ để phổ biến tư duy này đến cộng đồng người dùng rộng lớn hơn, biến việc tối ưu hóa token từ một nghệ thuật thành một khoa học.

Lợi ích chính của việc tích hợp phân tích token vào quy trình làm việc là gì?

Tích hợp phân tích token vào quy trình làm việc mang lại ba lợi ích chính: quản lý chi phí dự đoán được, gỡ lỗi nhanh hơn và cải thiện hiệu suất ứng dụng. Nhà phát triển có thể xác định các "điểm nóng" tiêu thụ token, ngăn ngừa việc vượt ngân sách và tối ưu hóa các lời gọi AI để có thời gian phản hồi nhanh hơn và kết quả chính xác hơn.

Thứ nhất, quản lý chi phí trở nên minh bạch. Các đội có thể đặt ra các giới hạn và cảnh báo dựa trên dữ liệu từ `/usage`. Thứ hai, việc gỡ lỗi trở nên dễ dàng hơn. Khi một Agent hoạt động không như mong đợi, việc kiểm tra mức sử dụng token có thể là manh mối đầu tiên. Có thể Agent đã đạt đến giới hạn ngữ cảnh, hoặc một Skill cụ thể đang gửi đi quá nhiều thông tin không cần thiết. Thứ ba, hiệu suất được cải thiện. Các nhà phát triển có thể thử nghiệm A/B các phiên bản khác nhau của một câu lệnh để xem phiên bản nào sử dụng ít token hơn mà vẫn cho kết quả tương tự. Theo Boris Tane (2026), ông không nhận thấy sự suy giảm hiệu suất mà mọi người thường nói đến sau khi sử dụng 50% cửa sổ ngữ cảnh, cho thấy việc quản lý tốt có thể mang lại hiệu quả cao. Việc hiểu cách Claude Code phù hợp với quy trình làm việc là rất quan trọng. Theo Every.to (2026), các nhà nghiên cứu và quản lý sản phẩm cũng đang học cách tích hợp Claude Code vào công việc của họ, và các công cụ phân tích như `/usage` sẽ giúp quá trình này dễ dàng hơn.

Một đoạn mã ví dụ được tạo bởi Claude Code — Claude Code có khả năng tạo ra các đoạn mã phức tạp, và việc theo dõi token giúp tối ưu hóa chúng.

Lộ trình phát triển của Claude Code và các tính năng tương tự là gì?

Lộ trình phát triển của Claude Code tập trung vào việc trao quyền cho nhà phát triển với các công cụ mạnh mẽ và minh bạch. Lệnh `/usage` là một ví dụ, ra mắt trước trên giao diện dòng lệnh (CLI) và sau đó là phiên bản Desktop. Tương lai có thể bao gồm các công cụ phân tích sâu hơn, tích hợp chặt chẽ hơn với các IDE và khả năng mở rộng cửa sổ ngữ cảnh.

Chiến lược "CLI first" cho thấy Anthropic đang ưu tiên nhóm người dùng chuyên nghiệp, những người thường làm việc trong môi trường terminal. Sau khi nhận phản hồi và hoàn thiện tính năng trên CLI, họ sẽ triển khai nó trên ứng dụng Desktop cho một lượng người dùng lớn hơn. Boris Cherny đã xác nhận điều này trong thông báo của mình: "In the next version of Claude Code: run /usage to see a breakdown of which Skills, Agents, MCPs, and Plugins are using your tokens CLI today, coming to Desktop next". Nhìn xa hơn, cộng đồng đang rất mong chờ những cải tiến về giới hạn ngữ cảnh. Theo Latent.space (2026), các nhà phát triển đang mơ về một cửa sổ ngữ cảnh lên tới 100 triệu token, điều này sẽ thay đổi hoàn toàn cách chúng ta xây dựng các ứng dụng AI. Mặc dù đây là một mục tiêu đầy tham vọng, các công cụ như `/usage` là bước đệm cần thiết, giúp chúng ta học cách quản lý tài nguyên hiệu quả ngay cả khi chúng trở nên dồi dào hơn trong tương lai.

Boris Cherny: Claude Code sẽ có lệnh /usage hiển thị chi tiết sử dụng token

Bài liên quan

Claude Fable 5: Đột phá lập trình AI theo chuyên gia Anthropic

Claude Code: Subagent Lồng Nhau & Quản Lý Ngữ Cảnh Tối Ưu

Claude Opus 4.8: AI Lập Trình Mạnh Mẽ & Trung Thực Hơn

Claude Code Agent View: Quản lý đa tác nhân AI hiệu quả