Cat Wu từ Anthropic thông báo tuyển dụng vị trí Quản lý Sản phẩm quan trọng cho Claude Code, tập trung vào hiệu suất mô hình. Vị trí này không chỉ đòi hỏi kinh nghiệm kỹ thuật sâu về đánh giá tác nhân (agentic evals) mà còn nhấn mạnh việc biến các ý tưởng nghiên cứu thành sản phẩm cốt lõi. Đây là dấu hiệu cho thấy Anthropic đang đầu tư mạnh mẽ vào việc biến Claude Code thành một trợ lý lập trình AI tự chủ và mạnh mẽ hơn.
Bài viết được biên tập + bổ sung research từ nhiều nguồn. Đọc bài gốc tại Twitter / X →

Anthropic đang tuyển dụng một Quản lý Sản phẩm (Product Manager) cho Claude Code, theo thông báo từ Cat Wu, thành viên nhóm Quan hệ Nhà phát triển. Vị trí này sẽ tập trung vào việc cải thiện hiệu suất mô hình, đòi hỏi kinh nghiệm sâu về đánh giá tác nhân (agentic evals) và khả năng chuyển hóa các ý tưởng nghiên cứu thành sản phẩm thực tế.
Trong một thông báo gần đây, Cat Wu đã nêu rõ yêu cầu cốt lõi của vị trí này. Theo Cat Wu (@_catwu) trên X (2026), "Tôi đang tuyển một PM cho Claude Code, tập trung vào hiệu suất mô hình. Nếu bạn có kinh nghiệm viết các bài đánh giá tác nhân (agentic evals) và muốn tích hợp các ý tưởng nghiên cứu vào sản phẩm cốt lõi của chúng tôi, tôi rất muốn nghe từ bạn." Động thái này cho thấy sự đầu tư chiến lược của Anthropic vào việc nâng cao trí thông minh và độ tin cậy của các công cụ lập trình AI.

Claude Code không chỉ là một công cụ phụ trợ. Nó đang trở thành một phần quan trọng trong hệ sinh thái sản phẩm của Anthropic, đóng góp vào sự tăng trưởng ấn tượng của công ty. Theo Wikipedia (2026), doanh thu từ các công cụ của Anthropic đã tăng gấp 5,5 lần tính đến giữa năm. Việc tuyển dụng một vị trí quản lý sản phẩm chuyên trách cho thấy Claude Code đã trưởng thành từ một tính năng thử nghiệm thành một sản phẩm chiến lược, đòi hỏi sự tập trung vào hiệu suất và lộ trình phát triển rõ ràng.

Hiệu suất mô hình là yếu tố sống còn đối với Claude Code vì nó ảnh hưởng trực tiếp đến chất lượng mã nguồn, tốc độ và độ tin cậy. Một mô hình hiệu suất cao giúp giảm thiểu lỗi, tăng năng suất cho lập trình viên và xây dựng niềm tin nơi người dùng doanh nghiệp. Đây là yếu tố then chốt cho việc áp dụng rộng rãi công cụ AI trong phát triển phần mềm chuyên nghiệp.
Trong lĩnh vực lập trình, sự khác biệt giữa một mô hình 95% chính xác và 99% chính xác là rất lớn. Một lỗi nhỏ trong code có thể gây ra sự cố hệ thống nghiêm trọng. Do đó, việc không ngừng cải thiện hiệu suất không phải là một lựa chọn, mà là một yêu cầu bắt buộc. Nó quyết định liệu Claude Code là một công cụ tham khảo hữu ích hay một đồng nghiệp lập trình đáng tin cậy. Theo FPT IS (2026), Claude Code có tiềm năng thay đổi sâu sắc ngành công nghiệp phần mềm bằng cách nâng cao hiệu quả và chất lượng công việc của lập trình viên, nhưng điều này chỉ có thể đạt được với hiệu suất đỉnh cao.

Các bài kiểm tra (benchmark) trong ngành là thước đo quan trọng cho hiệu suất. Theo cogover.com (2026), các phiên bản mới nhất của Claude đã đạt 80,8% trên SWE-bench Verified, một bộ tiêu chuẩn khắt khe để đánh giá khả năng giải quyết các vấn đề kỹ thuật phần mềm trong thực tế. Việc tuyển dụng một PM tập trung vào hiệu suất cho thấy Anthropic quyết tâm đẩy con số này lên cao hơn nữa, hướng tới mục tiêu tạo ra mã nguồn hoàn hảo và đáng tin cậy.

"Agentic Evals" (Đánh giá Tác nhân) là phương pháp đo lường khả năng của AI trong việc tự chủ thực hiện các nhiệm vụ phức tạp, đa bước. Đây là kỹ năng then chốt vì nó xác định độ tin cậy và hiệu quả của các tác nhân AI như Claude Code. Thay vì chỉ tạo ra một đoạn code, AI cần phải lập kế hoạch, gỡ lỗi và đạt được mục tiêu một cách tự động.
Hãy tưởng tượng bạn yêu cầu AI "xây dựng một trang web bán hàng đơn giản". Một mô hình ngôn ngữ thông thường có thể cung cấp các đoạn code cho từng phần. Nhưng một tác nhân AI (AI agent) sẽ phân tích yêu cầu, chia thành các bước nhỏ (tạo cấu trúc file, viết HTML, CSS, xử lý backend), tự thực hiện từng bước, và tự kiểm tra lỗi. "Agentic Evals" chính là cách để đánh giá xem tác nhân đó có hoàn thành nhiệm vụ phức tạp này một cách thành công hay không. Theo InfoQ (2026), việc Anthropic giới thiệu các tác nhân được quản lý (Managed Agents) cho thấy một sự chuyển dịch chiến lược hướng tới các hệ thống AI tự chủ hơn.

Việc Cat Wu nhấn mạnh kỹ năng này trong tin tuyển dụng là một tín hiệu mạnh mẽ. Nó cho thấy Anthropic không chỉ muốn Claude Code viết code tốt hơn, mà còn muốn nó trở thành một kỹ sư phần mềm tự trị. Để làm được điều này, họ cần những người có thể xây dựng các bài kiểm tra thực tế, mô phỏng các kịch bản công việc phức tạp để đo lường và cải thiện khả năng của tác nhân. Sự đầu tư vào lĩnh vực này được hỗ trợ bởi nền tảng tài chính vững chắc. Theo cogover.com, tính đến tháng 3/2026, Anthropic đã đạt mức doanh thu hàng năm khoảng 3 tỷ USD, cho phép họ theo đuổi những nghiên cứu tốn kém và đầy tham vọng.
Quản lý Sản phẩm AI tại Anthropic đóng vai trò cầu nối chiến lược giữa nghiên cứu AI tiên phong và ứng dụng thực tiễn. Họ không chỉ định hình tính năng mà còn phải thấu hiểu sâu sắc về hiệu suất mô hình và các phương pháp đánh giá mới. Vị trí này yêu cầu khả năng biến các khái niệm nghiên cứu phức tạp, như "agentic evals", thành sản phẩm cốt lõi hữu ích cho người dùng.
Khác với PM truyền thống tập trung vào giao diện người dùng và luồng công việc, PM cho Claude Code phải làm việc trực tiếp với các nhà nghiên cứu và kỹ sư AI. Họ phải hiểu được các chỉ số hiệu suất mô hình, những đột phá trong kiến trúc mạng nơ-ron, và cách một thay đổi nhỏ trong thuật toán có thể ảnh hưởng đến hàng triệu lập trình viên. Theo mô tả công việc trên Greenhouse (2026), một trong những trách nhiệm chính là "tích hợp các ý tưởng nghiên cứu vào sản phẩm cốt lõi", nhấn mạnh vai trò cầu nối độc đáo này.
Ví dụ, khi Anthropic công bố context window lên tới 1 triệu token, đây là một thành tựu kỹ thuật. Nhưng chính PM sẽ phải trả lời câu hỏi: "Chúng ta sẽ biến khả năng xử lý 1 triệu token này thành tính năng gì cho lập trình viên?" Liệu đó có phải là khả năng phân tích toàn bộ codebase của một dự án? Hay khả năng đọc hiểu tài liệu kỹ thuật phức tạp? Theo cogover.com (2026), việc context window mở rộng lên 1 triệu token (gấp 5 lần bản trước) mở ra vô số khả năng sản phẩm mới. Người PM phải là người định hình và ưu tiên hóa những khả năng đó.
Tương lai của Claude Code là trở thành một đồng nghiệp AI tự chủ, không chỉ viết code mà còn tham gia vào toàn bộ vòng đời phát triển phần mềm. Các tác nhân AI sẽ có khả năng lập kế hoạch, gỡ lỗi, tối ưu hóa và thậm chí là triển khai dự án. Việc Anthropic tập trung vào hiệu suất và đánh giá tác nhân là bước đi nền tảng cho tầm nhìn này.
Chúng ta đang tiến gần đến kỷ nguyên mà lập trình viên sẽ không còn gõ từng dòng lệnh. Thay vào đó, họ sẽ đưa ra các yêu cầu ở cấp độ cao, và các đội tác nhân AI (Agent Teams) sẽ cộng tác để thực hiện. Một tác nhân chuyên về frontend, một chuyên về backend, và một chuyên về cơ sở dữ liệu sẽ cùng làm việc, giao tiếp với nhau và báo cáo lại cho người giám sát. Theo Linas Substack (2026), lộ trình sản phẩm của Anthropic trong năm 2026 cho thấy sự tập trung rõ rệt vào việc phát triển các công cụ và tác nhân chuyên dụng, báo hiệu một kỷ nguyên mới cho AI.

Để đạt được tầm nhìn này, các mô hình cần có khả năng suy luận ở cấp độ cao hơn. Chúng không chỉ cần hiểu về cú pháp code, mà còn phải hiểu về logic nghiệp vụ, mục tiêu kinh doanh và các nguyên tắc thiết kế phần mềm. Các chỉ số như việc đạt 80,9% trên bài kiểm tra GPQA Diamond, một benchmark về suy luận khoa học cấp sau đại học, là rất quan trọng. Theo cogover.com (2026), thành tích này cho thấy Claude đang phát triển khả năng suy luận trừu tượng cần thiết để giải quyết các vấn đề phức tạp. Việc tuyển dụng một PM chuyên về hiệu suất và "agentic evals" chính là mảnh ghép tiếp theo để biến tầm nhìn về một đồng nghiệp AI thực thụ thành hiện thực.

Anthropic đã bổ nhiệm Vas Narasimhan, CEO của Novartis, vào Hội đồng Quản trị thông qua Quỹ Tín thác Lợi ích Dài hạn. Động thái chiến lược này nhấn mạnh cam kết của Anthropic trong việc phát triển AI một cách an toàn và có trách nhiệm, đặc biệt là trong các lĩnh vực y tế và khoa học sự sống, đồng thời củng cố cấu trúc quản trị độc đáo của công ty.
04/05/2026

Anthropic vừa ra mắt Claude Opus 4.7, một phiên bản cải tiến đáng kể so với Opus 4.6, đặc biệt trong lĩnh vực kỹ thuật phần mềm và khả năng thị giác. Mô hình này có thể xử lý các tác vụ mã hóa phức tạp, chú ý đến hướng dẫn và tự kiểm tra đầu ra. Opus 4.7 cũng tích hợp các biện pháp bảo vệ an ninh mạng tiên tiến, đồng thời duy trì mức giá như phiên bản trước.
04/05/2026

Anthropic và Amazon vừa công bố mở rộng hợp tác chiến lược, một bước đi quan trọng trong cuộc đua AI. Với cam kết hạ tầng trị giá 100 tỷ USD và khoản đầu tư lên tới 25 tỷ USD từ Amazon, Anthropic sẽ có thêm 5 gigawatt năng lực tính toán. Thỏa thuận này không chỉ củng cố vị thế của Claude trên nền tảng AWS mà còn hứa hẹn nâng cao hiệu suất và khả năng tiếp cận cho người dùng toàn cầu.
04/05/2026

Anthropic và NEC đang hợp tác để xây dựng một trong những lực lượng kỹ sư AI lớn nhất Nhật Bản. NEC sẽ tích hợp Claude vào các hoạt động nội bộ và phát triển các sản phẩm AI chuyên biệt cho thị trường Nhật Bản, đặc biệt trong các lĩnh vực tài chính, sản xuất và chính phủ địa phương. Sự hợp tác này nhằm mục đích đáp ứng các tiêu chuẩn cao về an toàn, độ tin cậy và chất lượng.
04/05/2026