Anthropic vừa ra mắt Claude Opus 4.8, mô hình AI mạnh nhất của họ cho lập trình. Với điểm SWE-bench Pro tăng lên 69.2, khả năng tự sửa lỗi và tính trung thực cao hơn, Opus 4.8 hứa hẹn thay đổi cách các nhà phát triển tương tác với AI, trong khi vẫn giữ nguyên mức giá cũ.
Bài viết được biên tập + bổ sung research từ nhiều nguồn. Đọc bài gốc tại Twitter / X →

Claude Opus 4.8 là bản cập nhật đáng kể từ Anthropic, tập trung vào việc nâng cao năng lực lập trình và "tính trung thực". Mô hình này không chỉ mạnh hơn trong các bài kiểm tra mã hóa mà còn có khả năng tự nhận biết khi không chắc chắn. Nó cũng có thể tự sửa lỗi thay vì đưa ra kết quả sai một cách tự tin.
Boris Cherny, đại diện Quan hệ Nhà phát triển của Anthropic, đã công bố phiên bản mới này. Ông nhấn mạnh đây là mô hình lập trình mạnh nhất của công ty từ trước đến nay. Cải tiến quan trọng nhất được thể hiện qua điểm số SWE-bench Pro. Đây là một bộ tiêu chuẩn đánh giá khả năng giải quyết các vấn đề thực tế trên GitHub. Theo thông báo năm 2026, điểm số đã tăng từ 64.3 lên 69.2. Boris Cherny đã chia sẻ: "Claude Opus 4.8 is out today. It's our strongest coding model yet: up on SWE-bench Pro (from 64.3 to 69.2) and noticeably more honest about its own work. It tells you when it's unsure and catches its own bugs instead of declaring victory early. Same price as 4.7." Sự cải tiến này không chỉ là về sức mạnh tính toán mà còn về độ tin cậy.

Hiệu năng lập trình của Opus 4.8 được cải thiện rõ rệt, đặc biệt là trong các tác vụ có định hướng (agentic coding). Mô hình này giải quyết các vấn đề kỹ thuật phần mềm phức tạp hiệu quả hơn. Khả năng tự phát hiện và sửa lỗi giúp giảm đáng kể thời gian giám sát và gỡ lỗi của lập trình viên, tăng năng suất làm việc.
Sự nhảy vọt về điểm số trên các benchmark chuyên ngành là minh chứng rõ ràng nhất. Theo The Next Web (2026), điểm số trên Terminal-Bench 2.1, một bài kiểm tra về lập trình có định hướng, đã tăng từ 64.3% lên 69.2%. Điều này có nghĩa là Opus 4.8 có thể tự chủ thực hiện các chuỗi lệnh phức tạp để hoàn thành một nhiệm vụ lập trình. Nó không chỉ viết code mà còn tương tác với môi trường terminal giống như một nhà phát triển thực thụ. Đây là một bước tiến quan trọng hướng tới các "AI agent" có khả năng làm việc độc lập lâu hơn và hiệu quả hơn. Thay vì chỉ là một công cụ gợi ý code, Claude đang trở thành một cộng sự ảo.

"Tính trung thực" trong AI có nghĩa là mô hình sẽ chủ động thừa nhận khi nó không chắc chắn hoặc phát hiện ra lỗi của chính mình. Thay vì quả quyết một câu trả lời sai, Opus 4.8 sẽ báo hiệu sự không chắc chắn. Điều này xây dựng lòng tin và làm cho sự hợp tác giữa người và máy trở nên hiệu quả và an toàn hơn.
Đây là một trong những triết lý cốt lõi của Anthropic: xây dựng AI an toàn và đáng tin cậy. Một mô hình "trung thực" sẽ không "ảo tưởng sức mạnh" và tuyên bố chiến thắng sớm. Nó sẽ nói "tôi không chắc về điều này" hoặc "đoạn code này có thể chứa lỗi". Điều này giúp các lập trình viên tránh được việc triển khai code lỗi và tiết kiệm hàng giờ gỡ lỗi. Theo Techzine Global (2026), các cải tiến trên nhiều lĩnh vực của Opus 4.8 so với 4.7 dao động từ dưới 1% đến gần 9%. Mặc dù không phải tất cả đều là bước nhảy vọt, chúng cho thấy sự tinh chỉnh toàn diện hướng tới một mô hình đáng tin cậy hơn. Việc Anthropic tập trung vào khía cạnh này cho thấy họ hiểu rõ nỗi đau của người dùng chuyên nghiệp.

Mặc dù nổi bật về lập trình, Claude Opus 4.8 cũng cho thấy sự cải thiện đáng kể trong các tác vụ khác. Khả năng suy luận đa ngành, sử dụng công cụ và xử lý công việc tri thức đều được nâng cấp. Điều này làm cho Opus 4.8 trở thành một trợ lý AI toàn diện, hữu ích cho nhiều chuyên gia ngoài ngành công nghệ.
Anthropic không chỉ xây dựng một công cụ cho lập trình viên. Họ đang tạo ra một nền tảng AI đa năng. Theo The Next Web (2026), điểm số về suy luận đa lĩnh vực có sử dụng công cụ đã tăng từ 54.7% lên 57.9%. Tương tự, khả năng tự chủ sử dụng máy tính (agentic computer use) cũng nhích nhẹ từ 82.8% lên 83.4%. Những con số này cho thấy Claude đang ngày càng thông minh hơn trong việc hiểu và thực thi các yêu cầu phức tạp, kết hợp nhiều kỹ năng. Theo Thurrott.com (2026), mục tiêu của Anthropic là "đưa Claude đến nhiều nơi làm việc hơn", và những cải tiến này chính là bước đi cụ thể để hiện thực hóa tầm nhìn đó. Từ phân tích tài chính đến soạn thảo văn bản pháp lý, Opus 4.8 đều cho thấy tiềm năng ứng dụng rộng rãi.

Một trong những thông tin đáng chú ý nhất là Claude Opus 4.8 được phát hành với mức giá không đổi so với phiên bản 4.7. Điều này thể hiện chiến lược của Anthropic nhằm gia tăng giá trị cho người dùng. Họ không tăng gánh nặng chi phí, giúp củng cố vị thế cạnh tranh trên thị trường AI đang phát triển nhanh chóng.
Việc giữ nguyên giá là một động thái thông minh. Nó khuyến khích người dùng hiện tại tiếp tục sử dụng và thu hút khách hàng mới. Đằng sau chiến lược này là sự hậu thuẫn tài chính vững chắc. Theo The Next Web (2026), Anthropic gần đây đã huy động thành công 65 tỷ đô la trong vòng gọi vốn Series H. Vòng vốn này nâng định giá công ty lên 965 tỷ đô la. Con số này cho thấy niềm tin mạnh mẽ của các nhà đầu tư. Theo Thurrott.com (2026), mức định giá này thậm chí đã vượt qua giá trị 852 tỷ đô la của OpenAI tại cùng thời điểm. Điều này cho phép Anthropic tiếp tục đầu tư mạnh mẽ vào nghiên cứu và phát triển mà không cần chuyển gánh nặng chi phí sang người dùng ngay lập tức.


Anthropic vừa ra mắt Claude Opus 4.8, một bản nâng cấp đáng kể so với phiên bản tiền nhiệm. Mô hình mới này hứa hẹn khả năng phán đoán sắc bén hơn, trung thực hơn về tiến trình công việc, và đặc biệt là khả năng làm việc độc lập trong thời gian dài hơn. Bài viết này sẽ phân tích chi tiết những cải tiến đột phá và ý nghĩa của chúng đối với người dùng và các nhà phát triển.
28/05/2026

Mike Krieger, đồng sáng lập Anthropic, đã có những chia sẻ đầu tiên về Claude Opus 4.8, mô hình AI vừa ra mắt. Ông khẳng định đây đã trở thành lựa chọn hàng đầu của mình sau vài tuần sử dụng. Krieger đặc biệt ấn tượng với khả năng tự vận hành, sự trung thực khi chỉ ra điểm không chắc chắn, và nhất là khả năng tự phát hiện lỗi trong mã nguồn trước khi trả về, hứa hẹn một cuộc cách mạng cho các nhà phát triển.
28/05/2026

Anthropic vừa phát hành Opus 4.8, một bản cập nhật quan trọng cho Claude Code, được mô tả là 'trung thực hơn đáng kể'. Mô hình mới này có khả năng nhận biết giới hạn kiến thức, tự động chỉ ra lỗi trong mã do chính nó tạo ra, và được khuyến nghị cho công việc lập trình hàng ngày. Bài viết này phân tích sâu về những thay đổi và ý nghĩa của chúng đối với cộng đồng phát triển.
28/05/2026

Boris Cherny từ Anthropic thông báo Claude Code sẽ sớm có lệnh `/usage`, một công cụ mạnh mẽ để theo dõi chi tiết mức tiêu thụ token. Tính năng này sẽ phân tích việc sử dụng của Skills, Agents, và MCPs, giúp các nhà phát triển quản lý tài nguyên, tối ưu hóa chi phí và nâng cao hiệu suất. Lệnh `/usage` sẽ được triển khai trước trên CLI, sau đó là phiên bản Desktop.
21/05/2026