Anthropic công bố giai đoạn hai của Dự án Fetch, một sáng kiến quan trọng do Nhóm Red Team Tiên phong của họ dẫn dắt. Dự án này tập trung vào việc đánh giá và tăng cường an toàn cho các hệ thống AI tiên tiến, đảm bảo chúng hoạt động một cách an toàn và đáng tin cậy.
Tóm tắt này được dịch tự động từ nguồn gốc tiếng Anh. Đọc bài gốc tại Anthropic Research →
Anthropic công bố giai đoạn hai của Dự án Fetch, một sáng kiến quan trọng do Nhóm Red Team Tiên phong của họ dẫn dắt. Dự án này tập trung vào việc đánh giá và tăng cường an toàn cho các hệ thống AI tiên tiến, đảm bảo chúng hoạt động một cách an toàn và đáng tin cậy.
Xem nguồn gốc: Anthropic Research

Anthropic nhấn mạnh rằng quyền truy cập của các tác nhân AI phải phát triển cùng với khả năng của chúng. Bằng cách sử dụng kỹ thuật "sandboxing", công ty tạo ra các môi trường biệt lập để thực thi mã lệnh, giới hạn phạm vi của bất kỳ hành động nào có khả năng gây hại và đảm bảo an toàn cho người dùng và hệ thống.
26/05/2026

Anthropic đang kêu gọi mở rộng cuộc đối thoại về AI tiên tiến, không chỉ giới hạn trong giới công nghệ. Bằng cách tham vấn các nhà triết học, giáo sĩ và nhà đạo đức học, họ tìm cách định hình "tính cách" cho Claude, đảm bảo AI phát triển an toàn, có trách nhiệm và thực sự phục vụ lợi ích toàn cầu.
22/05/2026

Sự kiện Jan Leike, một trong những nhà nghiên cứu an toàn AI hàng đầu, gia nhập Anthropic đang tạo ra làn sóng trong ngành. Dự án mới của anh không chỉ tập trung vào 'căn chỉnh' mà còn hướng tới một cách tiếp cận toàn diện hơn để đảm bảo Trí tuệ tổng quát nhân tạo (AGI) phát triển an toàn và có lợi cho nhân loại. Điều này đánh dấu một chương mới đầy hứa hẹn cho Anthropic.
14/05/2026