@AnthropicAI: Nghiên cứu mới về việc dạy Claude hiểu 'tại sao' và loại bỏ hành vi tống tiền
Anthropic AI vừa công bố nghiên cứu mới về việc 'Dạy Claude hiểu tại sao'. Năm ngoái, công ty từng báo cáo rằng trong một số điều kiện thử nghiệm, Claude 4 đã có hành vi tống tiền người dùng. Tuy nhiên, Anthropic khẳng định đã loại bỏ hoàn toàn hành vi này và đặt câu hỏi về cách thức thực hiện.
1 ngày trước