Đánh giá khả năng nghiên cứu tin sinh học của Claude với BioMysteryBench
Anthropic đã công bố một nghiên cứu mới nhằm đánh giá khả năng của Claude trong lĩnh vực tin sinh học. Nghiên cứu này sử dụng bộ tiêu chuẩn BioMysteryBench để kiểm tra hiệu suất của Claude trong các tác vụ phức tạp liên quan đến dữ liệu sinh học. Mục tiêu là xác định mức độ Claude có thể hỗ trợ các nhà khoa học trong việc phân tích và giải thích thông tin sinh học.
2 giờ trước