← Về từ điểnQuantization là cách làm cho các mô hình AI nhỏ gọn hơn bằng cách giảm độ chính xác của các con số bên trong. Giống như việc bạn rút gọn một số thập phân dài thành số tròn hơn để dễ nhớ và dùng nhanh hơn, giúp AI chạy mượt mà trên các thiết bị yếu.
Ví dụĐể Claude chạy được trên điện thoại, các nhà phát triển thường dùng quantization để giảm kích thước mô hình mà vẫn giữ được hiệu suất tốt.
Còn gọi làlượng tử hóaquantize