Học tăng cường - Một phương pháp học máy cho phép các tác nhân học hành động tối ưu qua thử nghiệm và sai sót để tối đa hóa phần thưởng trong các môi trường động.

Không tìm thấy bản ghi nào.