Học tăng cường - Một phương pháp học máy cho phép các tác nhân học hành động tối ưu qua thử nghiệm và sai sót để tối đa hóa phần thưởng trong các môi trường động.
Trang web này sử dụng cookie để cung cấp cho bạn trải nghiệm người dùng tuyệt vời. Bằng cách sử dụng trang web này, bạn đồng ý với việc chúng tôi sử dụng cookie.