Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Course Outline
Perkenalan
- Belajar melalui penguatan positif
Element dari Reinforcement Learning
Istilah Penting (Tindakan, Status, Hadiah, Kebijakan, Nilai, Nilai-Q, dll.)
Tinjauan Umum Metode Solusi Tabular
Membuat Agen Perangkat Lunak
Memahami Pendekatan Berbasis Nilai, Berbasis Kebijakan, dan Berbasis Model
Bekerja dengan Proses Keputusan Markov (MDP)
Bagaimana Kebijakan Menentukan Cara Berperilaku Agen
Menggunakan Metode Monte Carlo
Pembelajaran Perbedaan Temporal
n-langkah Bootstrapping
Metode Solusi Perkiraan
Prediksi Sesuai Kebijakan dengan Perkiraan
Kontrol Sesuai Kebijakan dengan Perkiraan
Metode di Luar Kebijakan dengan Aproksimasi
Memahami Jejak Kelayakan
Menggunakan Metode Gradien Kebijakan
Ringkasan dan Kesimpulan
Requirements
- Pengalaman dengan pembelajaran mesin
- Programming pengalaman
Hadirin
- Ilmuwan data
21 Hours