Course Outline

Perkenalan

  • Belajar melalui penguatan positif

Element dari Reinforcement Learning

Istilah Penting (Tindakan, Status, Hadiah, Kebijakan, Nilai, Nilai-Q, dll.)

Tinjauan Umum Metode Solusi Tabular

Membuat Agen Perangkat Lunak

Memahami Pendekatan Berbasis Nilai, Berbasis Kebijakan, dan Berbasis Model

Bekerja dengan Proses Keputusan Markov (MDP)

Bagaimana Kebijakan Menentukan Cara Berperilaku Agen

Menggunakan Metode Monte Carlo

Pembelajaran Perbedaan Temporal

n-langkah Bootstrapping

Metode Solusi Perkiraan

Prediksi Sesuai Kebijakan dengan Perkiraan

Kontrol Sesuai Kebijakan dengan Perkiraan

Metode di Luar Kebijakan dengan Aproksimasi

Memahami Jejak Kelayakan

Menggunakan Metode Gradien Kebijakan

Ringkasan dan Kesimpulan

Requirements

  • Pengalaman dengan pembelajaran mesin
  • Programming pengalaman

Hadirin

  • Ilmuwan data
 21 Hours

Number of participants


Price per participant

Upcoming Courses (Minimal 5 peserta)

Related Categories