Course Outline

Pengantar Reinforcement Learning

  • Apa itu pembelajaran penguatan?
  • Konsep kunci: agen, lingkungan, status, tindakan, dan penghargaan
  • Tantangan dalam pembelajaran penguatan

Eksplorasi dan Eksploitasi

  • Menyeimbangkan eksplorasi dan eksploitasi dalam model RL
  • Strategi eksplorasi: epsilon-greedy, softmax, dan lainnya

Pembelajaran Q dan Jaringan Q Dalam (DQN)

  • Pengantar Q-learning
  • Implementasi DQN menggunakan TensorFlow
  • Mengoptimalkan Q-learning dengan pengalaman replay dan jaringan target

Metode Berbasis Kebijakan

  • Algoritma gradien kebijakan
  • Algoritma REINFORCE dan implementasinya
  • Metode aktor-kritikus

Bekerja dengan OpenAI Gym

  • Menyiapkan lingkungan di OpenAI Gym
  • Simulasi agen di lingkungan dinamis
  • Mengevaluasi kinerja agen

Teknik Lanjutan Reinforcement Learning

  • Pembelajaran penguatan multi-agen
  • Gradien kebijakan deterministik yang mendalam (DDPG)
  • Optimasi kebijakan proksimal (PPO)

Menyebarkan Reinforcement Learning Model

  • Aplikasi pembelajaran penguatan di dunia nyata
  • Mengintegrasikan model RL ke dalam lingkungan produksi

Ringkasan dan Langkah Berikutnya

Requirements

  • Pengalaman dengan pemrograman Python
  • Pemahaman dasar tentang konsep pembelajaran mendalam dan pembelajaran mesin
  • Pengetahuan tentang algoritma dan konsep matematika yang digunakan dalam pembelajaran penguatan

Hadirin

  • Ilmuwan data
  • Praktisi pembelajaran mesin
  • Peneliti AI
 28 Hours

Number of participants


Price per participant

Testimonials (4)

Upcoming Courses (Minimal 5 peserta)

Related Categories