Course Outline

Pengantar Reinforcement Learning

  • Tinjauan umum pembelajaran penguatan dan penerapannya
  • Perbedaan antara pembelajaran terbimbing, tanpa pengawasan, dan penguatan
  • Konsep kunci: agen, lingkungan, penghargaan, dan kebijakan

Proses Keputusan Markov (MDP)

  • Memahami status, tindakan, penghargaan, dan transisi status
  • Fungsi nilai dan Persamaan Bellman
  • Pemrograman dinamis untuk menyelesaikan MDP

Algoritma RL Inti

  • Metode tabular: Q-Learning dan SARSA
  • Metode berbasis kebijakan: algoritma REINFORCE
  • Kerangka kerja Aktor-Kritikus dan aplikasinya

Dalam Reinforcement Learning

  • Pengantar Jaringan Q Dalam (DQN)
  • Rasakan tayangan ulang dan jaringan target
  • Gradien kebijakan dan metode RL mendalam yang canggih

Kerangka Kerja dan Alat RL

  • Pengenalan ke OpenAI Gym dan lingkungan RL lainnya
  • Menggunakan PyTorch atau TensorFlow untuk pengembangan model RL
  • Pelatihan, pengujian, dan pembandingan agen RL

Tantangan dalam kehidupan nyata

  • Menyeimbangkan eksplorasi dan eksploitasi dalam pelatihan
  • Berurusan dengan masalah penghargaan dan penugasan kredit yang jarang
  • Scalatantangan kemampuan dan komputasi dalam RL

Praktik Langsung Activiti

  • Menerapkan algoritma Q-Learning dan SARSA dari awal
  • Melatih agen berbasis DQN untuk memainkan permainan sederhana di OpenAI Gym
  • Menyempurnakan model RL untuk meningkatkan kinerja di lingkungan khusus

Ringkasan dan Langkah Berikutnya

Requirements

  • Pemahaman yang kuat tentang prinsip dan algoritma pembelajaran mesin
  • Kemampuan dalam Python pemrograman
  • Keakraban dengan jaringan saraf dan kerangka kerja pembelajaran mendalam

Hadirin

  • Insinyur pembelajaran mesin
  • Spesialis AI
 14 Hours

Number of participants


Price per participant

Upcoming Courses (Minimal 5 peserta)

Related Categories