Course Outline

Pengantar Large Language Models (LLMs)

  • Ikhtisar LLM
  • Definisi dan signifikansi
  • Aplikasi di AI saat ini

Arsitektur Transformator

  • Apa itu trafo dan bagaimana cara kerjanya?
  • Komponen dan fitur utama
  • Penyematan dan pengkodean posisi
  • Perhatian multi-kepala
  • Jaringan saraf umpan maju
  • Normalisasi dan koneksi sisa

Model Transformator

  • Mekanisme perhatian diri
  • Arsitektur encoder-decoder
  • Penyematan posisi
  • BERT (Representasi Encoder Dua Arah dari Transformers)
  • GPT (Transformator Terlatih Generatif)

Optimasi Kinerja dan Kesalahannya

  • Panjang konteks
  • Model Mamba dan ruang negara
  • Perhatian kilat
  • Transformator jarang
  • Transformator penglihatan
  • Pentingnya kuantisasi

Meningkatkan Transformer

  • Pengambilan pembuatan teks tambahan
  • Campuran model
  • Pohon pemikiran

Mencari setelan

  • Teori adaptasi tingkat rendah
  • Menyempurnakan dengan QLora

Hukum Penskalaan dan Optimasi di LLM

  • Pentingnya hukum penskalaan untuk LLM
  • Penskalaan ukuran data dan model
  • Penskalaan komputasi
  • Penskalaan efisiensi parameter

Optimasi

  • Hubungan antara ukuran model, ukuran data, anggaran komputasi, dan persyaratan inferensi
  • Mengoptimalkan kinerja dan efisiensi LLM
  • Praktik dan alat terbaik untuk pelatihan dan penyempurnaan LLM

Pelatihan dan Penyempurnaan LLM

  • Langkah dan tantangan melatih LLM dari awal
  • Akuisisi dan pemeliharaan data
  • Persyaratan data, CPU, dan memori berskala besar
  • Tantangan optimasi
  • Lanskap LLM sumber terbuka

Dasar-dasar Reinforcement Learning (RL)

  • Pengantar Reinforcement Learning
  • Belajar melalui penguatan positif
  • Definisi dan konsep inti
  • Proses Keputusan Markov (MDP)
  • Pemrograman dinamis
  • Metode Monte Carlo
  • Pembelajaran Perbedaan Temporal

Dalam Reinforcement Learning

  • Jaringan Q Dalam (DQN)
  • Optimalisasi Kebijakan Proksimal (PPO)
  • Element dari Reinforcement Learning

Integrasi LLM dan Reinforcement Learning

  • Menggabungkan LLM dengan Reinforcement Learning
  • Bagaimana RL digunakan di LLM
  • Reinforcement Learning dengan Umpan Balik Manusia (RLHF)
  • Alternatif untuk RLHF

Studi Kasus dan Aplikasi

  • Aplikasi dunia nyata
  • Kisah sukses dan tantangan

Topik Lanjutan

  • Teknik tingkat lanjut
  • Metode pengoptimalan tingkat lanjut
  • Penelitian dan pengembangan mutakhir

Ringkasan dan Langkah Selanjutnya

Requirements

  • Pemahaman dasar tentang Machine Learning

Hadirin

  • Ilmuwan data
  • Insinyur perangkat lunak
 21 Hours

Number of participants


Price per participant

Upcoming Courses (Minimal 5 peserta)

Related Categories