Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Course Outline
Pengantar Large Language Models (LLMs)
- Ikhtisar LLM
- Definisi dan signifikansi
- Aplikasi di AI saat ini
Arsitektur Transformator
- Apa itu trafo dan bagaimana cara kerjanya?
- Komponen dan fitur utama
- Penyematan dan pengkodean posisi
- Perhatian multi-kepala
- Jaringan saraf umpan maju
- Normalisasi dan koneksi sisa
Model Transformator
- Mekanisme perhatian diri
- Arsitektur encoder-decoder
- Penyematan posisi
- BERT (Representasi Encoder Dua Arah dari Transformers)
- GPT (Transformator Terlatih Generatif)
Optimasi Kinerja dan Kesalahannya
- Panjang konteks
- Model Mamba dan ruang negara
- Perhatian kilat
- Transformator jarang
- Transformator penglihatan
- Pentingnya kuantisasi
Meningkatkan Transformer
- Pengambilan pembuatan teks tambahan
- Campuran model
- Pohon pemikiran
Mencari setelan
- Teori adaptasi tingkat rendah
- Menyempurnakan dengan QLora
Hukum Penskalaan dan Optimasi di LLM
- Pentingnya hukum penskalaan untuk LLM
- Penskalaan ukuran data dan model
- Penskalaan komputasi
- Penskalaan efisiensi parameter
Optimasi
- Hubungan antara ukuran model, ukuran data, anggaran komputasi, dan persyaratan inferensi
- Mengoptimalkan kinerja dan efisiensi LLM
- Praktik dan alat terbaik untuk pelatihan dan penyempurnaan LLM
Pelatihan dan Penyempurnaan LLM
- Langkah dan tantangan melatih LLM dari awal
- Akuisisi dan pemeliharaan data
- Persyaratan data, CPU, dan memori berskala besar
- Tantangan optimasi
- Lanskap LLM sumber terbuka
Dasar-dasar Reinforcement Learning (RL)
- Pengantar Reinforcement Learning
- Belajar melalui penguatan positif
- Definisi dan konsep inti
- Proses Keputusan Markov (MDP)
- Pemrograman dinamis
- Metode Monte Carlo
- Pembelajaran Perbedaan Temporal
Dalam Reinforcement Learning
- Jaringan Q Dalam (DQN)
- Optimalisasi Kebijakan Proksimal (PPO)
- Element dari Reinforcement Learning
Integrasi LLM dan Reinforcement Learning
- Menggabungkan LLM dengan Reinforcement Learning
- Bagaimana RL digunakan di LLM
- Reinforcement Learning dengan Umpan Balik Manusia (RLHF)
- Alternatif untuk RLHF
Studi Kasus dan Aplikasi
- Aplikasi dunia nyata
- Kisah sukses dan tantangan
Topik Lanjutan
- Teknik tingkat lanjut
- Metode pengoptimalan tingkat lanjut
- Penelitian dan pengembangan mutakhir
Ringkasan dan Langkah Selanjutnya
Requirements
- Pemahaman dasar tentang Machine Learning
Hadirin
- Ilmuwan data
- Insinyur perangkat lunak
21 Hours