Course Outline

Pengantar Multimodal AI

  • Tinjauan umum AI multimodal dan aplikasi dunia nyata
  • Tantangan dalam mengintegrasikan data teks, gambar, dan audio
  • Penelitian dan kemajuan terkini

Pengolahan Data dan Rekayasa Fitur

  • Menangani dataset teks, gambar, dan audio
  • Teknik praproses untuk pembelajaran multimodal
  • Strategi ekstraksi fitur dan fusi data

Membangun Model Multimodal dengan PyTorch dan Hugging Face

  • Pengantar PyTorch untuk pembelajaran multimodal
  • Menggunakan Hugging Face Transformer untuk tugas NLP dan visi
  • Menggabungkan berbagai modalitas dalam model AI terpadu

Menerapkan Penggabungan Ucapan, Visi, dan Teks

  • Mengintegrasikan OpenAI Bisikan untuk pengenalan suara
  • Penerapan DeepSeek-Vision untuk pengolahan gambar
  • Teknik fusi untuk pembelajaran lintas modalitas

Pelatihan dan Optimalisasi Multimodal AI Model

  • Strategi pelatihan model untuk AI multimodal
  • Teknik optimasi dan penyetelan hiperparameter
  • Mengatasi bias dan meningkatkan generalisasi model

Penerapan Multimodal AI dalam Aplikasi Dunia Nyata

  • Mengekspor model untuk penggunaan produksi
  • Menerapkan model AI pada platform cloud
  • Pemantauan kinerja dan pemeliharaan model

Topik Lanjutan dan Tren Masa Depan

  • Pembelajaran zero-shot dan few-shot dalam AI multimodal
  • Pertimbangan etika dan pengembangan AI yang bertanggung jawab
  • Tren yang muncul dalam penelitian AI multimodal

Ringkasan dan Langkah Berikutnya

Requirements

  • Pemahaman yang kuat tentang konsep pembelajaran mesin dan pembelajaran mendalam
  • Pengalaman dengan kerangka kerja AI seperti PyTorch atau TensorFlow
  • Keakraban dengan pemrosesan data teks, gambar, dan audio

Hadirin

  • pengembang AI
  • Insinyur pembelajaran mesin
  • Peneliti
 21 Hours

Number of participants


Price per participant

Upcoming Courses (Minimal 5 peserta)

Related Categories