Course Outline

Bagian 1: Data Management di HDFS

  • Berbagai Format Data (JSON / Avro / Parquet)
  • Skema Kompresi
  • Penyamaran Data
  • Lab: Menganalisis berbagai format data; mengaktifkan kompresi

Bagian 2: Babi Lanjutan

  • Fungsi yang ditentukan pengguna
  • Pengantar Perpustakaan Babi (ElephantBird / Data-Fu)
  • Memuat Data Terstruktur Kompleks menggunakan Pig
  • Penyetelan Babi
  • Lab: skrip pig tingkat lanjut, parsing tipe data kompleks

Bagian 3 : Lanjutan Hive

  • Fungsi yang ditentukan pengguna
  • Tabel Terkompresi
  • Hive Penyetelan Performa
  • Lab: membuat tabel terkompresi, mengevaluasi format tabel dan konfigurasi

Bagian 4: HBase Lanjutan

  • Pemodelan Skema Tingkat Lanjut
  • Kompresi
  • Pengambilan Data Massal
  • Perbandingan meja lebar / meja tinggi
  • HBase dan Pig
  • HBase dan Hive
  • Penyetelan Performa HBase
  • Lab: penyetelan HBase; mengakses data HBase dari Pig & Hive; Menggunakan Phoenix untuk pemodelan data

Requirements

  • nyaman dengan bahasa pemrograman Java (sebagian besar latihan pemrograman menggunakan java)
  • nyaman di lingkungan Linux (dapat menavigasi baris perintah Linux, mengedit file menggunakan vi / nano)
  • pengetahuan kerja tentang Hadoop.

Lingkungan laboratorium

Zero Install: Tidak perlu menginstal perangkat lunak hadoop di komputer siswa! Kluster hadoop yang berfungsi akan disediakan untuk siswa.

Siswa akan membutuhkan hal-hal berikut ini

  • klien SSH (Linux dan Mac sudah memiliki klien ssh, untuk Windows Putty direkomendasikan)
  • browser untuk mengakses cluster. Kami merekomendasikan browser Firefox
 21 Hours

Number of participants


Price per participant

Testimonials (5)

Upcoming Courses (Minimal 5 peserta)

Related Categories