Course Outline

Bagian 1: Pendahuluan Hadoop

  • sejarah hadoop, konsep
  • sistem ekologi
  • distribusi
  • arsitektur tingkat tinggi
  • Mitos Hadoop
  • tantangan hadoop
  • perangkat keras / perangkat lunak
  • lab : lihat pertama Hadoop

Bagian 2: HDFS

  • Desain dan arsitektur
  • konsep (skala horizontal, replikasi, lokalitas data, kesadaran rak)
  • Daemon : Namenode, Namenode sekunder, Node data
  • komunikasi / detak jantung
  • integritas data
  • jalur baca / tulis
  • Namenode Ketersediaan Tinggi (HA), Federasi
  • lab : Berinteraksi dengan HDFS

Bagian 3 : Peta Mengurangi

  • konsep dan arsitektur
  • daemon (MRV1) : pelacak pekerjaan / pelacak tugas
  • fase : driver, mapper, shuffle/sort, reducer
  • Peta Mengurangi Versi 1 dan Versi 2 (YARN)
  • Internal dari Map Reduce
  • Pengantar program Java Map Reduce
  • lab : Menjalankan contoh program MapReduce

Bagian 4 : Babi

  • pig vs java peta pengurangan
  • alur kerja babi
  • babi bahasa latin
  • ETL dengan Pig
  • Transformasi & Gabungan
  • Fungsi yang ditentukan pengguna (UDF)
  • lab : menulis skrip Pig untuk menganalisis data

Bagian 5: Hive

  • arsitektur dan desain
  • tipe data
  • SQL dukungan di Hive
  • Membuat tabel Hive dan melakukan query
  • partisi
  • bergabung
  • pengolahan teks
  • lab : berbagai lab tentang pemrosesan data dengan Hive

Bagian 6: HBase

  • konsep dan arsitektur
  • Perbandingan antara hbase dan rdbms
  • HBase Java API
  • Data deret waktu pada HBase
  • desain skema
  • labs : Berinteraksi dengan HBase menggunakan shell; pemrograman di HBase Java API ; Latihan desain skema

Requirements

  • nyaman dengan bahasa pemrograman Java (sebagian besar latihan pemrograman menggunakan java)
  • nyaman di lingkungan Linux (dapat menavigasi baris perintah Linux, mengedit file menggunakan vi / nano)

Lingkungan laboratorium

Zero Install: Tidak perlu menginstal perangkat lunak hadoop di komputer siswa! Kluster hadoop yang berfungsi akan disediakan untuk siswa.

Siswa akan membutuhkan hal-hal berikut ini

  • klien SSH (Linux dan Mac sudah memiliki klien ssh, untuk Windows Putty direkomendasikan)
  • browser untuk mengakses cluster. Kami merekomendasikan browser Firefox
 28 Hours

Number of participants


Price per participant

Testimonials (5)

Upcoming Courses (Minimal 5 peserta)

Related Categories