Course Outline

Big Data Gambaran Umum:

  • Apa itu Big Data
  • Mengapa Big Data semakin populer
  • Big Data Studi Kasus
  • Big Data Karakteristik
  • Solusi untuk dikerjakan pada Big Data.

Hadoop & Komponennya:

  • Apa itu Hadoop dan apa saja komponennya.
  • Hadoop Arsitektur dan karakteristik Data yang dapat ditanganinya / Diproses.
  • Singkat tentang Hadoop Sejarah, perusahaan yang menggunakannya dan mengapa mereka mulai menggunakannya.
  • Hadoop Kerangka kerja & komponennya - dijelaskan secara rinci.
  • Apa itu HDFS dan Membaca-Menulis ke Hadoop Sistem File Terdistribusi.
  • Cara Setup Hadoop Cluster dalam berbagai mode- Stand-alone/Pseudo/Multi Node cluster.

(Ini termasuk menyiapkan cluster Hadoop di VirtualBox/KVM/VMware, Konfigurasi jaringan yang perlu diperhatikan secara cermat, menjalankan Hadoop Daemon dan menguji cluster).

  • Apa itu kerangka kerja Map Reduce dan bagaimana cara kerjanya.
  • Menjalankan pekerjaan Map Reduce pada cluster Hadoop.
  • Memahami Replikasi, Pencerminan dan Kesadaran Rak dalam konteks cluster Hadoop.

Hadoop Perencanaan Klaster:

  • Cara merencanakan klaster Hadoop Anda.
  • Memahami perangkat keras-perangkat lunak untuk merencanakan kluster hadoop Anda.
  • Memahami beban kerja dan merencanakan klaster untuk menghindari kegagalan dan berkinerja optimal.

Apa itu MapR dan mengapa MapR :

  • Gambaran umum MapR dan arsitekturnya.
  • Pemahaman dan cara kerja Sistem Kontrol MapR, Volume MapR, snapshot & Mirror.
  • Merencanakan klaster dalam konteks MapR.
  • Perbandingan MapR dengan distribusi lain dan Apache Hadoop.
  • Instalasi MapR dan penyebaran klaster.

Pengaturan & Administrasi Klaster:

  • Mengelola layanan, node, snapshot, volume cermin dan kluster jarak jauh.
  • Memahami dan mengelola Node.
  • Pemahaman tentang Hadoop komponen, Menginstal Hadoop komponen bersama Layanan MapR.
  • Accessing Data pada cluster termasuk melalui NFS Mengelola layanan & node.
  • Mengelola data dengan menggunakan volume, mengelola pengguna dan grup, mengelola & menetapkan peran pada node, komisioning dekomisioning node, administrasi klaster dan pemantauan performa, mengonfigurasi/menganalisis dan memantau metrik untuk memantau performa, mengonfigurasi dan mengelola keamanan MapR.
  • Memahami dan bekerja dengan penyimpanan asli M7 untuk tabel MapR.
  • Konfigurasi dan penyetelan kluster untuk kinerja optimal.

Peningkatan klaster dan integrasi dengan pengaturan lain:

  • Memutakhirkan versi perangkat lunak MapR dan jenis pemutakhiran.
  • Mengonfigurasi klaster Mapr untuk mengakses klaster HDFS.
  • Menyiapkan klaster MapR pada Amazon Elastic Mapreduce.

Semua topik di atas mencakup Demonstrasi dan sesi praktik bagi peserta didik untuk memperoleh pengalaman langsung tentang teknologi.

Requirements

  • Pengetahuan dasar tentang Linux FS
  • Dasar Java
  • Pengetahuan tentang Apache Hadoop (disarankan)
 28 Hours

Number of participants


Price per participant

Testimonials (1)

Upcoming Courses (Minimal 5 peserta)

Related Categories