Home
Big Data Training
Hadoop Training
Administrator Training for Apache Hadoop Training Course

Administrator Training for Apache Hadoop Training Course

Hadirin:

Kursus ini ditujukan untuk spesialis TI yang mencari solusi untuk menyimpan dan memproses kumpulan data besar dalam lingkungan sistem terdistribusi

Gohal:

Pengetahuan mendalam tentang administrasi cluster Hadoop.

Thank you for sending your enquiry! One of our team members will contact you shortly.

Thank you for sending your booking! One of our team members will contact you shortly.

Course Outline

1: HDFS (17%)

Jelaskan fungsi HDFS Daemons
Jelaskan operasi normal cluster Apache Hadoop, baik dalam penyimpanan data maupun dalam pemrosesan data.
Mengidentifikasi fitur-fitur terkini sistem komputasi yang memotivasi sistem seperti Apache Hadoop.
Klasifikasikan tujuan utama Desain HDFS
Mengingat suatu skenario, identifikasi kasus penggunaan yang tepat untuk Federasi HDFS
Mengidentifikasi komponen dan daemon cluster HDFS HA-Quorum
Menganalisis peran keamanan HDFS (Kerberos)
Tentukan pilihan serialisasi data terbaik untuk skenario tertentu
Jelaskan jalur baca dan tulis file
Mengidentifikasi perintah untuk memanipulasi file di Hadoop File System Shell

2: YARN dan MapReduce versi 2 (MRv2) (17%)

Memahami bagaimana peningkatan cluster dari Hadoop 1 ke Hadoop 2 memengaruhi pengaturan cluster
Memahami cara menyebarkan MapReduce v2 (MRv2 / YARN), termasuk semua daemon YARN
Memahami strategi desain dasar untuk MapReduce v2 (MRv2)
Tentukan bagaimana YARN menangani alokasi sumber daya
Identifikasi alur kerja pekerjaan MapReduce yang berjalan di YARN
Tentukan file mana yang harus Anda ubah dan bagaimana cara memigrasikan kluster dari MapReduce versi 1 (MRv1) ke MapReduce versi 2 (MRv2) yang berjalan di YARN.

3: Hadoop Perencanaan Klaster (16%)

Hal-hal utama yang perlu dipertimbangkan dalam memilih perangkat keras dan sistem operasi untuk menghosting kluster Apache Hadoop.
Menganalisis pilihan dalam memilih OS
Memahami penyetelan kernel dan pertukaran disk
Mengingat skenario dan pola beban kerja, identifikasi konfigurasi perangkat keras yang sesuai dengan skenario tersebut
Mengingat suatu skenario, tentukan komponen ekosistem yang perlu dijalankan oleh cluster Anda agar memenuhi SLA
Ukuran kluster: berdasarkan skenario dan frekuensi eksekusi, identifikasi spesifikasi untuk beban kerja, termasuk CPU, memori, penyimpanan, I/O disk
Ukuran dan Konfigurasi Disk, termasuk JBOD versus RAID, SAN, virtualisasi, dan persyaratan ukuran disk dalam kluster
Topologi Jaringan: memahami penggunaan jaringan di Hadoop (untuk HDFS dan MapReduce) dan mengusulkan atau mengidentifikasi komponen desain jaringan utama untuk skenario tertentu

4: Hadoop Instalasi dan Administrasi Cluster (25%)

Mengingat suatu skenario, identifikasi bagaimana cluster akan menangani kegagalan disk dan mesin
Menganalisis konfigurasi logging dan format file konfigurasi logging
Memahami dasar-dasar metrik Hadoop dan pemantauan kesehatan klaster
Mengidentifikasi fungsi dan tujuan alat yang tersedia untuk pemantauan klaster
Dapat menginstal semua komponen ekosistem di CDH 5, termasuk (tetapi tidak terbatas pada): Impala, Flume, Oozie, Hue, Manager, Sqoop, Hive, dan Pig
Identifikasi fungsi dan tujuan alat yang tersedia untuk mengelola sistem file Apache Hadoop

5: Sumber Daya Management (10%)

Memahami tujuan desain keseluruhan dari masing-masing Hadoop penjadwal
Mengingat skenario, tentukan bagaimana Penjadwal FIFO mengalokasikan sumber daya cluster
Mengingat suatu skenario, tentukan bagaimana Penjadwal Adil mengalokasikan sumber daya kluster di bawah YARN
Mengingat skenario tertentu, tentukan bagaimana Penjadwal Kapasitas mengalokasikan sumber daya kluster

6: Pemantauan dan Pencatatan (15%)

Memahami fungsi dan fitur kemampuan pengumpulan metrik Hadoop
Menganalisis UI Web NameNode dan JobTracker
Memahami cara memantau Daemon cluster
Mengidentifikasi dan memantau penggunaan CPU pada node master
Jelaskan cara memantau swap dan alokasi memori pada semua node
Identifikasi cara melihat dan mengelola file log Hadoop
Menafsirkan file log

Requirements

Keterampilan administrasi dasar Linux
Keterampilan pemrograman dasar

35 Hours

Number of participants

Online

Classroom

Select Location

Please select a Venue

Price per participant

Open Training Courses require 5+ participants.

Administrator Training for Apache Hadoop Training Course - Booking

Full name *

Email *

Phone *

Job Title

Company Name

Address 1 *

City *

State / Province

Country *

Postcode *

Start Date

Tax ID

Dates are subject to availability and take place between 09:30 and 16:30.

Payment *

Bank Transfer (Invoice, PO)

Debit / Credit Card

Comments

Allow Publishing Certificate

If you check this box the participants will receive an option to publish their course certificate on the NobleProg Certified Professional Catalogue.

Terms and Conditions *

I am an authorised representative of the above named client and I wish to book the above courses or services in accordance with NobleProg Terms and Conditions and Privacy Policy.

Inform me about discounts and promotions

Please read our Privacy Policy to find out how we use your data

Administrator Training for Apache Hadoop Training Course - Enquiry

Full name *

Email *

Phone *

Number of participants

Company Name

Company Address

How do you want to take the course?

Client Premises

Online

Classroom

Comments

Inform me about discounts and promotions

Please read our Privacy Policy to find out how we use your data

Administrator Training for Apache Hadoop - Consultancy Enquiry

Consultancy Enquiry

Full name *

Phone *

Email *

Company Name

Consultancy Subject *

Consultancy Goal

Consultancy Duration

Number of Consultants

Suitable Date

Who will the consultant work with?

Consultancy Urgency *

Comments

Inform me about discounts and promotions

Please read our Privacy Policy to find out how we use your data

Testimonials (3)

I genuinely enjoyed the many hands-on sessions.

Jacek Pieczatka

Course - Administrator Training for Apache Hadoop

I genuinely enjoyed the big competences of Trainer.

Grzegorz Gorski

Course - Administrator Training for Apache Hadoop

I mostly liked the trainer giving real live Examples.

Simon Hahn

Course - Administrator Training for Apache Hadoop

100763635 IDR (Classroom)

Related Courses

Advanced R

14 Hours

Kursus ini membahas topik-topik lanjutan dalam pemrograman R.

Algorithmic Trading with Python and R

14 Hours

Pelatihan langsung yang dipimpin instruktur dalam Indonesia (online atau di tempat) ini ditujukan untuk analis bisnis yang ingin mengotomatiskan perdagangan dengan perdagangan algoritmik, Python, dan R.

Pada akhir pelatihan ini, peserta akan dapat:

Gunakan algoritma untuk membeli dan menjual sekuritas pada kenaikan khusus dengan cepat.
Kurangi biaya yang terkait dengan perdagangan menggunakan perdagangan algoritmik.
Pantau harga saham dan lakukan perdagangan secara otomatis.

Programming with Big Data in R

21 Hours

Big Data is a term that refers to solutions destined for storing and processing large data sets. Developed by Google initially, these Big Data solutions have evolved and inspired other similar projects, many of which are available as open-source. R is a popular programming language in the financial industry.

Introductory R (Basic to Intermediate)

14 Hours

Pelatihan langsung yang dipandu instruktur di Indonesia (online atau di tempat) ini ditujukan untuk analis data tingkat pemula yang ingin menggunakan pemrograman R untuk memanipulasi data, melakukan analisis data dasar, dan membuat visualisasi yang menarik untuk wawasan.

Pada akhir pelatihan ini, peserta akan dapat:

Memahami dasar-dasar R Programming.
Terapkan proses ilmu data fundamental.
Membuat representasi visual dari data.

R Fundamentals

21 Hours

R is an open-source free programming language for statistical computing, data analysis, and graphics. R is used by a growing number of managers and data analysts inside corporations and academia. R has also found followers among statisticians, engineers and scientists without computer programming skills who find it easy to use. Its popularity is due to the increasing use of data mining for various goals such as set ad prices, find new drugs more quickly or fine-tune financial models. R has a wide variety of packages for data mining.

Cluster Analysis with R and SAS

14 Hours

This instructor-led, live training in Indonesia (online or onsite) is aimed at data analysts who wish to program with R in SAS for cluster analysis.

By the end of this training, participants will be able to:

Use cluster analysis for data mining
Master R syntax for clustering solutions.
Implement hierarchical and non-hierarchical clustering.
Make data-driven decisions to help to improve business operations.

Data and Analytics - from the ground up

42 Hours

Data analytics is a crucial tool in business today. We will focus throughout on developing skills for practical hands on data analysis. The aim is to help delegates to give evidence-based answers to questions:

What has happened?

processing and analyzing data
producing informative data visualizations

What will happen?

forecasting future performance
evaluating forecasts

What should happen?

turning data into evidence-based business decisions
optimizing processes

The course itself can be delivered either as a 6 day classroom course or remotely over a period of weeks if preferred. We can work with you to deliver the course to best suit your needs.

Data Analysis with Python, R, Power Query, and Power BI

21 Hours

Pelatihan langsung yang dipandu instruktur di Indonesia (online atau di tempat) ini ditujukan untuk profesional tingkat pemula yang ingin membersihkan dan menganalisis data, membuat proyeksi statistik, dan membuat visualisasi mendalam menggunakan alat ini.

Pada akhir pelatihan ini, peserta akan dapat:

Memahami dasar-dasar Python, R, Power Query, dan Power BI untuk analisis data.
Bersihkan dan atur kumpulan data menggunakan Python dan Power Query.
Lakukan analisis statistik dan proyeksi dengan R.
Buat dasbor dan laporan profesional dengan Power BI.
Integrasikan dan analisis data dari berbagai sumber secara efektif.

Data Analytics With R

21 Hours

R adalah lingkungan sumber terbuka yang sangat populer untuk komputasi statistik, analisis data, dan grafik. Kursus ini memperkenalkan bahasa pemrograman R kepada siswa. Kursus ini mencakup dasar-dasar bahasa, pustaka, dan konsep tingkat lanjut. Analisis data tingkat lanjut dan pembuatan grafik dengan data dunia nyata.

Hadirin

Pengembang / analisis data

Lamanya

3 hari

Format

Kuliah dan Praktik

Data Mining with R

14 Hours

Econometrics: Eviews and Risk Simulator

21 Hours

This instructor-led, live training in Indonesia (online or onsite) is aimed at anyone who wishes to learn and master the fundamentals of econometric analysis and modeling.

By the end of this training, participants will be able to:

Learn and understand the fundamentals of econometrics.
Utilize Eviews and risk simulators.

HR Analytics for Public Organisations

14 Hours

Pelatihan langsung yang dipimpin instruktur (online atau di lokasi) ini ditujukan bagi para profesional HR yang ingin menggunakan metode analitis untuk meningkatkan kinerja organisasi. Mata kuliah ini mencakup pendekatan kualitatif, kuantitatif, empiris dan statistik.

Format Kursus

Ceramah dan diskusi interaktif.
Banyak latihan dan latihan.

Opsi Kustomisasi Kursus

Untuk meminta pelatihan khusus untuk kursus ini, silakan hubungi kami untuk mengaturnya.

Statistical Analysis using SPSS

21 Hours

Pelatihan langsung yang dipandu instruktur di Indonesia (online atau di tempat) ini ditujukan untuk profesional tingkat pemula hingga menengah yang ingin melakukan analisis statistik menggunakan SPSS untuk menginterpretasikan data secara akurat, menjalankan uji statistik yang kompleks, dan menghasilkan wawasan yang berarti.

Pada akhir pelatihan ini, peserta akan dapat:

Navigasi antarmuka SPSS dan kelola kumpulan data secara efisien.
Melakukan analisis statistik deskriptif dan inferensial.
Melakukan uji-t, ANOVA, MANOVA, regresi, dan analisis korelasi.
Terapkan pengujian non-parametrik, analisis komponen utama, dan analisis faktor untuk interpretasi data tingkat lanjut.

Talent Acquisition Analytics

14 Hours

Pelatihan langsung yang dipimpin instruktur (online atau di lokasi) ini ditujukan untuk profesional SDM dan spesialis rekrutmen yang ingin menggunakan metode analitis untuk meningkatkan kinerja organisasi. Mata kuliah ini mencakup pendekatan kualitatif, kuantitatif, empiris dan statistik.

Format Kursus

Ceramah dan diskusi interaktif.
Banyak latihan dan latihan.

Opsi Kustomisasi Kursus

Untuk meminta pelatihan khusus untuk kursus ini, silakan hubungi kami untuk mengaturnya.

Introduction to Data Visualization with Tidyverse and R

7 Hours

The Tidyverse is a collection of versatile R packages for cleaning, processing, modeling, and visualizing data. Some of the packages included are: ggplot2, dplyr, tidyr, readr, purrr, and tibble.

In this instructor-led, live training, participants will learn how to manipulate and visualize data using the tools included in the Tidyverse.

By the end of this training, participants will be able to:

Perform data analysis and create appealing visualizations
Draw useful conclusions from various datasets of sample data
Filter, sort and summarize data to answer exploratory questions
Turn processed data into informative line plots, bar plots, histograms
Import and filter data from diverse data sources, including Excel, CSV, and SPSS files

Audience

Beginners to the R language
Beginners to data analysis and data visualization

Format of the course

Part lecture, part discussion, exercises and heavy hands-on practice

Administrator Training for Apache Hadoop Training Course

Hadirin:

Gohal:

Course Outline

1: HDFS (17%)

2: YARN dan MapReduce versi 2 (MRv2) (17%)

3: Hadoop Perencanaan Klaster (16%)

4: Hadoop Instalasi dan Administrasi Cluster (25%)

5: Sumber Daya Management (10%)

6: Pemantauan dan Pencatatan (15%)

Requirements

Testimonials (3)

Jacek Pieczatka

Course - Administrator Training for Apache Hadoop

Grzegorz Gorski

Course - Administrator Training for Apache Hadoop

Simon Hahn

Course - Administrator Training for Apache Hadoop

Upcoming Courses (Minimal 5 peserta)

Administrator Training for Apache Hadoop

Administrator Training for Apache Hadoop

Administrator Training for Apache Hadoop

Administrator Training for Apache Hadoop

Administrator Training for Apache Hadoop

Related Categories

This site in other countries/regions

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites

Administrator Training for Apache Hadoop Training Course

Hadirin:

Gohal:

Course Outline

1: HDFS (17%)

2: YARN dan MapReduce versi 2 (MRv2) (17%)

3: Hadoop Perencanaan Klaster (16%)

4: Hadoop Instalasi dan Administrasi Cluster (25%)

5: Sumber Daya Management (10%)

6: Pemantauan dan Pencatatan (15%)

Requirements

Testimonials (3)

Jacek Pieczatka

Course - Administrator Training for Apache Hadoop

Grzegorz Gorski

Course - Administrator Training for Apache Hadoop

Simon Hahn

Course - Administrator Training for Apache Hadoop

Upcoming Courses (Minimal 5 peserta)

Administrator Training for Apache Hadoop

Administrator Training for Apache Hadoop

Administrator Training for Apache Hadoop

Administrator Training for Apache Hadoop

Administrator Training for Apache Hadoop

Related Courses

Advanced R

Algorithmic Trading with Python and R

Programming with Big Data in R

Introductory R (Basic to Intermediate)

R Fundamentals

Cluster Analysis with R and SAS

Data and Analytics - from the ground up

What has happened?

What will happen?

What should happen?

Data Analysis with Python, R, Power Query, and Power BI

Data Analytics With R

Hadirin

Lamanya

Format

Data Mining with R

Econometrics: Eviews and Risk Simulator

HR Analytics for Public Organisations

Statistical Analysis using SPSS

Talent Acquisition Analytics

Introduction to Data Visualization with Tidyverse and R

Related Categories

Hadoop

Statistics

This site in other countries/regions

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites