Course Outline

Pendahuluan Data Analysis dan Big Data

  • Apa yang Membuat Big Data “Besar”?
    • Kecepatan, Volume, Variasi, Kebenaran (VVVV)
  • Batasan Pemrosesan Data Tradisional
  • Pemrosesan Terdistribusi
  • Analisis Statistik
  • Jenis-jenis Analisis Machine Learning
  • Data Visualization

Big Data Peran dan Tanggung Jawab

  • Administrator
  • Pengembang
  • Analis Data

Languages Digunakan untuk Data Analysis

  • R Language
    • Mengapa R untuk Data Analysis?
    • Manipulasi data, perhitungan dan tampilan grafis
  • Python
    • Mengapa Python untuk Data Analysis?
    • Memanipulasi, memproses, membersihkan, dan menganalisis data

Pendekatan untuk Data Analysis

  • Analisis Statistik
    • Analisis Deret Waktu
    • Forecasting dengan model Korelasi dan Regresi
    • Inferensial Statistics (memperkirakan)
    • Deskriptif Statistics dalam Big Data set (misalnya menghitung rata-rata)
  • Machine Learning
    • Pembelajaran dengan pengawasan vs. pembelajaran tanpa pengawasan
    • Klasifikasi dan pengelompokan
    • Memperkirakan biaya metode tertentu
    • Penyaringan
  • Pemrosesan Bahasa Alami
    • Memproses teks
    • Memahami makna teks
    • Pembuatan teks otomatis
    • Analisis sentimen / analisis topik
  • Computer Vision
    • Memperoleh, memproses, menganalisis, dan memahami gambar
    • Merekonstruksi, menafsirkan, dan memahami pemandangan 3D
    • Menggunakan data gambar untuk membuat keputusan

Big Data Infrastruktur

  • Penyimpanan Data
    • Basis data relasional (SQL)
      • MySQL
      • Postgres
      • Oracle
    • Basis data non-relasional (NoSQL)
      • Cassandra
      • MongoDB
      • Neo4j detik
    • Memahami nuansanya
      • Basis data hierarkis
      • Basis data berorientasi objek
      • Basis data berorientasi dokumen
      • Basis data berorientasi grafik
      • Lainnya
  • Pemrosesan Terdistribusi
    • Hadoop
      • HDFS sebagai sistem berkas terdistribusi
      • MapReduce untuk pemrosesan terdistribusi
    • Percikan
      • Kerangka kerja komputasi kluster dalam memori all-in-one untuk pemrosesan data skala besar
      • Streaming terstruktur
      • Percikan SQL
      • Machine Learning perpustakaan: MLlib
      • Pemrosesan grafik dengan GraphX
  • Scalakemampuan
    • Awan publik
      • AWS, Google, Aliyun, dll.
    • Awan pribadi
      • OpenStack, Cloud Foundry, dll.
    • Skalabilitas otomatis

Memilih Solusi yang Tepat untuk Masalah

Masa Depan Big Data

Ringkasan dan Langkah Berikutnya

Requirements

  • Pemahaman umum tentang matematika
  • Pemahaman umum tentang pemrograman
  • Pemahaman umum tentang database

Hadirin

  • Pengembang / Programmer
  • Konsultan TI
 35 Hours

Number of participants


Price per participant

Testimonials (7)

Upcoming Courses (Minimal 5 peserta)

Related Categories