Eğitim İçeriği

Bölüm 1: Data Management HDFS'de

  • Çeşitli Veri Formatları (JSON / Avro / Parquet)
  • Sıkıştırma Şemaları
  • Veri Maskeleme
  • Laboratuvarlar: Farklı veri formatlarını analiz etme; sıkıştırmayı etkinleştirme

Bölüm 2: İleri Düzey Pig

  • Kullanıcı Tanımlı Fonksiyonlar
  • Pig Kütüphanelerine Giriş (ElephantBird / Data-Fu)
  • Pig Kullanarak Karmaşık Yapılandırılmış Verileri Yükleme
  • Pig Ayarlama
  • Laboratuvarlar: ileri düzey Pig betiği yazma, karmaşık veri türlerini ayrıştırma

Bölüm 3: İleri Düzey Hive

  • Kullanıcı Tanımlı Fonksiyonlar
  • Sıkıştırılmış Tablolar
  • Hive Performans Ayarlama
  • Laboratuvarlar: sıkıştırılmış tablolar oluşturma, tablo formatlarını ve yapılandırmayı değerlendirme

Bölüm 4: İleri Düzey HBase

  • İleri Düzey Şema Modelleme
  • Sıkıştırma
  • Toplu Veri Alma
  • Geniş-tablo / Uzun-tablo karşılaştırması
  • HBase ve Pig
  • HBase ve Hive
  • HBase Performans Ayarlama
  • Laboratuvarlar: HBase'i ayarlama; Pig & Hive’den HBase verilerine erişme; Veri modellemesi için Phoenix kullanma

Kurs İçin Gerekli Önbilgiler

  • Java programlama diline aşina olmak (çoğu programlama alıştırması java ile yapılır)
  • Linux ortamına aşina olmak ( Linux komut satırında gezinme, vi / nano kullanarak dosyaları düzenleme becerisi)
  • Hadoop hakkında çalışma bilgisine sahip olmak.

Laboratuvar ortamı

Zero Install:Öğrencilerin makinelerine hadoop yazılımı kurmaya gerek yok! Öğrencilere çalışan bir hadoop kümesi sağlanacaktır.

Öğrencilerin aşağıdakilere ihtiyacı olacak

  • bir SSH istemcisi (Linux ve Mac'lerde zaten SSH istemcileri bulunmaktadır, Windows için Puttyönerilir)
  • kümeye erişmek için bir tarayıcı. Firefox tarayıcısıöneriyoruz
 21 Saat

Katılımcı Sayısı


Kişi Başına Fiyat

Danışanlarımızın Yorumları (5)

Yaklaşan Etkinlikler

İlgili Kategoriler