Eğitim İçeriği
Giriş
- Cloud Computing ve Big Data çözümlerine giriş
- Apache Hadoop Özellikleri ve Mimarisinin Genel Bakışı
Hadoop Kurulumu
- Hadoop kümesinin planlanması (şirket içi, bulut vb.)
- İşletim sistemi ve Hadoop dağıtımının seçilmesi
- Kaynakların sağlanması (donanım, ağ vb.)
- Yazılımın indirilmesi ve kurulması
- Esneklik için kümenin boyutlandırılması
HDFS ile Çalışma
- Hadoop Dağıtık Dosya Sistemi (HDFS) Anlayışı
- HDFS Komut Referansına Genel Bakış
- HDFS’yi Accesslama
- HDFS’de Temel Dosya İşlemlerini Gerçekleştirme
- HDFS’ye Ek Olarak S3 Kullanımı
MapReduce’e Genel Bakış
- MapReduce Çerçevesinde Veri Akışının Anlaşılması
- Map, Karıştırma, Sıralama ve Azaltma
- Demo: En Yüksek Maaşları Hesaplama
YARN ile Çalışma
- Hadoop’de kaynak yönetiminin anlaşılması
- ResourceManager, NodeManager, Application Master ile çalışma
- YARN altında işlerin zamanlanması
- Çok sayıda düğüm ve küme için zamanlama
- Demo: İş zamanlama
Hadoop ile Spark Entegrasyonu
- Spark için depolama kurulumu (HDFS, Amazon, S3, NoSQL vb.)
- Dirençli Dağıtık Veri Kümeleri (RDD’ler) Anlayışı
- Bir RDD Oluşturma
- RDD Dönüşümlerini Uygulama
- Demo: Film Başlıkları için Bir Metin Arama Programı Uygulama
Hadoop Kümesini Yönetme
- Hadoop’i İzleme
- Hadoop kümesini güvence altına alma
- Düğüm ekleme ve kaldırma
- Bir performans kıyaslaması çalıştırma
- Performansı optimize etmek için bir Hadoop kümesini ayarlama
- Yedekleme, kurtarma ve iş sürekliliği planlaması
- Yüksek kullanılabilirlik (HA) sağlama
Hadoop Kümesini Yükseltme ve Geçirme
- İş yükü gereksinimlerini değerlendirme
- Hadoop’i Yükseltme
- Şirket içi ortamdan buluta ve tersi geçiş
- Hatalardan kurtarma
Sorun Giderme
Özet ve Sonuç
Kurs İçin Gerekli Önbilgiler
- Sistem yönetimi deneyimi
- Linux komut satırı ile deneyim
- Büyük veri kavramlarına ilişkin anlayış
Hedef Kitle
- Sistem yöneticileri
- Veritabanı yöneticileri (DBA'lar)
Danışanlarımızın Yorumları (5)
A lot of practical examples, different ways to approach the same problem, and sometimes not so obvious tricks how to improve the current solution
Rafal - Nordea
Eğitim - Apache Spark MLlib
very interactive...
Richard Langford
Eğitim - SMACK Stack for Data Science
Sufficient hands on, trainer is knowledgable
Chris Tan
Eğitim - A Practical Introduction to Stream Processing
Trainer's preparation & organization, and quality of materials provided on github.
Mateusz Rek - MicroStrategy Poland Sp. z o.o.
Eğitim - Impala for Business Intelligence
Get to learn spark streaming , databricks and aws redshift