Eğitim İçeriği
-
Scala temeli
- Scala'ya hızlı bir giriş
- Laboratuvarlar: Scala'yı tanıma
-
Spark Temelleri
- Arka plan ve tarihçe
- Spark ve Hadoop
- Spark kavramları ve mimarisi
- Spark ekosistemi (çekirdek, Spark SQL, MLlib, akış)
- Laboratuvarlar: Spark'ı kurma ve çalıştırma
-
Spark'a İlk Bakış
- Spark'ı yerel modda çalıştırma
- Spark web arayüzü
- Spark kabuğu
- Veri kümesini analiz etme – bölüm 1
- RDD'leri inceleme
- Laboratuvarlar: Spark kabuğu keşfi
-
RDD'ler
- RDD kavramları
- Bölümler
- RDD İşlemleri / dönüşümler
- RDD türleri
- Anahtar-Değer çifti RDD'leri
- RDD üzerinde MapReduce
- Önbelleğe alma ve kalıcılık
- Laboratuvarlar: RDD oluşturma ve inceleme; RDD'leri önbelleğe alma
-
Spark API Programlama
- Spark API / RDD API'ye giriş
- İlk programı Spark'a gönderme
- Hata ayıklama / günlüğe kaydetme
- Yapılandırma özellikleri
- Laboratuvarlar: Programming Spark API'de, iş gönderme
-
Spark SQL
- Spark'ta SQL desteği
- Veri çerçeveleri
- Tablolar tanımlama ve veri kümeleri içe aktarma
- SQL kullanarak veri çerçevelerini sorgulama
- Depolama formatları: JSON / Parquet
- Laboratuvarlar: Veri çerçeveleri oluşturma ve sorgulama; veri formatlarını değerlendirme
-
MLlib
- MLlib'e giriş
- MLlib algoritmaları
- Laboratuvarlar: MLlib uygulamaları yazma
-
GraphX
- GraphX kitaplığına genel bakış
- GraphX API'leri
- Laboratuvarlar: Spark kullanarak grafik verilerini işleme
-
Spark Streaming
- Akışa genel bakış
- Akış platformlarını değerlendirme
- Akış işlemleri
- Kaydırma penceresi işlemleri
- Laboratuvarlar: Spark akış uygulamaları yazma
-
Spark ve Hadoop
- Hadoop Giriş (HDFS / YARN)
- Hadoop + Spark mimarisi
- Spark'ı Hadoop YARN üzerinde çalıştırma
- Spark kullanarak HDFS dosyalarını işleme
-
Spark Performansı ve Ayarlama
- Yayın değişkenleri
- Biriktiriciler
- Bellek yönetimi ve önbelleğe alma
-
Spark İşlemleri
- Spark'ı üretime dağıtma
- Örnek dağıtım şablonları
- Yapılandırmalar
- İzleme
- Sorun giderme
Kurs İçin Gerekli Önbilgiler
ÖN KOŞULLAR
Java / Scala / Python dillerinden birine aşinalık ( Scala ve Python laboratuvarlarımızda) Linux geliştirme ortamının temel bilgisi (komut satırı navigasyonu / VI veya nano kullanarak dosyaları düzenleme)
Danışanlarımızın Yorumları (6)
Doing similar exercises different ways really help understanding what each component (Hadoop/Spark, standalone/cluster) can do on its own and together. It gave me ideas on how I should test my application on my local machine when I develop vs when it is deployed on a cluster.
Thomas Carcaud - IT Frankfurt GmbH
Eğitim - Spark for Developers
Ajay was very friendly, helpful and also knowledgable about the topic he was discussing.
Biniam Guulay - ICE International Copyright Enterprise Germany GmbH
Eğitim - Spark for Developers
Ernesto did a great job explaining the high level concepts of using Spark and its various modules.
Michael Nemerouf
Eğitim - Spark for Developers
The trainer made the class interesting and entertaining which helps quite a bit with all day training.
Ryan Speelman
Eğitim - Spark for Developers
We know a lot more about the whole environment.
John Kidd
Eğitim - Spark for Developers
Richard is very calm and methodical, with an analytic insight - exactly the qualities needed to present this sort of course.