Hadoop for Developers (4 days) Eğitimi
Apache Hadoop, sunucular kümesinde Big Data işleme için en popüler çerçevedir. Bu kurs, bir geliştiriciye çeşitli bileşenleri (HDFS, MapReduce, Pig, Hive ve HBase) Hadoop ekosistemi hakkında tanıtım yapacaktır.
Eğitim İçeriği
Bölüm 1: Hadoop'e Giriş
- Hadoop tarihi, kavramlar
- ekosistemi
- distributionlar
- yüksek seviye mimarisi
- Hadoop mitleri
- Hadoop zorlukları
- donanım / yazılım
- lab : Hadoop'in ilk bakışımıza
Bölüm 2: HDFS
- Tasarım ve mimari
- kavramlar (yatay ölçeklenebilirlik, kopyalama, veri yerelleştirme, raf bilinci)
- Daemons : Namenode, Secondary namenode, Data node
- iletişimler / kalp atışları
- veri bütünlüğü
- yazma / okuma yolu
- Namenode Yüksek Kullanılabilirlik (HA), Federasyon
- labs : HDFS ile etkileşim kurma
Bölüm 3 : Map Reduce
- kavramlar ve mimari
- daemons (MRV1) : jobtracker / tasktracker
- fazlar : driver, mapper, shuffle/sort, reducer
- Map Reduce Sürüm 1 ve Sürüm 2 (YARN)
- Map Reduce iç yapısı
- Java Map Reduce programına Giriş
- labs : Örnek bir MapReduce programı çalıştırma
Bölüm 4 : Pig
- pig vs java map reduce
- pig iş akışı
- pig latin dili
- Pig ile ETL
- Dönüşümler & Birleşimler
- Kullanıcı tanımlı fonksiyonlar (UDF)
- labs : verileri analiz etmek için Pig betikleri yazma
Bölüm 5: Hive
- mimari ve tasarım
- veri tipleri
- SQL desteği Hive'de
- Hive tabloları oluşturma ve sorgulama
- bölümler
- birleşimler
- yazı işleme
- labs : Hive ile veri işlemesi üzerine çeşitli laboratuvarlar
Bölüm 6: HBase
- kavramlar ve mimari
- HBase vs RDBMS vs Cassandra
- HBase Java API
- HBase üzerinde zaman serisi verileri
- şema tasarımı
- labs : shell ile HBase ile etkileşim kurma; HBase Java API'de programlama ; Şema tasarım egzersizi
Kurs İçin Gerekli Önbilgiler
- Java programlama diline aşina olmak (çoğu programlama alıştırması java ile yapılmaktadır)
- Linux ortamına aşina olmak ( Linux komut satırında gezinme, vi / nano kullanarak dosyaları düzenleme becerisine sahip olmak)
Laboratuvar ortamı
Sıfır Yükleme : Öğrencilerin makinelere Hadoop yazılımı yüklenecek bir ihtiyacı yok! Öğrencilere çalışacak bir Hadoop klüster sunulacaktır.
Öğrencilerin aşağıdakilere ihtiyacı olacaktır
- Bir SSH istemcisi (Linux ve Mac zaten ssh istemciye sahiptir, Windows için Putty önerilmektedir)
- Klüste erişim sağlamak için bir tarayıcı, Firefox önerilmiştir
Açık Eğitim Kursları 5 ve üzeri katılımcı gerektirir.
Hadoop for Developers (4 days) Eğitimi - Booking
Hadoop for Developers (4 days) Eğitimi - Enquiry
Hadoop for Developers (4 days) - Danışmanlık Talebi
Danışmanlık Talebi
Danışanlarımızın Yorumları (5)
The live examples
Ahmet Bolat - Accenture Industrial SS
Eğitim - Python, Spark, and Hadoop for Big Data
During the exercises, James explained me every step whereever I was getting stuck in more detail. I was completely new to NIFI. He explained the actual purpose of NIFI, even the basics such as open source. He covered every concept of Nifi starting from Beginner Level to Developer Level.
Firdous Hashim Ali - MOD A BLOCK
Eğitim - Apache NiFi for Administrators
Trainer's preparation & organization, and quality of materials provided on github.
Mateusz Rek - MicroStrategy Poland Sp. z o.o.
Eğitim - Impala for Business Intelligence
That I had it in the first place.
Peter Scales - CACI Ltd
Eğitim - Apache NiFi for Developers
practical things of doing, also theory was served good by Ajay
Dominik Mazur - Capgemini Polska Sp. z o.o.
Eğitim - Hadoop Administration on MapR
Yaklaşan Etkinlikler
İlgili Kurslar
Administrator Training for Apache Hadoop
35 SaatHedef Kitle:
Bu kurs, dağıtık bir sistem ortamında büyük veri kümelerini depolamak ve işlemek için bir çözüm arayan BT uzmanlarına yöneliktir.
Goal:
Hadoop küme yönetimi konusunda derin bilgi.
Big Data Analytics in Health
21 SaatBüyük veri analitiği, korelasyonları, gizli kalıpları ve diğer faydalı bilgileri ortaya çıkarmak amacıyla büyük ve çeşitli veri kümelerinin incelenmesi sürecini içerir.
Sağlık sektörü, karmaşık ve heterojen tıbbi ve klinik verilerin büyük miktarlarına sahiptir. Sağlık verileri üzerinde büyük veri analitiği uygulamak, sağlık hizmetlerinin sunumunu iyileştirmek için öngörüler elde etme konusunda büyük bir potansiyel sunar. Ancak, bu veri kümelerinin büyüklüğü, analizlerde ve klinik ortamlara pratik uygulamalarda büyük zorluklar oluşturur.
Bu eğitmen liderliğindeki, canlı (uzaktan) eğitimde katılımcılar, bir dizi uygulamalı canlı laboratuvar egzersiziyle sağlık alanında büyük veri analitiği yapmayı öğreneceklerdir.
Bu eğitimin sonunda katılımcılar şunları yapabilecektir:
- Hadoop MapReduce ve Spark gibi büyük veri analitiği araçlarını kurmak ve yapılandırmak
- Tıbbi verilerin özelliklerini anlamak
- Tıbbi verilerle başa çıkmak için büyük veri tekniklerini uygulamak
- Sağlık uygulamaları bağlamında büyük veri sistemlerini ve algoritmalarını incelemek
Hedef Kitle
- Geliştiriciler
- Veri Bilimciler
Kurs Formatı
- Kısmen ders anlatımı, kısmen tartışma, egzersizler ve yoğun uygulamalı pratik.
Not
- Bu kurs için özelleştirilmiş bir eğitim talep etmek için lütfen bizimle iletişime geçerek düzenleme yapınız.
Hadoop Administration
21 SaatBu kurs, dağıtık sistem ortamında büyük veri kümelerini depolamak ve işlemek için bir çözüm arayan BT uzmanlarına yöneliktir.
Kursun amacı:
Hadoop küme yönetimi konusunda bilgi edinmek.
Hadoop For Administrators
21 SaatApache Hadoop, sunucular kümesinde işleme için en popüler çerçevedir. Bu üç (isteğe bağlı olarak dört) günlük kursta, katılımcılar Hadoop ve ekosisteminin iş faydalarını ve kullanım senaryolarını, küme dağıtımını ve büyümesini nasıl planlayacaklarını, Hadoop'in nasıl kurulacağını, bakımı yapılacağını, izleneceğini, sorun giderileceğini ve optimize edileceğini öğreneceklerdir. Ayrıca küme toplu veri yüklemesi uygulayacak, çeşitli Hadoop dağıtımlarına aşina olacak ve Hadoop ekosistem araçlarını kurma ve yönetme alıştırmaları yapacaklardır. Kurs, kümenin Kerberos ile güvenliğinin tartışılmasıyla sona erecektir.
“…Materyaller çok iyi hazırlanmış ve kapsamlı bir şekilde ele alınmıştı. Laboratuvar çok yardımcı ve iyi organize edilmişti.”
— Andrew Nguyen, Baş Entegrasyon DW Mühendisi, Microsoft Online Advertising
Hedef Kitle
Hadoop yöneticileri
Format
Dersler ve uygulamalı laboratuvarlar, yaklaşık denge %60 ders, %40 laboratuvar.
Advanced Hadoop for Developers
21 SaatApache Hadoop, sunucular kümesinde işleme Big Data için en popüler çerçevelerden biridir. Bu kurs, HDFS'de veri yönetimi, gelişmiş Pig, Hive ve HBase konularına derinlemesine dalmaktadır. Bu gelişmiş programlama teknikleri, deneyimli Hadoop geliştiricileri için faydalı olacaktır.
Hedef Kitle: geliştiriciler
Süre:üç gün
Format:dersler (%50) ve uygulamalı laboratuvarlar (%50).
Hadoop Administration on MapR
28 SaatHedef Kitle:
Bu kurs, büyük veri/Hadoop teknolojisini anlaşılır kılmayı ve aslında anlaşılması zor olmadığını göstermeyi amaçlamaktadır.
Hadoop and Spark for Administrators
35 SaatBu eğitmen liderliğindeki, canlı eğitim (Türkiye çevrimiçi veya yerinde), kuruluşları içindeki Hadoop kümelerini kurmak, dağıtmak ve yönetmek isteyen sistem yöneticilerine yöneliktir.
Bu eğitimin sonunda katılımcılar şunları yapabilecektir:
- Apache Hadoop'i kurun ve yapılandırın.
- Hadoop ekosistemindeki dört ana bileşeni anlayın: HDFS, MapReduce, YARN ve Hadoop Common.
- Hadoop Dağıtılmış Dosya Sistemi'ni (HDFS) kullanarak bir kümeyi yüzlerce veya binlerce düğüme ölçeklendirin.
- HDFS'yi, şirket içi Spark dağıtımları için depolama motoru olarak ayarlayın.
- Spark'ın Amazon S3 gibi alternatif depolama çözümlerine ve Redis, Elasticsearch, Couchbase, Aerospike vb. gibi NoSQL veritabanı sistemlerine erişmesini sağlayın.
- Bir Apache Hadoop kümesini sağlama, yönetme, izleme ve güvenliğini sağlama gibi yönetimsel görevleri yerine getirin.
HBase for Developers
21 SaatBu kurs, Hadoop üzerine kurulu bir NoSQL deposu olan HBase'i tanıtır. Kurs, uygulamalar geliştirmek için HBase'i kullanacak geliştiriciler ve HBase kümelerini yönetecek yöneticiler için tasarlanmıştır.
Bir geliştiriciyi HBase mimarisi ve veri modellemesi ve HBase üzerinde uygulama geliştirme konusunda yönlendireceğiz. Ayrıca MapReduce ile HBase kullanımı ve performans optimizasyonu ile ilgili bazı yönetim konuları da tartışılacaktır. Kurs, birçok laboratuvar egzersizi ile çok uygulamalıdır.
Süre: 3 gün
Hedef Kitle: Geliştiriciler ve Yöneticiler
Hortonworks Data Platform (HDP) for Administrators
21 SaatBu eğitmen liderliğindeki, canlı eğitimde Türkiye (çevrimiçi veya yerinde) Hortonworks Data Platform (HDP) tanıtılacak ve katılımcılar Spark + Hadoop çözümünün dağıtımı konusunda yönlendirilecektir.
Bu eğitimin sonunda katılımcılar şunları yapabilecektir:
- Hortonworks'ü kullanarak Hadoop'u büyük ölçekte güvenilir bir şekilde çalıştırmak.
- Hadoop'un güvenlik, yönetişim ve operasyon yeteneklerini Spark'ın çevik analitik iş akışlarıyla birleştirmek.
- Hortonworks'ü kullanarak bir Spark projesindeki her bir bileşeni araştırmak, doğrulamak, onaylamak ve desteklemek.
- Yapılandırılmış, yapılandırılmamış, hareket halindeki ve hareketsiz veriler dahil olmak üzere farklı veri türlerini işlemek.
Data Analysis with Hive/HiveQL
7 SaatBu kurs, Hive SQL dilinin (aynı zamanda: Hive HQL, SQL üzerinde Hive, HiveQL) Hive'den veri çıkaran kişiler için nasıl kullanılacağını kapsamaktadır.
Impala for Business Intelligence
21 SaatCloudera Impala is an open source massively parallel processing (MPP) SQL query engine for Apache Hadoop clusters.
Impala enables users to issue low-latency SQL queries to data stored in Hadoop Distributed File System and Apache Hbase without requiring data movement or transformation.
Audience
This course is aimed at analysts and data scientists performing analysis on data stored in Hadoop via Business Intelligence or SQL tools.
After this course delegates will be able to
- Extract meaningful information from Hadoop clusters with Impala.
- Write specific programs to facilitate Business Intelligence in Impala SQL Dialect.
- Troubleshoot Impala.
Apache NiFi for Administrators
21 SaatBu eğitmen liderliğindeki, canlı eğitimde (Türkiye yerinde veya uzaktan), katılımcılar Apache NiFi'ü canlı bir laboratuvar ortamında nasıl dağıtacaklarını ve yöneteceklerini öğreneceklerdir.
Bu eğitimin sonunda katılımcılar şunları yapabilecektir:
- Apachi NiFi'yi kurun ve yapılandırın.
- Veritabanları ve büyük veri gölleri de dahil olmak üzere farklı, dağıtılmış veri kaynaklarından veri alın, dönüştürün ve yönetin.
- Veri akışlarını otomatikleştirin.
- Akış analitiğini etkinleştirin.
- Veri alımı için çeşitli yaklaşımlar uygulayın.
- Big Data ve verilerini iş içgörülerini dönüştürün.
Apache NiFi for Developers
7 SaatBu eğitmen liderliğindeki canlı eğitimde Türkiye'da, katılımcılar Apache NiFi kullanarak bir dizi demo uzantısı, bileşen ve işlemci geliştirirken akış tabanlı programlamanın temellerini öğreneceklerdir.
Bu eğitimin sonunda katılımcılar şunları yapabilecektir:
- NiFi'nin mimarisini ve veri akışı kavramlarını anlayabilecektir.
- NiFi ve üçüncü taraf API'lerini kullanarak uzantılar geliştirebilecektir.
- Kendi Apache Nifi işlemcilerini özel olarak geliştirebilecektir.
- Çeşitli ve alışılmadık dosya formatlarından ve veri kaynaklarından gerçek zamanlı verileri alıp işleyebilecektir.
Python, Spark, and Hadoop for Big Data
21 SaatBu eğitmen liderliğindeki, canlı eğitim (Türkiye çevrimiçi veya yerinde), büyük ve karmaşık veri kümelerini işlemek, analiz etmek ve dönüştürmek için Spark, Hadoop ve Python'yı kullanmak ve entegre etmek isteyen geliştiricilere yöneliktir.
Bu eğitimin sonunda katılımcılar şunları yapabilecektir:
- Spark, Hadoop ve Python ile büyük veri işlemeye başlamak için gerekli ortamı kurmak.
- Spark ve Hadoop'in özelliklerini, temel bileşenlerini ve mimarisini anlamak.
- Büyük veri işleme için Spark, Hadoop ve Python'yı nasıl entegre edeceğini öğrenmek.
- Spark ekosistemindeki araçları (Spark MlLib, Spark Streaming, Kafka, Sqoop, Kafka ve Flume) keşfetmek.
- Netflix, YouTube, Amazon, Spotify ve Google gibi işbirlikçi filtreleme öneri sistemleri oluşturmak.
- Apache Mahout'u kullanarak makine öğrenimi algoritmalarını ölçeklendirmek.