SMACK Stack for Data Science Eğitimi
SMACK, veri platformu yazılımlarından, yani Apache Spark, Apache Mesos, Apache Akka, Apache Cassandra ve Apache Kafka'den oluşan bir koleksiyondur. S MAC K yığını kullanılarak kullanıcılar veri işleme platformları oluşturabilir ve ölçeklendirebilir.
Bu eğitmen liderliğindeki, canlı eğitim (çevrimiçi veya yerinde), büyük veri çözümleri için S MAC K yığınını kullanarak veri işleme platformları oluşturmak isteyen veri bilimcilerine yöneliktir.
Bu eğitimin sonunda katılımcılar şunları yapabilecektir:
- Büyük verileri işlemek için bir veri hattı mimarisi uygulayın.
- Apache Mesos ve Docker ile bir küme altyapısı geliştirin.
- Spark ve Scala ile verileri analiz edin.
- Apache Cassandra ile yapılandırılmamış verileri yönetin.
Kurs Formatı
- Etkileşimli ders ve tartışma.
- Çok sayıda alıştırma ve uygulama.
- Canlı laboratuvar ortamında uygulamalı uygulama.
Kurs Özelleştirme Seçenekleri
- Bu kurs için özelleştirilmiş bir eğitim talep etmek için lütfen bizimle iletişime geçin.
Eğitim İçeriği
Giriş
S MAC K Yığınına Genel Bakış
- Apache Spark Nedir? Apache Spark özellikleri
- Apache Mesos Nedir? Apache Mesos özellikleri
- Apache Akka Nedir? Apache Akka özellikleri
- Apache Cassandra Nedir? Apache Cassandra özellikleri
- Apache Kafka Nedir? Apache Kafka özellikleri
Scala Dili
- Scala sözdizimi ve yapısı
- Scala kontrol akışı
Geliştirme Ortamının Hazırlanması
- S MAC K yığınının kurulması ve yapılandırılması
- Docker'in kurulması ve yapılandırılması
Apache Akka
- Aktörlerin kullanılması
Apache Cassandra
- Okuma işlemleri için bir veritabanı oluşturma
- Yedeklemeler ve kurtarma ile çalışma
Bağlayıcılar
- Bir akış oluşturma
- Akka uygulaması oluşturma
- Cassandra ile veri depolama
- Bağlayıcıların gözden geçirilmesi
Apache Kafka
- Kümeleme ile çalışma
- Mesaj oluşturma, yayınlama ve tüketme
Apache Mesos
- Kaynak tahsis etme
- Küme çalıştırma
- Apache Aurora ve Docker ile çalışma
- Hizmetleri ve işleri çalıştırma
- Mesos üzerinde Spark, Cassandra ve Kafka'yı dağıtma
Apache Spark
- Veri akışlarını yönetme
- RDD'ler ve veri çerçeveleri ile çalışma
- Veri analizi yapma
Sorun Giderme
- Hizmetlerin ve hataların başarısızlığıyla başa çıkma
Özet ve Sonuç
Kurs İçin Gerekli Önbilgiler
- Veri işleme sistemlerine ilişkin bir anlayış
Hedef Kitle
- Veri Bilimcileri
Açık Eğitim Kursları 5 ve üzeri katılımcı gerektirir.
SMACK Stack for Data Science Eğitimi - Booking
SMACK Stack for Data Science Eğitimi - Enquiry
SMACK Stack for Data Science - Danışmanlık Talebi
Danışmanlık Talebi
Danışanlarımızın Yorumları (1)
very interactive...
Richard Langford
Eğitim - SMACK Stack for Data Science
Yaklaşan Etkinlikler
İlgili Kurslar
Introduction to Data Science and AI using Python
35 SaatBu, Data Science ve Artificial Intelligence (AI)'a 5 günlük bir giriş dersidir.
Ders, örnekler ve alıştırmalarla Python kullanılarak sunulmaktadır.
Apache Airflow for Data Science: Automating Machine Learning Pipelines
21 SaatBu eğitmen liderliğindeki, canlı eğitim (Türkiye çevrimiçi veya yerinde), makine öğrenimi iş akışlarını (model eğitimi, doğrulama ve dağıtım dahil) otomatikleştirmek ve yönetmek isteyen orta seviyedeki katılımcılara yöneliktir ve Apache Airflow kullanılarak gerçekleştirilir.
Bu eğitimin sonunda katılımcılar şunları yapabilecektir:
- Makine öğrenimi iş akışı düzenlemesi için Apache Airflow'i ayarlamak.
- Veri ön işleme, model eğitimi ve doğrulama görevlerini otomatikleştirmek.
- Airflow'u makine öğrenimi çerçeveleri ve araçlarıyla entegre etmek.
- Otomatikleştirilmiş işlem hatları kullanarak makine öğrenimi modellerini dağıtmak.
- Üretim ortamında makine öğrenimi iş akışlarını izlemek ve optimize etmek.
Artificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP
21 SaatBu kurs, uygulamalarında yapay zekayı anlamak ve uygulamak isteyen geliştiricilere ve veri bilimcilerine yöneliktir. Özellikle veri analizi, dağıtık yapay zeka ve doğal dil işleme konularına odaklanmaktadır.
Anaconda Ecosystem for Data Scientists
14 SaatBu eğitmen liderliğindeki, canlı eğitim (Türkiye çevrimiçi veya yerinde), paketleri ve veri analizi iş akışlarını tek bir platformda yakalamak, yönetmek ve dağıtmak için Anaconda ekosistemini kullanmak isteyen veri bilimcilerine yöneliktir.
Bu eğitimin sonunda katılımcılar şunları yapabilecektir:
- Anaconda bileşenlerini ve kütüphanelerini kurmak ve yapılandırmak.
- Anaconda'ün temel kavramlarını, özelliklerini ve faydalarını anlamak.
- Anaconda Navigator kullanarak paketleri, ortamları ve kanalları yönetmek.
- Veri bilimi ve makine öğrenimi için Conda, R ve Python paketlerini kullanmak.
- Çoklu veri ortamlarını yönetmek için bazı pratik kullanım durumlarını ve teknikleri öğrenmek.
AWS Cloud9 for Data Science
28 SaatBu eğitmen liderliğindeki, canlı eğitim (Türkiye çevrimiçi veya yerinde), veri bilimi ve analitiği alanında orta seviyede olan ve AWS Cloud9'u kolaylaştırılmış veri bilimi iş akışları için kullanmak isteyenlere yöneliktir.
Bu eğitimin sonunda katılımcılar şunları yapabilecektir:
- AWS Cloud9'da bir veri bilimi ortamı kurmak.
- Cloud9'da Python, R ve Jupyter Notebook kullanarak veri analizi yapmak.
- AWS Cloud9'u S3, RDS ve Redshift gibi AWS veri hizmetleriyle entegre etmek.
- AWS Cloud9'u makine öğrenimi modeli geliştirme ve dağıtımı için kullanmak.
- Veri analizi ve işleme için bulut tabanlı iş akışlarını optimize etmek.
Big Data Business Intelligence for Telecom and Communication Service Providers
35 SaatGenel Bakış
İletişim hizmeti sağlayıcıları (CSP'ler), mükemmel müşteri deneyimi sağlarken maliyetleri düşürme ve kullanıcı başına ortalama geliri (ARPU) en üst düzeye çıkarma konusunda baskı altındadır, ancak veri hacimleri artmaya devam etmektedir. Küresel mobil veri trafiği, 2016'ya kadar yıllık bileşik büyüme oranı (CAGR) olarak %78 artarak aylık 10,8 exabyte'a ulaşacaktır.
Bu arada, CSP'ler çağrı detay kayıtları (CDR), ağ verileri ve müşteri verileri dahil olmak üzere büyük miktarda veri üretmektedir. Bu verileri tam olarak kullanan şirketler rekabet avantajı elde etmektedir. The Economist Intelligence Unit tarafından yapılan son bir ankete göre, veri odaklı karar alma kullanan şirketler %5-6 oranında verimlilik artışı elde etmektedir. Ancak şirketlerin %53'ü değerli verilerinin yalnızca yarısını kullanmakta ve katılımcıların dörtte biri, çok miktarda kullanışlı verinin kullanılmadığını belirtmektedir. Veri hacimleri o kadar yüksektir ki manuel analiz imkansızdır ve çoğu eski yazılım sistemi ayak uyduramamaktadır, bu da değerli verilerin atılmasına veya göz ardı edilmesine neden olmaktadır.
Big Data & Analytics’in yüksek hızlı, ölçeklenebilir büyük veri yazılımıyla, CSP'ler daha kısa sürede daha iyi karar almak için tüm verilerini çıkarabilirler. Farklı Big Data ürünleri ve teknikleri, büyük verilerden içgörüler toplamak, hazırlamak, analiz etmek ve sunmak için uçtan uca bir yazılım platformu sağlar. Uygulama alanları arasında ağ performansı izleme, dolandırıcılık tespiti, müşteri kaybı tespiti ve kredi risk analizi yer almaktadır. Big Data & Analytics ürünleri terabaytlarca veriyi işleyecek şekilde ölçeklenebilir, ancak bu tür araçların uygulanması Hadoop gibi yeni nesil bulut tabanlı veritabanı sistemleri veya devasa ölçekli paralel işlemci (KPU vb.) gerektirir.
Bu kurs, CSP'lerin verimlilik kazanımı için yatırım yaptığı ve yeni iş gelir akışları açtığı tüm yeni alanları kapsayan Big Data BI for Telco konusunu ele almaktadır. Kurs, karar vericilerin ve yöneticilerin Big Data BI'ın Telco'daki potansiyelini tam olarak anlamalarını sağlamak için Big Data BI'ın Telco'daki 360 derecelik kapsamlı bir genel bakışını sunacaktır.
Kurs Hedefleri
Kursun ana hedefi, Telecom Business'ün 4 sektöründe (Marketing/Satış, Ağ Operasyonları, Finansal Operasyonlar ve Müşteri İlişkileri Management) yeni Big Data iş zekası tekniklerini tanıtmakdır. Öğrencilere aşağıdakiler tanıtılacaktır:
- Big Data'ya giriş - Big Data'daki 4V (hacim, hız, çeşitlilik ve doğruluk) nedir - Telco perspektifinden oluşturma, çıkarma ve yönetme
- Big Data analitiğinin eski veri analitiğinden nasıl farklı olduğu
- Big Data'nın şirket içi gerekçelendirilmesi - Telco perspektifi
- Hadoop Ekosistemine giriş - Big Data sorunlarını çözmek için ne zaman ve nasıl kullanılacakları konusunda Hive, Pig, SPARC gibi tüm Hadoop araçlarına aşinalık
- Big Data'nın analitik araçlar için nasıl çıkarıldığı - Business Analysis'ün entegre Hadoop gösterge panosu yaklaşımı aracılığıyla veri toplama ve analizindeki sorun noktalarını nasıl azaltabileceği
- Telco için temel içgörü analitiği, görselleştirme analitiği ve tahmin analitiği tanıtımı
- Müşteri kaybı analitiği ve Big Data - Big Data analitiğinin Telco'da müşteri kaybını ve müşteri memnuniyetsizliğini nasıl azaltabileceği - vaka çalışmaları
- Ağ meta verilerinden ve IPDR'den ağ arızası ve hizmet arızası analitiği
- Satış ve operasyonel verilerden finansal analiz - dolandırıcılık, israf ve yatırım getirisi tahmini
- Müşteri edinme sorunu - hedef pazarlama, müşteri segmentasyonu ve satış verilerinden çapraz satış
- Tüm Big Data analitik ürünlerinin tanıtımı ve Telco analitik alanına nasıl uydukları
- Sonuç - Big Data Business Intelligence'yi kuruluşunuzda adım adım nasıl tanıtacağınız
Hedef Kitle
- Ağ operasyonları, Finansal Yöneticiler, CRM Yöneticileri ve Telco CIO ofisindeki üst düzey BT Yöneticileri.
- Telco'daki Business Analistleri
- CFO ofisi yöneticileri/analistleri
- Operasyonel Yöneticiler
- Kalite Güvence Yöneticileri
Introduction to Google Colab for Data Science
14 SaatBu eğitmen liderliğindeki, canlı eğitim (online veya yerinde), temel düzeydeki veri bilimcileri ve veri bilimi temellerini Google Colab kullanarak öğrenmek isteyen BT profesyonellerine yöneliktir.
Bu eğitimin sonunda katılımcılar şunları yapabilecektir:
- Google Colab'ı kurmak ve gezinmek.
- Temel Python kodunu yazmak ve çalıştırmak.
- Veri kümelerini içe aktarmak ve işlemek.
- Python kütüphanelerini kullanarak görselleştirmeler oluşturmak.
A Practical Introduction to Data Science
35 SaatBu eğitimi tamamlayan katılımcılar, Data Science ve ilgili teknolojiler, metodolojiler ve araçlar konusunda pratik ve gerçek dünya anlayışına sahip olacaklardır.
Katılımcılar, bu bilgiyi uygulamalı egzersizler aracılığıyla uygulamaya koyma fırsatı bulacaklardır. Grup etkileşimi ve eğitmen geri bildirimi, dersin önemli bir bölümünü oluşturmaktadır.
Kurs, Data Science'un temel kavramlarına bir girişle başlar, ardından Data Science'da kullanılan araçlar ve metodolojilere ilerler.
Hedef Kitle
- Geliştiriciler
- Teknik analistler
- BT danışmanları
Kurs Formatı
- Kısmen ders anlatımı, kısmen tartışma, egzersizler ve yoğun uygulamalı çalışma
Not
- Bu kurs için özelleştirilmiş bir eğitim talep etmek için lütfen bizimle iletişime geçin.
Data Science Programme
245 SaatThe explosion of information and data in today’s world is un-paralleled, our ability to innovate and push the boundaries of the possible is growing faster than it ever has. The role of Data Scientist is one of the highest in-demand skills across industry today.
We offer much more than learning through theory; we deliver practical, marketable skills that bridge the gap between the world of academia and the demands of industry.
This 7 week curriculum can be tailored to your specific Industry requirements, please contact us for further information or visit the Nobleprog Institute website
Audience:
This programme is aimed post level graduates as well as anyone with the required pre-requisite skills which will be determined by an assessment and interview.
Delivery:
Delivery of the course will be a mixture of Instructor Led Classroom and Instructor Led Online; typically the 1st week will be 'classroom led', weeks 2 - 6 'virtual classroom' and week 7 back to 'classroom led'.
Introduction to Graph Computing
28 SaatBu eğitmen liderliğindeki canlı eğitimde, katılımcılar grafik verileri işleme teknolojilerini ve uygulama yaklaşımlarını Türkiye bölgesinde öğreneceklerdir. Amaç, gerçek dünyadaki nesneleri, özelliklerini ve ilişkilerini belirlemek, ardından bu ilişkileri modellemek ve Graph Computing (aynı zamanda Grafik Analitiği olarak da bilinir) yaklaşımını kullanarak bunları veri olarak işlemektir. Geniş bir genel bakışla başlayıp bir dizi vaka çalışması, uygulamalı alıştırma ve canlı dağıtım aracılığıyla belirli araçlara odaklanacağız.
Bu eğitimin sonunda katılımcılar şunları yapabilecektir:
- Grafik verilerin nasıl kalıcı hale getirildiğini ve gezildiğini anlayabilmek.
- Belirli bir görev için en iyi çerçeveyi seçebilmek (grafik veritabanlarından toplu işleme çerçevelerine kadar).
- Hadoop, Spark, GraphX ve Pregel'i birçok makinede paralel olarak grafik hesaplaması yapmak için uygulayabilmek.
- Gerçek dünya büyük veri sorunlarını grafikler, süreçler ve geçişler açısından görebilmek.
Kaggle
14 SaatBu eğitmen liderliğindeki, canlı eğitim (online veya yerinde), Data Science kullanarak kariyerlerini geliştirmek isteyen veri bilimcileri ve geliştiricileri hedeflemektedir.
Bu eğitimin sonunda katılımcılar şunları yapabilecektir:
- Veri bilimi ve makine öğrenimi hakkında bilgi edinin.
- Veri analitiğini keşfedin.
- Kaggle hakkında bilgi edinin ve nasıl çalıştığını öğrenin.
Accelerating Python Pandas Workflows with Modin
14 SaatBu eğitmen liderliğindeki, canlı eğitim (Türkiye çevrimiçi veya yerinde), daha hızlı veri analizi için Pandas ile paralel hesaplamalar oluşturmak ve uygulamak isteyen veri bilimcileri ve geliştiricileri hedeflemektedir.
Bu eğitimin sonunda katılımcılar şunları yapabilecektir:
- Modin ile ölçeklenebilir Pandas iş akışlarını geliştirmek için gerekli ortamı kurmak.
- Modin'in özelliklerini, mimarisini ve avantajlarını anlamak.
- Modin, Dask ve Ray arasındaki farkları bilmek.
- Modin ile Pandas işlemlerini daha hızlı gerçekleştirmek.
- Tüm Pandas API'sini ve işlevlerini uygulamak.
GPU Data Science with NVIDIA RAPIDS
14 SaatBu eğitmen liderliğindeki, canlı eğitim (Türkiye çevrimiçi veya yerinde), RAPIDS kullanarak GPU hızlandırılmış veri işlem hatları, iş akışları ve görselleştirmeler oluşturmak isteyen veri bilimcileri ve geliştiricilere yöneliktir; XGBoost, cuML gibi makine öğrenimi algoritmalarını uygulayarak.
Bu eğitimin sonunda katılımcılar şunları yapabilecektir:
- NVIDIA RAPIDS ile veri modelleri oluşturmak için gerekli geliştirme ortamını kurmak.
- RAPIDS’nin özelliklerini, bileşenlerini ve avantajlarını anlamak.
- Uçtan uca veri ve analiz işlem hatlarını hızlandırmak için GPU’ları kullanmak.
- cuDF ve Apache Arrow ile GPU hızlandırılmış veri hazırlama ve ETL uygulamak.
- XGBoost ve cuML algoritmalarıyla makine öğrenimi görevlerini nasıl gerçekleştireceğini öğrenmek.
- cuXfilter ve cuGraph ile veri görselleştirmeleri oluşturmak ve grafik analizi yapmak.
Python and Spark for Big Data (PySpark)
21 SaatBu eğitmen liderliğindeki, canlı eğitimde Türkiye, katılımcılar büyük verileri analiz etmek için Python ve Spark'ı birlikte nasıl kullanacaklarını uygulamalı egzersizler yaparak öğreneceklerdir.
Bu eğitimin sonunda katılımcılar şunları yapabilecektir:
- Python ile Spark'ı kullanarak Big Data analiz etmeyi öğreneceklerdir.
- Gerçek dünya senaryolarını taklit eden egzersizler üzerinde çalışacaklardır.
- PySpark kullanarak büyük veri analizi için farklı araç ve teknikleri kullanacaklardır.
Apache Spark MLlib
35 SaatMLlib, Spark’ın makine öğrenimi (ML) kütüphanesidir. Amacı, pratik makine öğrenimini ölçeklenebilir ve kolay hale getirmektir. Sınıflandırma, regresyon, kümeleme, işbirlikçi filtreleme, boyut azaltma gibi yaygın öğrenme algoritmaları ve yardımcı programlarının yanı sıra daha düşük seviyeli optimizasyon öncülleri ve daha yüksek seviyeli pipeline API’lerinden oluşur.
İki pakete ayrılır:
-
spark.mllib, RDD’ler üzerine inşa edilmiş orijinal API’yi içerir.
-
spark.ml, ML pipeline’ları oluşturmak için DataFrames üzerine inşa edilmiş daha yüksek seviyeli bir API sağlar.
Hedef Kitle
Bu kurs, Apache Spark için yerleşik bir Makine Öğrenimi Kütüphanesini kullanmak isteyen mühendisler ve geliştiricilere yöneliktir.