Eğitim İçeriği
Giriş
Bu bölüm, 'makine öğrenimi'nin ne zaman kullanılacağına, nelere dikkat edilmesi gerektiğine ve tüm bunların ne anlama geldiğine dair genel bir tanıtım sunar; avantajları ve dezavantajları da içerir. Veri türleri (yapılandırılmış/yapılandırılmamış/statik/sürekli), veri geçerliliği/hacmi, veri odaklı ve kullanıcı odaklı analizler, istatistiksel modeller ve makine öğrenimi modelleri, denetimsiz öğrenmenin zorlukları, yanlılık-varyans dengesi, yineleme/değerlendirme, çapraz doğrulama yaklaşımları, denetimli/denetimsiz/takviyeli öğrenme.
ANA KONULAR
1. Naive Bayes'i Anlama
- Bayesci yöntemlerin temel kavramları
- Olasılık
- Birlikte olasılık
- Bayes teoremiyle koşullu olasılık
- Naive Bayes algoritması
- Naive Bayes sınıflandırması
- Laplace tahminleyicisi
- Numeric özelliklerle naive Bayes kullanımı
2. Karar Ağaçlarını Anlama
- Böl ve fethet
- C5.0 karar ağacı algoritması
- En iyi bölünmeyi seçme
- Karar ağını kestirme
3. Destek Vektör Makinelerini Anlama
- Biyolojik nöronlardan yapay nöronlara
- Etkileşim fonksiyonları
- Ağ topolojisi
- Katman sayısı
- Bilgi seyahatinin yönü
- Her katmanda bulunan düğüm sayısı
- Geri yayılım ile sinir ağlarını eğitme
- Deep Learning
4. Yapay Sinir Ağlarını Anlama
- Hiperplanlarla sınıflandırma
- Maksimum marjın bulma
- Düzenli olarak ayrılabilir veri durumu
- Düzenli olarak ayrılamayan veri durumu
- Non-lineer uzaylarda çekirdekler kullanma
5. Kümelemeyi Anlama
- Kümeleme makine öğrenimi görevi olarak
- Kümelemede k-means algoritması
- Mesafeyi kullanarak kümelere atama ve güncelleme
- Uygun küme sayısını seçme
6. Boyut İndirgeme
- Sınıflandırma tahmini verileriyle çalışma
- Konuşma matrislerine yakından bakış
- Konuşma matrislerini performans ölçümü için kullanma
- Doğruluk ötesinde - diğer performans ölçüleri
- Kappa istatistiği
- Hassasiyet ve spesifitiklik
- Dokunabilirlik ve geri çağırma
- F ölçüsü
- Performans ödünçlerini görselleştirme
- ROC eğrileri
- Mevcut performans tahmini
- Bölüm yöntemi
- Çapraz doğrulama
- Bootstrap örnekleme
7. Modelleri Daha İyi Performans İçin Ayarlama
- Caret ile otomatik parametre ayarlaması kullanımı
- Basit bir ayarlanmış model oluşturma
- Ayarlama sürecini özelleştirme
- Meta-öğrenme ile model performansını iyileştirme
- Kütleleri anlama
- Ciltleme
- Takviye
- Rastgele ormanlar
- Rastgele ormanları eğitme
- Rastgele ormanın performansını değerlendirme
KÜÇÜK KONULAR
8. En Yakın Komşular Kullanarak Sınıflandırmayı Anlama
- kNN algoritması
- Mesafeyi hesaplama
- Uygun bir k seçme
- kNN kullanımı için veriyi hazırlama
- kNN algoritmasının neden uykulu olduğu?
9. Sınıflandırma Kurallarını Anlama
- Böl ve fethet
- The One Rule algoritması
- RIPPER algoritması
- Karar ağaçlarından kurallar
10. Regresyonu Anlama
- Basit doğrusal regresyon
- Orta kare tahminleyici
- Korelasyonlar
- Birden fazla değişkenli doğrusal regresyon
11. Regresyon Ağaçlarını ve Model Ağaçlarını Anlama
- Ağaçlara regresyon eklemek
12. İlişkilendirme Kurallarını Anlama
- Bağlantı kuralları öğrenmek için Apriori algoritması
- Kural ilgisini ölçme – destek ve güvenilirlik
- Apriori prensibine dayalı bir kural seti oluşturma
Ekstralar
- Spark/PySpark/MLlib ve Çoklu kol banditleri