Eğitim: İş Analitiği ve Büyük Veri

R platformunda uygulamalı eğitim programı

İşletme yönetiminde doğru karar vermek için verileri kullanmak günümüzde rekabetin bir koşulu haline gelmiştir. Sektör fark etmeksizin, küçük veya büyük işletmelerin hedefleri doğrultusunda doğru kararlar verebilmesi ve doğru adımlar atabilmesi için veri odaklı bir yaklaşım sergilemeleri gerekmektedir. Ancak bunu yapabilmek için ham verileri karar destek amaçlı kullanılabilecek bilgilere dönüştürmek, verilerde gömülü olan bilgiyi ortaya çıkartmak gerekir.

Bu programının amacı iş kararlarını ve operasyonu iyileştirmek, ve veri üzerinden katma değer elde edilmesini sağlamak için gerekli kavram, yöntem ve araçları kapsayan uygulamalı bir eğitim vermektir. Program tasarımı yeni çıkan teknoloji ve veri analiz yöntemleri, ve bunların eski yöntemlerden farkı konusunda farkındalık yaratmak, veri bilimi (data science) konularında kendini gelişmek isteyen yönetici ve profesyoneller için temel becerileri geliştirmek üzerine kurulmuştur. Uygulamalı eğitimde sanayide en fazla tercih edilen analiz platformlarından olan R istatistik platformu ve ilgili modülleri öğretilmektedir. Ek olarak programın giriş düzeyi “büyük veri” bileşeni katılımcılara işletmelerindeki büyük veri ihtiyaçlarını teşhis etme, ve bu analizler için bir yol haritası oluşturma becerilerini kazandırma amaçlıdır.

Uygulama

Standart eğitim programında beş gün boyunca her gün altı saat boyunca aşağıdaki ilk 12 ders sırayla uygulanacaktır (sonrakiler tercihlidir). Buna ilaveten gün veya ders sonlarında katılımcıların eğitimci desteğiyle problemler üzerinde çalışarak gün içerisinde eksik kaldığı konuları yakalamasına, teknik sorunları aşmasına yardımcı olacak iki saatlik etüd/koçluk seansları yapılacaktır.

Dersler ve içerikleri

1. ders (2s): Bir iş fonksiyonu olarak iş analitiği süreçleri ve kavramları

  • İş analitiği-strateji ilişkisi
  • Analitik projelerinin tasarımı ve iş akışı
  • Veri ve istatistik ile ilgili temel tanımlar ve ortak iş analitiği dili

2. ders (4s): R İstatistik platformu ve RStudio temel eğitimi

  • R sistemi, kolaylaştırıcı araçlar, yardım sistemi, bilgi kaynakları, önyüklü örnek verisetleri
  • R dilindeki ifadelerin temel özellikleri, operatörler ve veri tipleri. R’da fonksiyonlar .Veri seti manipülasyonları
  • Temel veriseti istatistiklerinin çıkartılması
  • Rstudio ve R entegrasyonu. Rstudio’da Rnotebook ile modern analitik raporlaması teknikleri

3. ders (3s): Veriyi inceleme, görselleştirme, analiz öncesi veri temizliği, ve dönüştürme

  • Veri seti içe/dışa aktarma
  • Betimsel istatistik yöntemleri ve analitik tasarımında kullanımı
  • Farklı veri tiplerine uygun görseleştirme yöntem ve araçları.
  • Veri formatları ve dönüştürme
  • Veri temizliği gereksinimleri

4. ders (3s): Tahminlemenin temelleri, tahmin analitiğinde kalite ve uygulanabilirlik değerlendirmesi

  • Tahminleme ve denetimli öğrenme yöntemleri
  • Doğrusal regresyon tahminlemesi
  • Tahminlemenin iş problemlerine uygulanması.
  • Tahminleme modelinin kalite ölçütleri ve değerlendirilmesi
  • Veri kalitesi ve tahminleme modellerini iyileştirme yöntemleri

5. ders (3s): Zaman serileri ile gelecek tahminlemesi yapılması

  • Zaman serisi modellemesi ve modellerin tahmin kalitesi
  • Satış ve talep tahminlemesi
  • Zaman serisinin görselleştirilmesi
  • Zaman serileri ile satış tahminlemesi
  • Veri özelliklerine uygun zaman serisi modellerinin seçimi

6. ders (2s): Kümeleme ve sınıflandırma ile müşteri ve ürünlerin segmentasyonu

  • Gizli kümelerin bulunması ve sınıflama arasındaki farklar ve iş problemlerindeki rolleri
  • Çok boyutlu verilerde benzerlik ve farklılık kavramlarının nicelenmesi
  • Veri büyüklüğü ve boyutlarına uygun kümeleme ve sınıflandırma teknikleri

7. ders (3s): Karar ağaçları ile sınıflandırma ve iş uygulamaları

  • Sayısal olmayan verilerle sınıflandırma yöntemleri: Karar ağacı modelleri
  • Karar ağacı modellerinin görselleştirilmesi, okunması, ve hata matrisi ile kalite değerlendirmesinin yapılması
  • İş problemlerinde karar ağacı uygulamaları ve kalite ihtiyaçları, abonelik (churn) analizi problemleri

8. ders (3s): Kümeleme

  • Kümelemenin temel yaklaşımı
  • Veri ve entropi kavramı
  • Kümelemenin çıkartılması ve görselleştirilmesi
  • Küme sayısının seçimi için teknikler

9. ders (3s): Diğer sınıflandırma teknikleri

  • K-means yöntemi ile sınıflama
  • KNN yöntemi ile sınıflama
  • “Rassal orman (random forest)” yönetmi ile sınıflama
  • Sınıflama yöntemlerinin problemlere uygunluğu
  • Sınıflama yöntemlerinin hata matrisi ile kalite ölçümü ve karşılaştırılması.

10. ders (3s): Sepet analizi ile müşteri satınalma davranışı tahminleme ve diğer uygulamalar

  • Alışveriş sepet analizi (association rule mining) modelleri
  • Sepet analizi kurallarının kalite değerlendirmesi
  • Kampanya tasarımı, e-ticaret tavsiye sistemleri, ek-satış, raf tasarımı, vb. iş problemlerinde sepet analizi uygulamaları.

11. ders (3s): Büyük veri Kavramları

  • Büyük veri ihtiyaçlarının teşhisi
  • Büyük veri analiz hattı ve tedariği
  • Büyük veri analizi için gerekli yetkinliklerin tespiti
  • Analitik ve büyük veri teknoloji değerlendirme kriterleri

12. ders (4s): Uygulamalı büyük veri analitiği

  • Map-Reduce ile analitik algoritmaları
  • Apache Hadoop mimarisi
  • Apache Spark ile map-reduce uygulama
  • Gerçek zamanlı veri işleme

13. ders (5s):(Tercihli): Metin analizi

  • Dijital metinlerin analizi ile müşteri ve çalışanların anlam dünyası ve duygu durumunun belirlenmesi.
  • Temel metin analizi matematiği
  • R ile uygulamalar
  • Metinlerin tasnifi yöntemleri ve bunların müşteri ilişkileri veya çağrı-merkezi yönetiminde kullanımı.

14.ders (3s): (Tercihli) Tavsiye sistemleri

  • Sepet analizinin ötesinde tavsiye sistemlerinden beklenenler.
  • Kişiye özel tavsiye algoritmaları ve veri gereksinimleri.
  • Eksik veri ile tavsiye.
  • Tavsiye kalitesinin ölçülmesi.

Eğitimin uygulandığı firmalardan örnekler

Farklı uzunluk ve içerikteki uygulama örnekleri:

  • CMS Jant (Beş gün) Beş tam günlük eğitime IT ve analitik personeli katıldı. Beş gün bu eğitim için oldukça verimlilik sağlayan bir süre. Gerçekten de eğitimin son gününde katılımcıların artık analitik iş sürecini baştan sona uygulayabilir, kendi orijinal verileri ile katma değerli çözümler ortaya koyabilir hale geldiklerini görmek çok keyifli idi.
  • HugoBoss (Tek günlük seminer): Bu hızlandırılmış uygulamada eğitim içeriği uygulamalı olarak değil sadece kavramsal olarak anlatıldı. Firmadaki geleceğin yönetici adaylarına bir “veri odaklı yönetim gelecek turu” niteliğinde bir uygulama yapılmış oldu.
  • GDZ Elektrik (Üç gün): Ağırlıklı olarak IT, satınalma ve planlama uzmanları ile yapılan bu eğitimde tedarik ve satışın anlık gerçekleştiği bir sektörde tahminleme problemlerini çalışma imkanı bulduk.