Veri Bilimi İçin Python
Bireysel sayfadasınız. Kurumsal sayfaya geçebilirsiniz.
Renkler tuhaf mı görünüyor? Samsung Internet tarayıcısı koyu modda site renklerini değiştiriyor olabilir. Kapatmak için Internet menüsünden Ayarlar → Kullanışlı Özellikler → Labs → Web site koyu temasını kullan seçeneğini etkinleştirebilirsiniz.
Bireysel sayfadasınız. Kurumsal sayfaya geçebilirsiniz.
Günümüzün dijital çağında veri, şirketler için en stratejik varlık haline gelmiştir. Bu yoğunlaştırılmış eğitim programı katılımcılara ham veriyi anlamlı iş kararlarına dönüştürmek için gerekli yetileri kazandırır.
Program sonunda Python programlama temellerine hakim katılımcılar, modern veri bilimi ekosisteminin en güncel araçları ve kütüphaneleriyle tanışmış olurlar.
Katılımcılar, eğitim süresince gerçek dünya veri problemlerini çözmek için pandas/Polars, scikit-learn ve görselleştirme kütüphanelerinin en son sürümlerini kullanmayı öğrenirler.
Bu eğitimin sonunda katılımcılar, modern veri odaklı kararları yönlendiren temel araç ve tekniklere hakim hale gelirler.
Bu kurs, halihazırda Python diline hakim olan ve veri bilimi alanına geçiş yapmak veya bu alandaki becerilerini geliştirmek isteyen yazılımcılar, analistler ve bu konuyla ilgili profesyoneller için özel olarak hazırlanmıştır.
İşlerinde temel programlamanın ötesine geçerek veri işleme, analiz etme ve makine öğrenmesi ile modellemeyi öğrenmek isteyenler için idealdir.
Veri yapıları (lists, dictionaries, tuples), kontrol akışı (loops, conditionals) ve fonksiyonlar dahil olmak üzere Python programlamanın temellerine sağlam bir hakimiyet.
Python script'leri yazma ve çalıştırma konusunda önceden deneyim.
Veri bilimi ve makine öğrenmesi konularında önceden deneyim gerekmemektedir.
Bu kursu tamamlayan katılımcılar aşağıdaki konularda yetkin olacaklardır:
Pandas kütüphanesini kullanarak farklı kaynaklardan veri okuyabilir, temizleyebilir ve manipüle edebilir.
Keşifsel Veri Analizi (EDA) yaparak verideki gizli kalmış desenleri, ilişkileri ve aykırı değerleri ortaya çıkarabilir.
Matplotlib ve Seaborn ile etkili ve anlaşılır veri görselleştirmeleri oluşturabilir
. Makine öğrenmesinin temel mantığını ve iş akışını (veri ön işleme, model eğitimi, değerlendirme) anlayabilir.
Scikit-learn kütüphanesini kullanarak regresyon ve sınıflandırma gibi temel makine öğrenmesi modelleri kurabilir.
Model performansını doğru metriklerle (Accuracy, R-squared, Confusion Matrix vb.) ölçebilir ve yorumlayabilir.
Gerçek dünya veri setleri üzerinde uçtan uca bir veri bilimi projesi gerçekleştirebilir.
Problemi tanımlamak
Veri edinimi ve temizleme
Keşifsel veri analizi
Modelleme
Sonuçları yorumlama ve geliştirme döngüsü
İnteraktif veri bilimi için Jupyter Notebook
Temel kütüphanelere genel bakış: NumPy, Pandas, Matplotlib, Seaborn, Scikit-learn
Series ve DataFrame oluşturma ve inceleme
Çeşitli kaynaklardan veri yükleme (CSV, Excel, database)
Hafızaya sığmayan veriler için parçalı okuma teknikleri
.loc, .iloc ve boolean indeksleme kullanımı
Query işlemleri
İndeksleri ayarlama, sıfırlama ve kullanma
Eksik veri tespiti ve yönetme stratejileri
Duplicate tespiti ve kaldırma
Veri tipi dönüşümleri ve casting
String işlemleri ve metin işleme
Split-apply-combine yaklaşımı
Custom aggregation fonksiyonları
Window functions ve rolling işlemler
Zaman bazlı resampling
Merge ve join işlemleri
Concatenation stratejileri
Pivoting ve unpivoting
Wide to long format dönüşümleri
Vectorized operations ve iterative yaklaşımlar
Memory kullanımını optimize etme teknikleri
Categorical data ile memory düşürme
Query optimizasyonu ve indexing stratejileri
pyplot arayüzü ile hızlı ve etkili grafik çizimi (state-machine yaklaşımı).
Object-Oriented arayüz: Figure ve Axes nesneleri üzerinde tam kontrol.
İki arayüz arasındaki farklar ve ne zaman hangisini kullanmalı.
Özelleştirme ve stil sistemleri
Çoklu grafikler: subplot yapısı
Annotation ve metin yönetimi
Distribution plots ve kernel density estimation
Kategorik veri görselleştirme desenleri
Regresyon ve korelasyon görselleştirmeleri
Matrix plots ve heatmaps
Color palettes ve estetik ayarlar
İnteraktif grafikler ve dashboard’lar oluşturma
3D görselleştirmeler ve yüzey grafikler
Coğrafi veri görselleştirme
Animasyon ve zaman serisi temsili
Web uygulamaları için Dash framework
Veri setinin özelliklerine bakılması: shape, size, memory footprint.
Veri tipi çıkarımı ve doğrulaması
Sütun kardinalitesi ve özgünlük analizi
Eksik değer paternleri ve dağılım analizi
Farklı ayrıntı seviyelerinde tekrarlı veri tespiti
İlişkili alanlar arasında tutarlılık kontrolleri
İş kurallarına göre veriyi doğrulama ve anomali belirteçleri
Sayısal değişkenler için univariate analysis
Kategorik değişkenler için frekans analizi
Skewness tespiti ve dönüşüm gereklilikleri
Zaman bazlı pattern’ler ve seasonality tespiti
IQR ve alan bilgisi kullanarak outlier analizi
Aralık ve sınır değer incelemeleri
Veri güncelliği (freshness) ve tamlık (completeness) metrikleri
Harici veri kaynaklarıyla çapraz doğrulama
Correlation matrix oluşturma ve yorumlama
Feature-target ilişki gücünün ölçülmesi
Multicollinearity tespiti ve etkileri
Değişkenler arası etkileşimlerin incelenmesi
Segmentasyon fırsatlarının belirlenmesi
Sürekli değişkenler için dağılım grafikleri
Kategori dengesi görselleştirmeleri
Zaman serisi trend analizleri
Özellik etkileşimleri için pair plot'lar
Coğrafi ve mekansal veri incelemeleri
Geleneksel programlamadan farkı ve modern dünyadaki yeri (öneri sistemleri, sahtekarlık tespiti, tıbbi teşhis vb.).
Makine Öğrenmesi Türleri: Supervised, Unsupervised, Reinforcement
Modelleme süreci: eğitim, validasyon ve değerlendirme
Problemi tanımlama, veri toplama, özellik mühendisliği (feature engineering), model seçimi, eğitim (training), hiperparametre optimizasyonu (hyperparameter tuning) ve dağıtım (deployment).
Feature scaling ve normalization
Kategorik değişkenlerin encoding'i
Feature engineering stratejileri
Dengesiz veri kümeleriyle başa çıkma
Genelleştirilmiş linear modeller ve regularization
Ağaç Bazlı Modeller (Random Forest, Gradient Boosting)
Yapay Sinir Ağları
Model seçimi ve hyperparameter tuning
Cross-validation stratejileri
Clustering algoritmaları ve değerlendirme metrikleri
Dimensionality reduction (PCA, t-SNE, UMAP)
Anomaly detection yöntemleri
İleri boosting teknikleri
Feature importance ve yorumlama
Kategorik değişkenleri doğal olarak işleme
Büyük veri kümeleri için GPU hızlandırma
Tabular data için neural network temelleri
Grafik kartında model çalıştırmak
AutoML araçları ve framework'ler