Computer Vision Bootcamp
Bireysel sayfadasınız. Kurumsal sayfaya geçebilirsiniz.
Renkler tuhaf mı görünüyor? Samsung Internet tarayıcısı koyu modda site renklerini değiştiriyor olabilir. Kapatmak için Internet menüsünden Ayarlar → Kullanışlı Özellikler → Labs → Web site koyu temasını kullan seçeneğini etkinleştirebilirsiniz.
Bireysel sayfadasınız. Kurumsal sayfaya geçebilirsiniz.
Hızlandırılmış programların ders süresi daha azdır ancak öğrencinin kendi vaktinde daha fazla çalışmasını gerektirir.
Günümüzün hızla dijitalleşen dünyasında, görsel veriler (resimler, videolar ve üç boyutlu sahneler) her zamankinden daha yoğun üretiliyor. Bu kapsamlı eğitim, bilgisayarlı görü (Computer Vision) ve görüntü işleme alanında katılımcıları temel ilkelerden en yeni derin öğrenme modellerine uzanan geniş bir yelpazeyle tanıştırmayı amaçlıyor. Eğitim boyunca katılımcılar, görüntülerin nasıl temsil edildiğini ve işlendiğini öğrenecek; klasik görüntü işleme yöntemlerinden başlayarak yapay sinir ağları, evrişimli sinir ağları (CNN), Transformer tabanlı modeller ve ileri seviye uygulamalara kadar kapsamlı bir bilgi birikimi edinecekler. Böylece katılımcılar, görsel verilerden anlamlı özellikler çıkarmayı, karmaşık görevler (nesne algılama, segmentasyon, eylem tanıma vb.) için modelleri eğitmeyi ve bu modelleri gerçek hayatta dağıtılabilir hale getirmeyi deneyimleyecekler.
Bu kurs, bilgisayarlı görü ve görüntü işleme ekosistemine derinlemesine bir yolculuk sunarak katılımcılara aşağıdaki kazanımları hedefler:
Kurs sonunda katılımcılar; temel görüntü işleme ve bilgisayarlı görü prensiplerinden derin öğrenmeye, modern mimarilerden nesne algılama/segmentasyona kadar geniş bir yelpazede uygulama deneyimi edinmiş olacak. Ayrıca son teknoloji (SOTA) modellerin nasıl kullanılacağını, nasıl özelleştirilebileceğini (fine-tuning) ve üretici/geliştirici araçlarıyla gerçek dünya projelerini nasıl hayata geçirebileceğini öğrenerek, akademiden endüstriye pek çok alanda yetkinliğini artırabilecek düzeye gelecekler.
Bilgisayarlı Görü kurs içeriğinde CV olarak kısaltılacaktır.
Kurs CV'nin kapsamını, görüntülerin dijital olarak nasıl temsil edildiğini anlayın ve klasik teknikler kullanarak temel görüntü işleme ve özellik çıkarımı gerçekleştirin.
imread
, imshow
, imwrite
, Matplotlib pyplot
)cvtColor
)resize
, warpAffine
, warpPerspective
)filter2D
, GaussianBlur
, medianBlur
)Canny
)Neural networks'ün temel kavramlarını, gradient descent yoluyla nasıl öğrendiklerini kavrayın ve PyTorch kullanarak temel bir eğitim pipeline'ı uygulayın.
torch.nn.Module
)torch.nn.Linear
)tensor.backward()
)nn.Module
ve nn.Linear
kullanarak Basit bir FFN Model Yapısı Tanımlamatorch.nn.CrossEntropyLoss
, torch.nn.MSELoss
) ve Optimizers (torch.optim
modülü: Adam
, SGD
, AdamW
) Tanımlamaloss.backward()
), Optimizer adımı (optimizer.step()
))nn.Module
'ünü kullanarak bir FFN mimarisi tanımlayın.torch.nn
) ve optimizer (torch.optim
) seçin.CNN'lerin motivasyonunu ve mekanizmalarını anlayın, standart CNN mimarileri oluşturun ve bunları PyTorch kullanarak veri artırma (data augmentation) dahil ederek görüntü sınıflandırmaya uygulayın.
nn.Conv2d
) ve Pooling (nn.MaxPool2d
, nn.AvgPool2d
) Katmanlarını Uygulamann.Sequential
)nn.Module
alt sınıflandırması)torchvision.transforms
Kullanımıtorch.utils.data.Dataset
ve torch.utils.data.DataLoader
Kurulumutorchvision.datasets
kullanarak bir görüntü veri kümesini (örneğin, CIFAR-10, CIFAR-100, Fashion-MNIST) yükleyin ve ön işleyin.torchvision.transforms
kullanarak sağlam bir data augmentation pipeline'ı uygulayın.nn.Module
kullanarak bir CNN mimarisi (örneğin, basitleştirilmiş bir ResNet veya VGG) oluşturun.DataLoader
'lar ile eğitim döngüsünü kurun.torchvision
.torchvision.datasets
veya Hugging Face datasets
kullanarak).Görüntü işlemede Transformer'lara yönelik paradigma kaymasını, ViT'lerin ve Swin Transformer'ların mimarisini ve ConvNeXt gibi modernize edilmiş CNN'lerin nasıl rekabet ettiğini anlayın. PyTorch kullanarak bu modelleri backbone olarak kullanmayı öğrenin.
timm
(PyTorch Image Models), Hugging Face transformers
)timm
, PyTorch için Hugging Face transformers
)timm
veya HF'den).model.eval()
) ve son özellik vektörünü (örneğin, sınıflandırma başlığından önce) veya havuzlanmış çıktıyı çıkarın.timm
, Hugging Face transformers
, NumPy, Matplotlib/Seaborn.Büyük önceden eğitilmiş PyTorch modellerini belirli sınıflandırma görevlerine uyarlamak için fine-tuning tekniklerinde ustalaşın, gelişmiş eğitim stratejilerini anlayın ve performansı titizlikle değerlendirin.
timm
/HF for PyTorch) yükleme ve sınıflandırma başlığını değiştirme.param.requires_grad = False/True
ayarlayarak).torch.optim.lr_scheduler
).scikit-learn
veya torchmetrics
kullanma.Dataset
/DataLoader
).torchmetrics
veya scikit-learn kullanarak test kümesinde accuracy, precision, recall, F1-score ve confusion matrix ile titizlikle değerlendirin.timm
/HF transformers
, NumPy, Scikit-learn/torchmetrics
, W&B/TensorBoard, torchvision
/HF datasets
.Object detection görevini anlayın, baskın mimariler (tek aşamalı, iki aşamalı, Transformer tabanlı) hakkında bilgi edinin ve PyTorch kullanarak YOLOv8 ve DETR varyantları gibi SOTA detector'ları eğitme ve değerlendirme konusunda uygulamalı deneyim kazanın.
ultralytics
kütüphanesini kullanma (PyTorch backend): Kurulum, görüntüler/videolar üzerinde inference, komut satırı ve Python API ile eğitim/fine-tuning.transformers
kullanarak DETR/RT-DETR: Modelleri yükleme, görüntüleri ön işleme, inference yapma, tahminleri çözme (kutular, etiketler).pycocotools
).ultralytics
veya HF transformers
+ accelerate
, hepsi PyTorch tabanlı) kullanarak eğitim ortamını kurun.ultralytics
veya Hugging Face (transformers
, datasets
), OpenCV, W&B/TensorBoard, PyTorch.Farklı segmentation görevlerini anlayın, temel mimariler (FCN, U-Net, Mask R-CNN, Transformer tabanlı) hakkında bilgi edinin ve PyTorch kullanarak Segment Anything Model (SAM) dahil SOTA modelleri kullanın.
nn.ConvTranspose2d
, Bilinear Upsampling - nn.functional.interpolate
).torchvision.models.segmentation
'dan DeepLabv3, U-Net).torchvision.models.detection
'dan Mask R-CNN).transformers
for PyTorch veya Detectron2 (PyTorch tabanlı) aracılığıyla Mask2Former/Mask DINO kullanma.torchmetrics
).torchvision
'dan DeepLabv3+). Örnek görüntülerde (örneğin, Cityscapes demo, ADE20K demo veya özel) inference çalıştırın ve tahmin edilen sınıf maskelerini görselleştirin.torchmetrics
) kullanarak değerlendirin.torchvision
/HF transformers
/Detectron2, segment-anything
kütüphanesi, OpenCV, Matplotlib, torchmetrics
.Video verilerinin zorluklarını anlayın ve action recognition, object tracking ve temporal reasoning için SOTA tekniklerini, öncelikle PyTorch çerçevelerini kullanarak öğrenin.
transformers
, MMAction2 (PyTorch) aracılığıyla VideoMAE, SlowFast). Video klipler üzerinde inference yapma.decord
, OpenCV VideoCapture
, PyTorchVideo).PyTorchVideo
/MMAction2, OpenCV, decord
, Tracking kütüphanesi (PyTorch uyumlu).Farklı 3D veri temsillerini anlayın, 3D reconstruction, point cloud analizi ve novel view synthesis (NeRF/Gaussian Splatting) için SOTA tekniklerini, PyTorch implementasyonlarına odaklanarak öğrenin.
nerfstudio
(PyTorch), resmi 3DGS repo (PyTorch)) - kullanıma odaklanma.nerfstudio
demolarından veya 3DGS örneklerinden).nerfstudio
, gaussian-splatting
- PyTorch tabanlı).Diffusion Modelleri ve GAN'ların ardındaki prensipleri anlayın ve PyTorch kütüphanelerini kullanarak text-to-image generation ve temel image editing için SOTA modelleri kullanma deneyimi kazanın.
diffusers
kütüphanesini kullanma (PyTorch öncelikli):diffusers
aracılığıyla PyTorch tabanlı) kullanmak ve ControlNet kullanarak generation üzerinde kontrol sağlamak.diffusers
kütüphanesini kurun.guidance_scale
ve num_inference_steps
etkisini keşfedin. Negative prompt'lar kullanın.diffusers
, transformers
, accelerate
, OpenCV (conditioning map'leri oluşturmak için), PyTorch.Self-Supervised Learning (SSL), Contrastive Learning, Multimodal Learning (Vision-Language Models) ve Few/Zero-Shot Learning'in ardındaki motivasyonu ve mekanizmaları, PyTorch araçlarına ve kütüphanelerine odaklanarak anlayın.
transformers
veya OpenCLIP): Model yükleme, görüntü ve metin embedding'lerini alma, zero-shot sınıflandırma için benzerlik hesaplama.transformers
for PyTorch veya özel PyTorch kütüphaneleri aracılığıyla LLaVA, BLIP): Visual Question Answering (VQA) ve Image Captioning yapma.lightly
veya PyTorch Lightning Bolts gibi PyTorch kütüphanelerini kullanarak bir contrastive learning pipeline'ı kurma (bileşenlere odaklanma).transformers
, datasets
, OpenCLIP (isteğe bağlı).diffusers
- PyTorch) + ControlNet kullanarak bir Gradio uygulaması oluşturun (örneğin, eskizleri fotoğraflara dönüştürme).Eğitilmiş PyTorch modellerini daha küçük, daha hızlı ve çeşitli platformlarda gerçek dünya dağıtımı için uygun hale getirme tekniklerini öğrenin.
torch.nn.utils.prune
. Yapılandırılmamış (Unstructured) vs. Yapılandırılmış (Structured) Pruning. Magnitude Pruning, Lottery Ticket Hypothesis kavramı.torch.onnx.export
).torch.profiler
kullanarak) ve ONNX Runtime kullanarak ONNX modelinin inference hızını benchmark yapın ve model boyutunu ölçün.SOTA tekniklerini (PyTorch kullanarak) uygulayan zorlu ve anlamlı bir computer vision projesi tanımlayın, planı, veri kümesini, metodolojiyi ve değerlendirme stratejisini ana hatlarıyla belirtin.
Bitirme projesi planını yürütün, çözümü PyTorch kullanarak uygulayın, modelleri eğitin/fine-tune edin, sonuçlara göre iterate edin ve ilerlemeyi belgeleyin.
torchvision
, özel Dataset
'ler).Bitirme projesi bulgularını sunun, çalışan PyTorch tabanlı çözümü gösterin, zorlukları ve öğrenimleri tartışın ve bootcamp anahtar çıkarımlarını gözden geçirin.
environment.yml
veya requirements.txt
) sağlanacaktır.