Компьютерное зрение — CV [Яндекс Практикум]

Складчина: Компьютерное зрение — CV [Яндекс Практикум]

Чему вы научитесь за 2 месяца

  • Создавать решения для сегментации и детекции объектов
  • Обучать и адаптировать генеративные модели под собственные задачи
  • Работать с мультимодальными данными и архитектурами на их основе
  • Разбираться в трансформерах для изображений: ViT
  • Оценивать и интерпретировать работу CV‑моделей

Программа обучения:
1. Детекция объектов.
— Введение и быстрый старт с YOLOv8
— YOLO‑модель: подготовка данных и обучение
— Постобработка и визуализация результатов
— Aльтернативные архитектуры: SSD и Faster R‑CNN
2.Сегментация изображений

Введение и быстрый старт с сегментацией
Подготовка данных и обучение модели
Постобработка и улучшение результатов
Альтернативные архитектуры

3.Генерация изображений

Введение в генерацию изображений
Autoencoder и VAE
GAN
Диффузионные модели
Файн‑тюнинг и кастомизация diffusion‑моделей

4. Трансформеры и мультимодальные модели

Введение в Vision Transformers
Файн-тюнинг ViT и гибридные трансформеры
Мультимодальные модели
Текстово‑визуальный поиск и описание изображений
Визуальные вопросы и ответы

Спойлер: Ссылка на курс