Современное компьютерное зрение [stepik] [AI Education] [Елена Кантонистова, Марк Блуменау, Евгений Паточенко, Илья Никитин]

Складчина: Современное компьютерное зрение [stepik] [AI Education] [Елена Кантонистова, Марк Блуменау, Евгений Паточенко, Илья Никитин]

V558mxR.png

Курс посвящен основам глубинного обучения в области Computer Vision (CV). В курсе мы начнем с азов компьютерного зрения, а затем затронем актуальные задачи CV и посмотрим на устройство популярных решений.

Программа курса
Классические методы Computer Vision

  1. Основы обработки изображений: фильтры и свертки. Демо-доступ
  2. Операторы градиента: Лаплас, Собель, Канни. Демо-доступ
  3. Бинаризация и трешхолдинг (Otsu, адаптивный порог). Демо-доступ
  4. Методы выделения признаков: SIFT и другие
  5. HOG: гистограммы направленных градиентов
  6. Поиск и сопоставление ключевых точек
  7. Преобразование Хафа и обнаружение геометрических фигур
  8. Пространственные преобразования: аффинные и перспективные

CNN и первые архитектуры

  1. Основы сверточных нейронных сетей: ядра, фильтры, пуллинги
  2. Архитектура LeNet: первые шаги в CV с использованием CNN
  3. AlexNet: особенности и влияние на развитие глубокого обучения
  4. VGG: глубокие сети с фиксированными свертками
  5. ResNet: идея резидуальных связей для решения проблемы исчезающих
  6. Домашнее задание

Современные архитектуры CV

  1. ViT (Vision Transformer): альтернатива CNN
  2. MobileNet: легковесные модели для мобильных устройств
  3. EfficientNet и EfficientNetV2: масштабируемость и оптимизация
  4. Практика: аугментации и MBConv
  5. Домашнее задание

Детекция

  1. Основы задачи детекции и Non-Maximum Suppression
  2. RCNN: архитектура и эволюция (Fast RCNN, Faster RCNN)
  3. YOLOv1
  4. Современные подходы к детекции: YOLO11 и более новые версии
  5. Детекция на практике
  6. Домашнее задание

Сегментация

  1. Задача сегментации
  2. U-Net: идея и применение в медицинских изображениях
  3. Deeplab и его разновидности: адаптация к различным уровням разре
  4. Mask R-CNN: объединение детекции и сегментации
  5. Segment Anything Model (SAM): универсальная модель сегментации
  6. Практика по сегментации
  7. Домашнее задание (тестирование)

Трекинг и работа с видеопотоками

  1. Задача трекинга и оценивание качества трекинга
  2. Алгоритм трекинга
  3. Работа с видеопотоками. FFMpeg: чтение, запись, сжатие видео
  4. Gstreamer: организация сложных видео- и аудиопайплайнов
  5. Практика: захват видео с камер в реальном времени
  6. Тест по последнему занятию

Итоговый проект курса

  1. Итоговый проект курса

Дополнительно: библиотека OpenCV

  1. Установка библиотеки. Загрузка и вывод изображений

Дополнительно: фреймворк FastAPI

  1. Аннотации типов в Python
  2. Практика с FastAPI
  3. Библиотека Pydantic

Цена 10000 руб