Складчина: Современное компьютерное зрение [stepik] [AI Education] [Елена Кантонистова, Марк Блуменау, Евгений Паточенко, Илья Никитин]
Курс посвящен основам глубинного обучения в области Computer Vision (CV). В курсе мы начнем с азов компьютерного зрения, а затем затронем актуальные задачи CV и посмотрим на устройство популярных решений.
Программа курса
Классические методы Computer Vision
- Основы обработки изображений: фильтры и свертки. Демо-доступ
- Операторы градиента: Лаплас, Собель, Канни. Демо-доступ
- Бинаризация и трешхолдинг (Otsu, адаптивный порог). Демо-доступ
- Методы выделения признаков: SIFT и другие
- HOG: гистограммы направленных градиентов
- Поиск и сопоставление ключевых точек
- Преобразование Хафа и обнаружение геометрических фигур
- Пространственные преобразования: аффинные и перспективные
CNN и первые архитектуры
- Основы сверточных нейронных сетей: ядра, фильтры, пуллинги
- Архитектура LeNet: первые шаги в CV с использованием CNN
- AlexNet: особенности и влияние на развитие глубокого обучения
- VGG: глубокие сети с фиксированными свертками
- ResNet: идея резидуальных связей для решения проблемы исчезающих
- Домашнее задание
Современные архитектуры CV
- ViT (Vision Transformer): альтернатива CNN
- MobileNet: легковесные модели для мобильных устройств
- EfficientNet и EfficientNetV2: масштабируемость и оптимизация
- Практика: аугментации и MBConv
- Домашнее задание
Детекция
- Основы задачи детекции и Non-Maximum Suppression
- RCNN: архитектура и эволюция (Fast RCNN, Faster RCNN)
- YOLOv1
- Современные подходы к детекции: YOLO11 и более новые версии
- Детекция на практике
- Домашнее задание
Сегментация
- Задача сегментации
- U-Net: идея и применение в медицинских изображениях
- Deeplab и его разновидности: адаптация к различным уровням разре
- Mask R-CNN: объединение детекции и сегментации
- Segment Anything Model (SAM): универсальная модель сегментации
- Практика по сегментации
- Домашнее задание (тестирование)
Трекинг и работа с видеопотоками
- Задача трекинга и оценивание качества трекинга
- Алгоритм трекинга
- Работа с видеопотоками. FFMpeg: чтение, запись, сжатие видео
- Gstreamer: организация сложных видео- и аудиопайплайнов
- Практика: захват видео с камер в реальном времени
- Тест по последнему занятию
Итоговый проект курса
- Итоговый проект курса
Дополнительно: библиотека OpenCV
- Установка библиотеки. Загрузка и вывод изображений
Дополнительно: фреймворк FastAPI
- Аннотации типов в Python
- Практика с FastAPI
- Библиотека Pydantic
Цена 10000 руб