Машинное обучение — Подготовка данных (Модуль 1) [stepik] [Alexey Kozhakin]

Складчина: Машинное обучение — Подготовка данных (Модуль 1) [stepik] [Alexey Kozhakin]

456нг4ц57.jpg

Данный курс является первым модулем из серии моих курсов по машинному обучению (ML). В этом курсе в качестве задачи будет рассматриваться прогнозирование в футбольной аналитике. Мы сосредоточимся на сборе данных, которые будут использоваться для прогнозирования в следующих модулях. Помимо сбора данных, мы также применим некоторые техники предобработки данных.

Программа курса
Введение

  1. О курсе
  2. Среда разработки

Сбор данных с использованием парсинга

  1. Выбор источника данных
  2. Выбор метода парсинга
  3. Определение целевых данных
  4. Разработка скрипта парсинга
  5. Библиотека прасинга датасета

Обзор данных

  1. Обзор датасета
  2. Библиотеки для анализа данных

Очистка данных

  1. Важность и цель очистки данных.
  2. Устранение дубликатов
  3. Методы заполнения пропущенных данных.
  4. Целевая переменная
  5. Входные параметры

Валидация данных

  1. Проверка качества данных после очистки и обработки
  2. Проверка точност на моделях
  3. Анализ важности признаков

Кластерный анализ

  1. Понижение размерности
  2. Кластерный анализ
  3. Добавление новых параметров
  4. Оценка качества модели после применения кластеризации

Нормализация и стандартизация данных

  1. Приведение данных к единообразному формату.
  2. Преобразование категориальных признаков.
  3. Оценка качества модели после нормализации модели

Балансировка данных

  1. Статистический анализ
  2. Балансировка данных

цена 500 р.