Эмили
Организатор
- #1
[Stepik] Машинное обучение - Подготовка данных. Модуль 1 [Alexey Kozhakin]
- Ссылка на картинку
Данный курс является первым модулем из серии моих курсов по машинному обучению (ML). В этом курсе в качестве задачи будет рассматриваться прогнозирование в футбольной аналитике. Мы сосредоточимся на сборе данных, которые будут использоваться для прогнозирования в следующих модулях. Помимо сбора данных, мы также применим некоторые техники предобработки данных.
Программа курса
Введение
Программа курса
Введение
- О курсе
- Среда разработки
- Выбор источника данных
- Выбор метода парсинга
- Определение целевых данных
- Разработка скрипта парсинга
- Библиотека прасинга датасета
- Обзор датасета
- Библиотеки для анализа данных
- Важность и цель очистки данных.
- Устранение дубликатов
- Методы заполнения пропущенных данных.
- Целевая переменная
- Входные параметры
- Проверка качества данных после очистки и обработки
- Проверка точност на моделях
- Анализ важности признаков
- Понижение размерности
- Кластерный анализ
- Добавление новых параметров
- Оценка качества модели после применения кластеризации
- Приведение данных к единообразному формату.
- Преобразование категориальных признаков.
- Оценка качества модели после нормализации модели
- Статистический анализ
- Балансировка данных
Зарегистрируйтесь
, чтобы посмотреть скрытый авторский контент.