Robot
Складчик
- #1
[Слёрм] Data Scientist [Иван Аникин, Владимир Бугаевский]
- Ссылка на картинку
Это курс об автоматизации
Вы узнаете, как научить компьютеры «думать» самостоятельно.
Мы поможем уверенно стартовать в карьере в ML: вы сможете сделать итоговый проект на реальных данных.
30% теории. 70% практики.
Вы научитесь:
1. Анализировать и визуализировать большие объемы данных
2. Сводить бизнес-задачу в задачу машинного обучения
3. Работать с данными разных типов
Какими проектами может заниматься специалист по машинному обучению:
1. Создаст умный поиск, который поймет пользователя с полуслова и точно найдет то, что просит человек
2. Разработает алгоритм для персонифицированной рекламы в социальных сетях: чтобы клиенты точно нажали на рекламный баннер, который на 100% попадает в их сердечко
3. Придумает умного бота для общения с клиентами — «Алису 2.0» или голосового помощника «Игоря»
4. Получит информацию из данных компании и сможет предложить на их основе рабочую гипотезу для увеличения прибыли компании
Кому рекомендуем курс:
1. Разработчикам, работающим в кросс-функциональных командах вместе с Data Scientist’ами
На курсе мы даем специфику разработки ML-моделей, а с этими знаниями общаться с коллегами получается эффективнее и продуктивнее. Вы сможете внедрять новые решения и быть уверенными в том, что принесете прибыль проекту.
2. Software Engineer, Data Engineer, DevOps Engineer на уровне Middle
Вы сможете перейти в смежную профессиональную область и начать выполнять другие рабочие задачи. Ваш бэкграунд в дата-направлении поможет быстро перейти от уровня Junior Data Scientist до статуса продвинутого специалиста.
3. Уже знакомы с Python и хотите освоить новое рабочее направление
Data Scientist используют в своей работе библиотеки Python. Так что ваши умения пригодятся вам при переходе в новое направление. Знания линейной алгебры, теории вероятностей и математической статистики будет плюсом.
На курсе мы разбираем:
1. Основные алгоритмы и понятия классического машинного обучения
2. Применение машинного обучения в бизнес-задачах
3. Базовые подходы для построения нейронных сетей, фреймворк PyTorch для написаний нейронных сетей
4. Основные библиотеки для анализа данных: numpy, scipy, pandas, matplotlib
Какие инструменты освоите:
1. Библиотеки
Модуль 0 - Установочная сессия
Модуль 1 - Введение. Определение ML
1.1. Введение. Структура курса
1.2. Цикл разработки модели и специалисты в сфере анализа данных
1.3. Настройка рабочего окружения
1.4. Библиотека NumPy
1.5. Библиотека Pandas
Модуль 2 - Анализ данных как первый шаг к ML/DS
2.1. Введение
2.2. Качество данных и типы данных
2.3. Приемы анализа данных - сводные показатели
2.4. Приемы анализа данных - визуализация
2.5. Итоги
Модуль 3 - Постановка задачи машинного обучения на примере KNN
3.1. Введение
3.2. Постановка задачи машинного обучения
3.3. Алгоритм k-ближайших соседей
3.4. Взвешенный алгоритм k-ближайших соседей
3.5. Виды расстояний и проблемы метода k-ближайших соседей
3.6. Оценка качества ML модели и выбор гиперпараметров
3.7. Практика
3.8. Итоги
Встреча по темам 1-3
Модуль 4 - Валидация модели и подготовка данных
4.1. Введение
4.2. Валидация модели
4.3. Подготовка данных
4.4. Итоги
Модуль 5 - Обучение с учителем — регрессия
5.1. Введение
5.2. Линейная регрессия
5.3. Алгоритм стохастического градиентного спуска
5.4. Метрики качества регрессии
5.5. Регуляризация линейных моделей
5.6. Практика
5.7. Итоги
Модуль 6 - Обучение с учителем — классификация
6.1. Введение
6.2. Логистическая регрессия
6.3. Метрики качества классификации
6.4. Практическое занятие по решению задачи классификации с помощью лог. рег.
6.5. Итоги
Встреча по темам 4-6
Модуль 7 - Деревья решений
7.1. Введение
7.2. Деревья решений
7.3. Ансамблирование алгоритмов
7.4. Случайный лес (random forest)
7.5. Бустинг. AdaBoost
7.6. Градиентный бустинг, catboost/xgboost/lightgbm
7.7. Практическое занятие по использованию деревьев решений и ансамблей над ними
7.8. Итоги
Модуль 8 - Обучение без учителя
8.1. Введение
8.2. Задача кластеризации
8.3. Быстрый поиск ближайших соседей
8.4. Задача понижения размерности
8.5. Практика
8.6. Итоги
Модуль 9 - Оптимизация ML-пайплайна
9.1. Введение
9.2. Feature engineering
9.3. Оптимизация гиперпараметров. Алгоритмы ML как гиперпараметры ML пайплайна
9.4. Библиотеки для оптимизации гиперпараметров
9.5. Практическое занятие по построению ML пайплайна с различными компонентами, оптимизации гиперпараметров и выбору оптимального ML пайплайна
9.6. Итоги
Встреча по темам 7-9 + объяснения итогового проекта
Модуль 10 - Итоговый проект
10.1. Введение
10.2. Задание
Модуль 11 - Введение в глубокое обучение (DL + CV)
11.1. Введение
11.2. Перцептрон. Функции активации. Многослойный перцептрон.
11.3. Обучение нейронных сетей. Оптимизаторы.
11.4. Линейная/логистическая регрессия как простейшая нейросеть.
11.5. Машинное представление изображения. Свертка. Фильтр.
11.6. Сверточная нейронная сеть. Паддинг (padding), Страйд (stride), Рецептивное поле (receptive field).
11.7. Imagenet. Alexnet, VGG.
11.8. Глубокие сверточные сети. ResNet.
11.9. Эффективные свертки. Inception.
11.10. Neural architecture search. EfficientNet.
11.11. Итоги
Модуль 12 - Введение в обработку текстов (NLP)
12.1. Введение
12.2. Примеры задач, решаемые NLP подходами
12.3. Предобработка текстов
12.4. Bag-of-words и TF-IDF
12.5. Word2Vec и FastText
12.6. Языковые модели: применение рекуррентных нейронных сетей
12.7. Большие языковые модели
12.8. Transfer Learning при работе с текстами
12.9. Практика
12.10. Итоги
Модуль 13 - Введение в рекомендательные системы (RecSys)
13.1. Введение
13.2. Примеры рекомендательных систем
13.3. Постановка задач рекомендательных систем
13.4. Коллаборативная фильтрация. Memory based подход
13.5. Коллаборативная фильтрация. Матричные факторизация
13.6. Коллаборативная фильтрация. Линейные модели
13.7. Коллаборативная фильтрация. Нейросетевые модели
13.8. Итоги
Модуль 14 - Обзор наиболее популярных бизнес-задач, решаемых с помощью ML. Маппинг задач на ранее пройденный материал
14.1. Введение
14.2. ML System Design - что это и отличия от System Design
14.3. Фреймворк дизайна ML системы
14.4. Пример дизайна - прогноз спроса
14.5. Пример дизайна - оптимизация маркетинга
14.6. Пример дизайна - подбор рекламы
14.7. Итоги
Модуль 15 - Проект
Встреча по доп. модулю + защита проектов
Вы узнаете, как научить компьютеры «думать» самостоятельно.
Мы поможем уверенно стартовать в карьере в ML: вы сможете сделать итоговый проект на реальных данных.
30% теории. 70% практики.
Вы научитесь:
1. Анализировать и визуализировать большие объемы данных
2. Сводить бизнес-задачу в задачу машинного обучения
3. Работать с данными разных типов
Какими проектами может заниматься специалист по машинному обучению:
1. Создаст умный поиск, который поймет пользователя с полуслова и точно найдет то, что просит человек
2. Разработает алгоритм для персонифицированной рекламы в социальных сетях: чтобы клиенты точно нажали на рекламный баннер, который на 100% попадает в их сердечко
3. Придумает умного бота для общения с клиентами — «Алису 2.0» или голосового помощника «Игоря»
4. Получит информацию из данных компании и сможет предложить на их основе рабочую гипотезу для увеличения прибыли компании
Кому рекомендуем курс:
1. Разработчикам, работающим в кросс-функциональных командах вместе с Data Scientist’ами
На курсе мы даем специфику разработки ML-моделей, а с этими знаниями общаться с коллегами получается эффективнее и продуктивнее. Вы сможете внедрять новые решения и быть уверенными в том, что принесете прибыль проекту.
2. Software Engineer, Data Engineer, DevOps Engineer на уровне Middle
Вы сможете перейти в смежную профессиональную область и начать выполнять другие рабочие задачи. Ваш бэкграунд в дата-направлении поможет быстро перейти от уровня Junior Data Scientist до статуса продвинутого специалиста.
3. Уже знакомы с Python и хотите освоить новое рабочее направление
Data Scientist используют в своей работе библиотеки Python. Так что ваши умения пригодятся вам при переходе в новое направление. Знания линейной алгебры, теории вероятностей и математической статистики будет плюсом.
На курсе мы разбираем:
1. Основные алгоритмы и понятия классического машинного обучения
2. Применение машинного обучения в бизнес-задачах
3. Базовые подходы для построения нейронных сетей, фреймворк PyTorch для написаний нейронных сетей
4. Основные библиотеки для анализа данных: numpy, scipy, pandas, matplotlib
Какие инструменты освоите:
1. Библиотеки
- Pandas
- Numpy
- Matplotlib
- Scikit-learn
- Xgboost
- Lightgbm
- Catboost
- Hyperopt
- KNN
- Linear Regression
- Logistic Regression
- Clusterization
- Decision Tree
- Gradient Boosting
Модуль 0 - Установочная сессия
Модуль 1 - Введение. Определение ML
1.1. Введение. Структура курса
1.2. Цикл разработки модели и специалисты в сфере анализа данных
1.3. Настройка рабочего окружения
1.4. Библиотека NumPy
1.5. Библиотека Pandas
Модуль 2 - Анализ данных как первый шаг к ML/DS
2.1. Введение
2.2. Качество данных и типы данных
2.3. Приемы анализа данных - сводные показатели
2.4. Приемы анализа данных - визуализация
2.5. Итоги
Модуль 3 - Постановка задачи машинного обучения на примере KNN
3.1. Введение
3.2. Постановка задачи машинного обучения
3.3. Алгоритм k-ближайших соседей
3.4. Взвешенный алгоритм k-ближайших соседей
3.5. Виды расстояний и проблемы метода k-ближайших соседей
3.6. Оценка качества ML модели и выбор гиперпараметров
3.7. Практика
3.8. Итоги
Встреча по темам 1-3
Модуль 4 - Валидация модели и подготовка данных
4.1. Введение
4.2. Валидация модели
4.3. Подготовка данных
4.4. Итоги
Модуль 5 - Обучение с учителем — регрессия
5.1. Введение
5.2. Линейная регрессия
5.3. Алгоритм стохастического градиентного спуска
5.4. Метрики качества регрессии
5.5. Регуляризация линейных моделей
5.6. Практика
5.7. Итоги
Модуль 6 - Обучение с учителем — классификация
6.1. Введение
6.2. Логистическая регрессия
6.3. Метрики качества классификации
6.4. Практическое занятие по решению задачи классификации с помощью лог. рег.
6.5. Итоги
Встреча по темам 4-6
Модуль 7 - Деревья решений
7.1. Введение
7.2. Деревья решений
7.3. Ансамблирование алгоритмов
7.4. Случайный лес (random forest)
7.5. Бустинг. AdaBoost
7.6. Градиентный бустинг, catboost/xgboost/lightgbm
7.7. Практическое занятие по использованию деревьев решений и ансамблей над ними
7.8. Итоги
Модуль 8 - Обучение без учителя
8.1. Введение
8.2. Задача кластеризации
8.3. Быстрый поиск ближайших соседей
8.4. Задача понижения размерности
8.5. Практика
8.6. Итоги
Модуль 9 - Оптимизация ML-пайплайна
9.1. Введение
9.2. Feature engineering
9.3. Оптимизация гиперпараметров. Алгоритмы ML как гиперпараметры ML пайплайна
9.4. Библиотеки для оптимизации гиперпараметров
9.5. Практическое занятие по построению ML пайплайна с различными компонентами, оптимизации гиперпараметров и выбору оптимального ML пайплайна
9.6. Итоги
Встреча по темам 7-9 + объяснения итогового проекта
Модуль 10 - Итоговый проект
10.1. Введение
10.2. Задание
Модуль 11 - Введение в глубокое обучение (DL + CV)
11.1. Введение
11.2. Перцептрон. Функции активации. Многослойный перцептрон.
11.3. Обучение нейронных сетей. Оптимизаторы.
11.4. Линейная/логистическая регрессия как простейшая нейросеть.
11.5. Машинное представление изображения. Свертка. Фильтр.
11.6. Сверточная нейронная сеть. Паддинг (padding), Страйд (stride), Рецептивное поле (receptive field).
11.7. Imagenet. Alexnet, VGG.
11.8. Глубокие сверточные сети. ResNet.
11.9. Эффективные свертки. Inception.
11.10. Neural architecture search. EfficientNet.
11.11. Итоги
Модуль 12 - Введение в обработку текстов (NLP)
12.1. Введение
12.2. Примеры задач, решаемые NLP подходами
12.3. Предобработка текстов
12.4. Bag-of-words и TF-IDF
12.5. Word2Vec и FastText
12.6. Языковые модели: применение рекуррентных нейронных сетей
12.7. Большие языковые модели
12.8. Transfer Learning при работе с текстами
12.9. Практика
12.10. Итоги
Модуль 13 - Введение в рекомендательные системы (RecSys)
13.1. Введение
13.2. Примеры рекомендательных систем
13.3. Постановка задач рекомендательных систем
13.4. Коллаборативная фильтрация. Memory based подход
13.5. Коллаборативная фильтрация. Матричные факторизация
13.6. Коллаборативная фильтрация. Линейные модели
13.7. Коллаборативная фильтрация. Нейросетевые модели
13.8. Итоги
Модуль 14 - Обзор наиболее популярных бизнес-задач, решаемых с помощью ML. Маппинг задач на ранее пройденный материал
14.1. Введение
14.2. ML System Design - что это и отличия от System Design
14.3. Фреймворк дизайна ML системы
14.4. Пример дизайна - прогноз спроса
14.5. Пример дизайна - оптимизация маркетинга
14.6. Пример дизайна - подбор рекламы
14.7. Итоги
Модуль 15 - Проект
Встреча по доп. модулю + защита проектов
Зарегистрируйтесь
, чтобы посмотреть скрытый авторский контент.