Robot
Складчик
- #1
[Нетология] Data Scientist: с нуля до middle [Алексей Кузьмин, Олег Булыгин]
- Ссылка на картинку
Чем занимается Data Scientist
Data Scientist создаёт и обучает предиктивные модели с помощью алгоритмов машинного обучения и нейросетей, помогая бизнесу находить скрытые закономерности, прогнозировать развитие событий и оптимизировать ключевые бизнес-процессы.
Новые знания сделают вас востребованным специалистом в Data Science
Вы научитесь не только работать с аналитикой, нейронными сетями, Big Data и помогать компаниям и продуктам расти с помощью технологий, но и освоите ключевые «мягкие навыки»: коммуникацию в команде, целеполагание и эмоциональный интеллект.
Обучение на курсе поможет вам:
Data Scientist создаёт и обучает предиктивные модели с помощью алгоритмов машинного обучения и нейросетей, помогая бизнесу находить скрытые закономерности, прогнозировать развитие событий и оптимизировать ключевые бизнес-процессы.
Новые знания сделают вас востребованным специалистом в Data Science
Вы научитесь не только работать с аналитикой, нейронными сетями, Big Data и помогать компаниям и продуктам расти с помощью технологий, но и освоите ключевые «мягкие навыки»: коммуникацию в команде, целеполагание и эмоциональный интеллект.
Обучение на курсе поможет вам:
- Перейти в профессию с высоким окладом, которая не устареет через 10 лет
- Освоить ключевые технологии и опередить запрос рынка
- Прожить опыт 2-3 лет самостоятельного изучения сферы Data Science
- Новичкам в Data Science
- Разработчикам
- Аналитикам
- Работать с SQL
- Использовать Python и библиотеки
- Проверять данные и определять проблемы
- Обучать многослойные нейронные сети и строить модели машинного обучения
- Применять математику в алгоритмах
- Лидировать Data-проекты, работать в команде и находить общий язык с заказчиком
Спойлер: Программа курса:
1 ступень. Погружение
2 ступень. SQL, Python и Big Data
- Аналитическое мышление (Курсовой проект):
- Что такое аналитическое мышление
- Откуда берутся данные
- Введение в Google-таблицы
- Продвинутая визуализация данных
- Продвинутые Google-таблицы
- Python как инструмент анализа данных
- Основы статистики
- Машинное обучение для жизни
- Основы визуализации данных (Курсовой проект):
- Зачем нужна визуализация данных
- Связи, потоки, процессы и карты
- Инструменты, источники и предподготовка данных
- Как рассказать историю с помощью данных
- Основы статистики и способы сравнения метрик
3 ступень. Машинное обучение, Deep Learning и нейронные сети
- SQL и получение данных (Курсовой проект):
- Архитектура и структура баз данных (БД)
- Функции SQL и их аналоги в pandas
- Простые запросы, join`ы, агрегаты
- Консоль (знакомство, основные операторы, утилита psql)
- Базовые команды в SQL и встроеные аналитические функции
- Архитектура и проектирование
- Импорт и экспорт данных посредством SQL и ETL программ
- Нормализация
- Принципы работы с различными БД
- Зависимости
- Основные библиотеки для подключения к БД из Python
- Подготовка и сдача итогового проекта
- Аналитика больших данных (Курсовой проект):
- Что такое большие данные
- Основные характеристики больших данных и виды анализа данных. Продвинутые методы анализа больших данных
- Монетизация больших данных
- NoSQL-подход
- Характеристики и источники данных
- MapReduce-подход
- Культура сбора данных
- Введение в Hadoop
- Основы реализации проектов больших данных. Кейс-стади
- Практическое задание (лабораторная работа) по аналитике данных и его разбор
- Python для анализа данных (Курсовой проект):
- Базовые типы данных и циклы
- Базовые понятия статистики
- Функции и классы
- Случайные события. Случайные величины
- Продвинутые типы данных: массивы, множества, словари
- Логистическая регрессия и дискриминационный анализ
- Библиотеки для анализа данных: NumPy, Pandas, Matplotlib
- Корреляция и корреляционный анализ
- Визуализация в Python
- Доверительные интервалы. Статистическая проверка гипотез
- Математика для анализа данных (Курсовой проект):
- Линейная алгебра. Вектора
- Производная функции нескольких аргументов
- Линейная алгебра. Матрицы
- Теория оптимизации
- Продвинутая линейная алгебра
- Теория вероятности. Дискретные и непрерывные случайные величины
- Математический анализ. Производная
- Центральная предельная теорема и закон больших чисел
4 ступень. Soft Skills и управление проектами
- Машинное обучение:
- Регрессионный анализ. Линейная, полиномиальная и логарифмическая регрессия
- Оценка точности модели, переобучение, регуляризация
- Классификация: логистическая регрессия и SVM
- Проблема качества данных
- Функции потерь и оптимизация
- Работа с пропусками и переменными
- Рекомендательные системы:
- Неперсонализированные рекомендательные системы
- Collaborative Filtering
- Сontent-based-рекомендации
- Гибридные алгоритмы
- Временные ряды:
- Знакомство с временными рядами
- Сингулярный спектральный анализ
- Элементарные методы анализа временных рядов
- Случайные марковские процессы
- Модели ARMA
- Нейронные сети в анализе временных рядов
- Модели авторегрессии условной гетероскедастичности
- Поиск изменений во временном ряде
- Нейронные сети:
- Введение в нейронные сети и библиотеку Keras
- Введение в рекуррентные сети
- Углубление в нейронные сети и библиотеку Keras
- Автокодировщики
- Введение в свёрточные нейронные сети
- Введение в генеративно-состязательные сети
- Компьютерное зрение:
- Выделение признаков и поиск похожих изображений
- Задачи детекции и сегментации
- Сегментация и детекция объектов
- Рекуррентные нейронные сети в задачах компьютерного зрения (Image Captioning)
- Свёрточные нейронные сети
- Порождающие модели
- Обучение свёрточной сети на практике
- Обработка естественного языка:
- Введение в автоматическую обработку текста
- Тематическое моделирование
- Структура слова. Морфология
- Информационный поиск
- Синтаксический анализ
- Классификация в АОТ
- Дистрибутивная семантика
- Языковые модели
- Извлечение ключевых слов
- Извлечение информации
- Словари. Подкрепление знаний
- Deep Learning (Курсовой проект):
- Регрессия и персептрон
- Внимание: Dense Attention и Beam search
- Многослойная нейронная сеть: регуляризация, градиентный спуск, ускорение обучения
- Компьютерное зрение: SSD, Region Based CNN, Faster R-CNN, Masked R-CNN, UNet, перенос стиля и FCN
- Свёрточные сети: свёрточные архитектуры, многомерные свертки, сегментация
- Работа с текстом: языковые модели, Embeddings, Word2Wec, FastText, NER, Transformer, BERT и Elmo
- Рекуррентные сети: RNN, GRU и LSTM, Encoder-Decoder архитектура
- GAN'ы: дискриминатор, генератор, продвинутые архитектуры
- Менеджмент data-проектов:
- Требования в data-проектах
- Разработка отчётов по исследованию
- Методология ведения data-проектов
- Сохранение результатов эксперимента
- Эффективные коммуникации:
- Коммуникации: синхронизация картины мира
- Эмоциональный интеллект в переговорах
- Коммуникации: искусство убеждения и структура аргумента
- Тренды в тестировании: за какими ресурсами следить
- Эмоциональный интеллект в коммуникациях: этапы развития, распознавание и управление своими и чужими эмоциями
- Резюме, сопроводительное письмо, портфолио
- Взаимодействие в команде:
- Как укрепить свой авторитет и позиции на работе
- Налаживание вертикальных и горизонтальных связей в коллективе
- Коммуникации на удалёнке и деловая переписка
- Публичные выступления:
- Как презентовать идею или отчёт
- Подготовка презентации к публичному выступлению
- Как начать получать удовольствие от выступлений и перестать их бояться
- Финальный хакатон и Kaggle Competitions:
В составе мини-команды за ограниченное время и на основе датасетов крупных игроков рынка вам придётся решать задачи по прогнозированию продаж или оптимизации производства, задействуя все знания и навыки, полученные на курсе.
Интеграция и использование machine learning решений в бизнесе, как правило, подразумевает командную игру, поэтому хакатон полезен ещё и как тренировка необходимых soft skills.
Итоговый проект — реальный кейс от Dodo Brands
В рамках дипломного проекта вы сможете построить ML-модель для решения своих текущих профессиональных задач: это может быть система прогнозирования продаж, распознавание объектов на фото или видео, анализ временных рядов, анализ больших объёмов текста и т. д.
Если у вас нет идей для своего проекта (или доступа к необходимым данным), мы предложим вам учебный кейс в интересной вам области на основе реального датасета других компаний.
Дипломная работа выполняется самостоятельно под руководством экспертов курса и позволяет закрепить весь спектр знаний и навыков, полученных на программе.
Зарегистрируйтесь
, чтобы посмотреть скрытый авторский контент.