Скачать 

[Нетология] Data Scientist: с нуля до middle [Алексей Кузьмин, Олег Булыгин]

Цена: 195 РУБ
Организатор: Robot
Список участников складчины:
  • 1. Walkiriya
  • 2. flaubert
  • 3. Alu
  • 4. Ma_Cherrrie
  • 5. бука злюка
  • 6. akfirsov
  • 7. KuzmichevE
  • 8. ник скрыт
  • 9. fotonS
Robot
Robot
Складчик
  • #1

[Нетология] Data Scientist: с нуля до middle [Алексей Кузьмин, Олег Булыгин]

Ссылка на картинку
Чем занимается Data Scientist
Data Scientist создаёт и обучает предиктивные модели с помощью алгоритмов машинного обучения и нейросетей, помогая бизнесу находить скрытые закономерности, прогнозировать развитие событий и оптимизировать ключевые бизнес-процессы.
Новые знания сделают вас востребованным специалистом в Data Science
Вы научитесь не только работать с аналитикой, нейронными сетями, Big Data и помогать компаниям и продуктам расти с помощью технологий, но и освоите ключевые «мягкие навыки»: коммуникацию в команде, целеполагание и эмоциональный интеллект.
Обучение на курсе поможет вам:
  • Перейти в профессию с высоким окладом, которая не устареет через 10 лет
  • Освоить ключевые технологии и опередить запрос рынка
  • Прожить опыт 2-3 лет самостоятельного изучения сферы Data Science
Кому будет полезен этот курс:
  • Новичкам в Data Science
  • Разработчикам
  • Аналитикам
Чему вы научитесь:
  • Работать с SQL
  • Использовать Python и библиотеки
  • Проверять данные и определять проблемы
  • Обучать многослойные нейронные сети и строить модели машинного обучения
  • Применять математику в алгоритмах
  • Лидировать Data-проекты, работать в команде и находить общий язык с заказчиком
Спойлер: Программа курса:
1 ступень. Погружение
  • Аналитическое мышление (Курсовой проект):
    • Что такое аналитическое мышление
    • Откуда берутся данные
    • Введение в Google-таблицы
    • Продвинутая визуализация данных
    • Продвинутые Google-таблицы
    • Python как инструмент анализа данных
    • Основы статистики
    • Машинное обучение для жизни
  • Основы визуализации данных (Курсовой проект):
    • Зачем нужна визуализация данных
    • Связи, потоки, процессы и карты
    • Инструменты, источники и предподготовка данных
    • Как рассказать историю с помощью данных
    • Основы статистики и способы сравнения метрик
2 ступень. SQL, Python и Big Data
  • SQL и получение данных (Курсовой проект):
    • Архитектура и структура баз данных (БД)
    • Функции SQL и их аналоги в pandas
    • Простые запросы, join`ы, агрегаты
    • Консоль (знакомство, основные операторы, утилита psql)
    • Базовые команды в SQL и встроеные аналитические функции
    • Архитектура и проектирование
    • Импорт и экспорт данных посредством SQL и ETL программ
    • Нормализация
    • Принципы работы с различными БД
    • Зависимости
    • Основные библиотеки для подключения к БД из Python
    • Подготовка и сдача итогового проекта
  • Аналитика больших данных (Курсовой проект):
    • Что такое большие данные
    • Основные характеристики больших данных и виды анализа данных. Продвинутые методы анализа больших данных
    • Монетизация больших данных
    • NoSQL-подход
    • Характеристики и источники данных
    • MapReduce-подход
    • Культура сбора данных
    • Введение в Hadoop
    • Основы реализации проектов больших данных. Кейс-стади
    • Практическое задание (лабораторная работа) по аналитике данных и его разбор
  • Python для анализа данных (Курсовой проект):
    • Базовые типы данных и циклы
    • Базовые понятия статистики
    • Функции и классы
    • Случайные события. Случайные величины
    • Продвинутые типы данных: массивы, множества, словари
    • Логистическая регрессия и дискриминационный анализ
    • Библиотеки для анализа данных: NumPy, Pandas, Matplotlib
    • Корреляция и корреляционный анализ
    • Визуализация в Python
    • Доверительные интервалы. Статистическая проверка гипотез
  • Математика для анализа данных (Курсовой проект):
    • Линейная алгебра. Вектора
    • Производная функции нескольких аргументов
    • Линейная алгебра. Матрицы
    • Теория оптимизации
    • Продвинутая линейная алгебра
    • Теория вероятности. Дискретные и непрерывные случайные величины
    • Математический анализ. Производная
    • Центральная предельная теорема и закон больших чисел
3 ступень. Машинное обучение, Deep Learning и нейронные сети
  • Машинное обучение:
    • Регрессионный анализ. Линейная, полиномиальная и логарифмическая регрессия
    • Оценка точности модели, переобучение, регуляризация
    • Классификация: логистическая регрессия и SVM
    • Проблема качества данных
    • Функции потерь и оптимизация
    • Работа с пропусками и переменными
  • Рекомендательные системы:
    • Неперсонализированные рекомендательные системы
    • Collaborative Filtering
    • Сontent-based-рекомендации
    • Гибридные алгоритмы
  • Временные ряды:
    • Знакомство с временными рядами
    • Сингулярный спектральный анализ
    • Элементарные методы анализа временных рядов
    • Случайные марковские процессы
    • Модели ARMA
    • Нейронные сети в анализе временных рядов
    • Модели авторегрессии условной гетероскедастичности
    • Поиск изменений во временном ряде
  • Нейронные сети:
    • Введение в нейронные сети и библиотеку Keras
    • Введение в рекуррентные сети
    • Углубление в нейронные сети и библиотеку Keras
    • Автокодировщики
    • Введение в свёрточные нейронные сети
    • Введение в генеративно-состязательные сети
  • Компьютерное зрение:
    • Выделение признаков и поиск похожих изображений
    • Задачи детекции и сегментации
    • Сегментация и детекция объектов
    • Рекуррентные нейронные сети в задачах компьютерного зрения (Image Captioning)
    • Свёрточные нейронные сети
    • Порождающие модели
    • Обучение свёрточной сети на практике
  • Обработка естественного языка:
    • Введение в автоматическую обработку текста
    • Тематическое моделирование
    • Структура слова. Морфология
    • Информационный поиск
    • Синтаксический анализ
    • Классификация в АОТ
    • Дистрибутивная семантика
    • Языковые модели
    • Извлечение ключевых слов
    • Извлечение информации
    • Словари. Подкрепление знаний
  • Deep Learning (Курсовой проект):
    • Регрессия и персептрон
    • Внимание: Dense Attention и Beam search
    • Многослойная нейронная сеть: регуляризация, градиентный спуск, ускорение обучения
    • Компьютерное зрение: SSD, Region Based CNN, Faster R-CNN, Masked R-CNN, UNet, перенос стиля и FCN
    • Свёрточные сети: свёрточные архитектуры, многомерные свертки, сегментация
    • Работа с текстом: языковые модели, Embeddings, Word2Wec, FastText, NER, Transformer, BERT и Elmo
    • Рекуррентные сети: RNN, GRU и LSTM, Encoder-Decoder архитектура
    • GAN'ы: дискриминатор, генератор, продвинутые архитектуры
4 ступень. Soft Skills и управление проектами
  • Менеджмент data-проектов:
    • Требования в data-проектах
    • Разработка отчётов по исследованию
    • Методология ведения data-проектов
    • Сохранение результатов эксперимента
  • Эффективные коммуникации:
    • Коммуникации: синхронизация картины мира
    • Эмоциональный интеллект в переговорах
    • Коммуникации: искусство убеждения и структура аргумента
    • Тренды в тестировании: за какими ресурсами следить
    • Эмоциональный интеллект в коммуникациях: этапы развития, распознавание и управление своими и чужими эмоциями
    • Резюме, сопроводительное письмо, портфолио
  • Взаимодействие в команде:
    • Как укрепить свой авторитет и позиции на работе
    • Налаживание вертикальных и горизонтальных связей в коллективе
    • Коммуникации на удалёнке и деловая переписка
  • Публичные выступления:
    • Как презентовать идею или отчёт
    • Подготовка презентации к публичному выступлению
    • Как начать получать удовольствие от выступлений и перестать их бояться
  • Финальный хакатон и Kaggle Competitions:
    В составе мини-команды за ограниченное время и на основе датасетов крупных игроков рынка вам придётся решать задачи по прогнозированию продаж или оптимизации производства, задействуя все знания и навыки, полученные на курсе.
    Интеграция и использование machine learning решений в бизнесе, как правило, подразумевает командную игру, поэтому хакатон полезен ещё и как тренировка необходимых soft skills.
    Итоговый проект — реальный кейс от Dodo Brands
    В рамках дипломного проекта вы сможете построить ML-модель для решения своих текущих профессиональных задач: это может быть система прогнозирования продаж, распознавание объектов на фото или видео, анализ временных рядов, анализ больших объёмов текста и т. д.
    Если у вас нет идей для своего проекта (или доступа к необходимым данным), мы предложим вам учебный кейс в интересной вам области на основе реального датасета других компаний.
    Дипломная работа выполняется самостоятельно под руководством экспертов курса и позволяет закрепить весь спектр знаний и навыков, полученных на программе.
 
Зарегистрируйтесь , чтобы посмотреть скрытый авторский контент.
Похожие складчины
  • в разделе: Программирование
  • в разделе: Программирование
  • в разделе: Программирование

Войдите или зарегистрируйтесь, чтобы комментировать и скачивать складчины!

Учетная запись позволит вам участвовать в складчинах и оставлять комментарии

Регистрация

Создайте аккаунт на форуме. Это не сложно!

Вход

Вы уже зарегистрированы? Войдите.

Сверху