Введение в анализ данных

Длительность
  • 13 занятий
  • 52 ак. часов
Курс преподают
  • Константин Измайлов Константин Измайлов
  • Владимир Бугаевский Владимир Бугаевский
Получаемые навыки

Познакомитесь с языком Python, разберете основные библиотеки для анализа и визуализации данных Pandas, numpy, Matplotlib и другие. Займетесь прикладным статистическим анализом данных, изучите основные понятия математической статистики, проверку статистических гипотез и работу с временными рядами. Кроме того, освоите язык SQL и сможете применять простые команды языка на практике.

Контроль знаний

Во время семестра предстоит выполнить домашнее задание в формате code contest и нескольких тестов, написать свой собственный парсер, а также подготовить мини-проект по анализу данных. При пересчете в оценки баллы распределяются следующим образом:
– 0−49 «неудовлетворительно», 
– 50−70 «удовлетворительно», 
– 71−85 «хорошо», 
– 86−100 «отлично».

Требования

Для успешного прохождения курса необходимо знание одного из языков программирования и теории вероятностей.

Цель курса — разберетесь, как и над чем работает аналитик, и на практике освоите рабочие инструменты, языки и библиотеки. 

Задачи, связанные с анализом данных, возникают практически в любой индустрии: от инвестиций и управления финансами до прогнозирования спроса на товар в ритейле, от разработки маркетинговых стратегий до анализа поведения и успеваемости в образовательных курсах, от строительства нефтеперерабатывающих заводов до цепочек поставок в промышленности. Анализ данных помогает компаниям формировать и проверять продуктовые гипотезы, создавать сервисы, приносящие прибыль владельцу и удовольствие клиенту.

Смешанное занятие №1

Введение в Python

4 часа 2 часа СР

Смешанное занятие №2

Библиотека Numpy

4 часа

Смешанное занятие №3

Библиотека Pandas

4 часа 3 часа СР

Смешанное занятие №4

Визуализация данных

4 часа 3 часа СР

Смешанное занятие №5

Углубленный Python. Часть 1

4 часа 3 часа СР

Смешанное занятие №6

Углубленный Python. Часть 2

4 часа 3 часа СР

Смешанное занятие №7

Парсинг данных с помощью Python

4 часа 3 часа СР

Смешанное занятие №8

Введение в статистику - 1

4 часа 3 часа СР

Смешанное занятие №9

Введение в статистику - 2

4 часа 3 часа СР

Смешанное занятие №10

Временные ряды

4 часа

Смешанное занятие №11

Введение в SQL

4 часа

Рубежный контроль №1

Коллоквиум

4 часа 3 часа СР

Пересдача №1

Пересдача

4 часа 4 часа СР


Также в первом семестре:
Машинное обучение

– Освоите применение алгоритмов машинного обучения в контексте решения задач Data Mining. 
– Изучите методы построения, преобразования, отбора признаков, научитесь оценивать качество построенных моделей и визуализировать результаты анализа. 
– К теории прилагается практика: познакомитесь с современными библиотеками научных вычислений и выполните семестровый проект, близкий к задачам, решаемым в Mail.ru Group.

Углубленное программирование на C/C++

– Освоите С++ на уровне upper-intermediate.
– Сориентируетесь в инструментарии разработчика С++.
– Изучите идиомы и best practices современного С++.

© Mail.ru Group, 2011–2020

Обратная связь

Присоединяйся:

Группа ВКонтакте
  • Дизайн:
    Nimax
  • Разработка:
    Лаборатория
    Технопарка
Версия портала - 5.45.9