Алгоритмы интеллектуальной обработки больших объемов данных

Длительность
  • 15 занятий
  • 66 ак. часов
Курс преподают
  • Андрей Шестаков Андрей Шестаков
  • Анис Хамуш Анис Хамуш
  • Всеволод Викулин Всеволод Викулин
  • Дмитрий Меркушов Дмитрий Меркушов
  • Александр Щусь Александр Щусь
Получаемые навыки

Существенная часть курса посвящена применению алгоритмов машинного обучения в контексте решения задач Data Mining. Кроме того, студенты изучат методы построения, преобразования и отбора признаков, научатся оценивать качество построенных моделей и визуализировать результаты анализа. Для закрепления полученных теоретических знаний и ознакомления с современными библиотеками научных вычислений студентам будет предложено выполнить семестровый проект, близкий к задачам обработки данных, решаемым в Mail.Ru Group.

Контроль знаний

На протяжении всего семестра за определенные виды работ, выполняемые студентами, выставляются баллы. Итоговый рейтинг по дисциплине представляет собой сумму баллов, полученных студентом за прохождение контрольных точек – рубежных контролей, домашних заданий, защиты итогового проекта. Важное условие — своевременное выполнение работ. Для успешной аттестации по данному курсу студентам необходимо набрать пороговый рейтинг — 50 баллов. При пересчете баллов студенты могут получить итоговую оценку: 0–49 неудовлетворительно, 50–79 удовлетворительно, 80–94 хорошо, 95–100 отлично (сдача итогового проекта+все РК).

Цель курса — изучение студентами как классических, так и современных подходов к решению задач Data Mining, основанных на алгоритмах машинного обучения.

Объемы данных, ежедневно генерируемые сервисами крупной интернет компании, поистине огромны. Цель динамично развивающейся в последние годы дисциплины Data Mining состоит в разработке подходов, позволяющих эффективно обрабатывать такие данные для извлечения полезной для бизнеса информации. Эта информация может быть использована при создании рекомендательных и поисковых систем, оптимизации рекламных сервисов или при принятии ключевых бизнес-решений.

Смешанное занятие №1

Задачи Data Mining.

4 часа 2 часа СР

Смешанное занятие №2

Задача классификации и регрессии. KNN.

4 часа 2 часа СР

Смешанное занятие №3

Naive Bayes

4 часа 2 часа СР

Смешанное занятие №4

Решающие деревья

4 часа

Смешанное занятие №5

Линейные модели

4 часа

Рубежный контроль №1

Коллоквиум

4 часа 2 часа СР

Смешанное занятие №6

Метод опорных векторов

5 часа 2 часа СР

Смешанное занятие №7

Алгоритмы кластеризации

4 часа 2 часа СР

Смешанное занятие №8

Задача кластеризации и EM-алгоритм

4 часа 2 часа СР

Смешанное занятие №9

Отбор признаков и снижение размерности

5 часа 2 часа СР

Смешанное занятие №10

Методы выявления аномалий в данных

4 часа 2 часа СР

Смешанное занятие №11

Введение в рекомендательные системы

4 часа 2 часа СР

Рубежный контроль №2

Коллоквиум

4 часа 4 часа СР

Рубежный контроль №3

Защита семестрового проекта

4 часа 2 часа СР

Пересдача №1

Пересдача

5 часа

Также в первом семестре:
Углубленное программирование на C/C++

1. С++ на уровне upper-intermediate
2. Расширение кругозора в области инструментария разработчика С++
3. Изучение идиом и best practices современного С++

© Mail.Ru Group, 2011–2018

Обратная связь

Присоединяйся:

Группа ВКонтакте
  • Дизайн:
    Nimax
  • Разработка:
    Лаборатория
    технопарка
Версия портала - 5.33.3