Обратная связь
1) Извлечение полезной информации из данных
2) Применение алгоритмов машинного обучения к практическим задачам
3) Обработка изображений с использованием искусственных нейронных сетей
4) Комплексное решение задач машинного обучения
Мы ожидаем от студентов знаний:
1) основ линейной алгебры (базовые операции, свойства векторов и матриц, такие как скалярное произведение, норма вектора, обусловленность матрицы)
2) математического анализа (производные и интегралы)
3) теории вероятности и математической статистики (понятия вероятности и условной вероятности, функции распределения)
4) языка программирования python (стандартные типы данных, модули collections, itertools и т.д.)
Цель курса — Ознакомить слушателей с практическим анализом данных и машинным обучением. Научить выбирать и разрабатывать подходящие алгоритмы и пайплайны для различных наборов данных с использованием языка программирования python.
В рамках данного курса, слушатели познакомятся как с классическими алгоритмами машинного обучения, так и с самыми современными достижениями в науке анализа данных. Полученные знания будут полезны в целом спектре областей: информационные технологии, лингвистика, психология, биология, физика, картография, банковское дело, экономика и управление и т.д.
Смешанное занятие №1
Введение в анализ данных и машинное обучение
1) Постановка задачи машинного обучения
2) Классификация задач и их примеры
3) Библиотеки python для анализа данных (matplotlib, pandas, numpy)
4 часа 4 часа СР
Смешанное занятие №2
Задачи классификации и регрессии
1) Наивный Байесовский классификатор
2) Линейная регрессия
3) Метод ближайших соседей
4) Решающее дерево
5) Логистическая регрессия
4 часа 4 часа СР
Смешанное занятие №3
Оценка качества моделей и работа с признаками
1) Оценка качества моделей
2) Работа с категориальными данными
3) Работа с пропущенными данными
4) Работа с гео данными
4 часа 4 часа СР
Смешанное занятие №4
1) Алгоритмы кластеризации
2) Kmeans, Иерархическая кластеризация, Спектральная кластеризация
3) Оценка качества кластеризации
4)Поиск ассоциативных правил
4 часа 4 часа СР
Смешанное занятие №5
1) Выбор оптимальных параметров модели
2) Ансамбли моделей
3) Бустинг, бегинг, стекинг
4) Случайный лес
5) Градиентный бустинг
4 часа 4 часа СР
Смешанное занятие №6
1) Графы
2) Форматы представления сетевых данных
3) Меры центральности элементов сети
4) Выявление сообществ
4 часа 4 часа СР
Смешанное занятие №7
1) Предобработка текстовых данных, лемматизация | стемминг
2) Тематическое моделирование
3) Извлечение признаков, BoW, Word2vec
4 часа 4 часа СР
Смешанное занятие №8
1) Метрики для оценки работы рекомендательных систем.
2) Виды рекомендательных систем: item2item, совстречаемости, неперсонализированные, персонализированные, коллоборативная фильтрация, матричная факторизация.
З) Как устроены рекомендательные системы для онлайн-магазинов в Mail.Ru Group
4 часа 4 часа СР
Смешанное занятие №9
1) История развития нейронных сетей
2) Методы оптимизации
3) Метод обратного распространения ошибки
4) Инструменты для создания нейронных сетей
4 часа 4 часа СР
Смешанное занятие №10
Свёрточные нейронные сети. Часть 1
1) Классические алгоритмы анализа изображений
2) Операция свертки, pooling
3) Архитеруты: LeNet, AlexNet, VGG
4 часа 4 часа СР
Смешанное занятие №11
Свёрточные нейронные сети. Часть 2
1. Модели для задач детектирования и сегментации
2. Интерпретация обученных моделей
З. Обзор state of the art подходов в глубоком обучении
4 часа 4 часа СР