Информационный поиск. Часть 2

Длительность
  • 19 занятий
  • 76 ак. часов
Курс преподают
  • Владимир Гулин Владимир Гулин
  • Чернов Евгений Чернов Евгений
Получаемые навыки

Студенты в завершении данного курса получат знания в области задач машинного обучения, узнают, как решается одна из самых сложных проблем искусственного интеллекта, понимание потребностей человека и поиск подходящего решения.

Контроль знаний

Неуспевающие студенты будут отчисляться.

Трое лучших студентов получат предложение о стажировке в Поиске@Mail.Ru.

Все студенты, успешно сдавшие экзамены, лабораторные и курсовые работы, получат сертификат об окончании курса. В случае необходимости, мы так же можем написать для вас рекомендательные письма при устройстве на работу.

На протяжении всего семестра за определенные виды работ, выполняемые студентами, выставляются баллы. Итоговый рейтинг по дисциплине представляет собой сумму баллов, полученных студентом за прохождение контрольных точек – рубежных контролей, домашних заданий, защиты итогового проекта. Важное условие — своевременное выполнение работ.

Для успешной аттестации по данному курсу студентам необходимо набрать пороговый рейтинг — 75 баллов.

При пересчете баллов студенты могут получить итоговую оценку: 0–74 неудовлетворительно, 75–84 удовлетворительно, 85–94 хорошо, 94-100 отлично.

Цель курса — В нашем курсе мы хотим рассказать об основных методах, применяемых при создании поисковых систем. Некоторые из них – хороший пример смекалки, некоторые показывают, где и как может применяться современный математический аппарат.

Все пользователи интернета имеют опыт работы с поисковыми системами, регулярно вводят туда запросы и получают результаты. Поисковые системы стали настолько привычными, что уже сложно себе представить, что когда-то их не было, а качество современного поиска воспринимается как данность, хотя ещё пятнадцать лет назад всё было совершенно иначе.

Однако, современная поисковая система является сложнейшим программно-аппаратным комплексом, создателям которого пришлось решить огромное количество практических проблем, начиная от большого объёма обрабатываемых данных и кончая нюансами восприятия человеком поисковой выдачи.

Авторы курса – создатели поисковой системы на портале Mail.Ru – обладают большим опытом разработки систем искусственного интеллекта, многие имеют опыт преподавания. Мы хотим показать студентам, насколько интересно и увлекательно делать поисковую систему, решать задачи обработки текстов на естественном языке; хотим показать основные методы и средства решения таких задач.

Лекция №1

Лингвистика в поиске. Основы обработки текстов

4 часа

Лекция №2

Коллокации, N-граммы, скрытые марковские цепи.

4 часа 4 часа СР

Лекция №3

Текстовое ранжирование. bm25 + passage + Языковые модели.

4 часа

Лекция №4

Оценка качества поиска. Сплиты. Асессоры

4 часа 4 часа СР

Лекция №5

Ссылочное ранжирование

4 часа 2 часа СР

Лекция №6

Машинное ранжирование (1 часть)

4 часа 4 часа СР

Лекция №7

Машинное ранжирование (часть 2)

4 часа 4 часа СР

Лекция №8

Поведенческое ранжирование №1

4 часа 2 часа СР

Лекция №9

Поведенческое ранжирование №2

4 часа 4 часа СР

Лекция №10

Сглаживание поведенческих факторов

4 часа

Лекция №11

Технологии поиска с использованием нейронных сетей

4 часа 2 часа СР

Смешанное занятие №1

Обзор конкурса про предсказание релевантности по пользовательскому поведению

4 часа 4 часа СР

Семинар №1

Разбор конкурса по текстовому ранжированию

4 часа

Лекция №13

Мультимедиа поиск

4 часа 4 часа СР

Лекция №14

Learning to match 1

4 часа 4 часа СР

Лекция №14

Learning to match 2

4 часа 4 часа СР

Смешанное занятие №17

Разбор конкурса relevance prediction

4 часа 4 часа СР

Экзамен №1

Экзамен

4 часа

Пересдача №1

Пересдача

4 часа

Также в третьем семестре:
Методы распределенной обработки больших объемов данных в Hadoop

После прохождения курса студенты освоят:

— общие знания относительно способов хранения и методов обработки больших объемов данных

— общие знания относительно работы распределенных систем в контексте фреймворка Hadoop

— практические навыки разработки приложений используя программную модель MapReduce

Дополнительные главы машинного обучения

По завершению курса студенты получат знания о том, как устроены системы машинного обучения в крупных интернет проектах, а также практические навыки для успешного участия в таких проектах.

© Mail.Ru Group, 2011–2018

Обратная связь

Присоединяйся:

Группа ВКонтакте
  • Дизайн:
    Nimax
  • Разработка:
    Лаборатория
    технопарка
Версия портала - 5.33.3