Информационный поиск

Длительность
  • 17 занятий
  • 68 ак. часов
Курс преподают
  • Чернов Евгений Чернов Евгений
  • Андрей Мурашев Андрей Мурашев
  • Владимир Гулин Владимир Гулин
Получаемые навыки

Разберетесь в сфере задач машинного обучения, освоите основные методы и средства решения таких задач, узнаете, как решается одна из самых сложных проблем искусственного интеллекта — понимание потребностей человека и поиск подходящего решения.

Контроль знаний

Итоговый рейтинг по дисциплине представляет собой сумму баллов, полученных за прохождение контрольных точек: рубежных контролей, домашних заданий, защиты итогового проекта. Важное условие — своевременное выполнение работ.
Для успешной аттестации по данному курсу необходимо набрать 30 баллов. При пересчете в оценки баллы распределяются следующим образом:
– 0−9 «неудовлетворительно», 
– 10−24 «удовлетворительно», 
– 25−39 «хорошо»,
– 40−100 «отлично».

Цель курса — изучите основные методики создания поисковых систем, и научитесь нетривиально применять при проектировании современный математический аппарат.

Все пользователи интернета имеют опыт работы с поисковыми системами, регулярно вводят туда запросы и получают результаты. Поисковые системы стали настолько привычными, что уже сложно себе представить, что когда-то их не было, а качество современного поиска воспринимается как данность, хотя ещё пятнадцать лет назад все было совершенно иначе.

Современная поисковая система является сложнейшим программно-аппаратным комплексом, создателям которого пришлось решить огромное количество практических проблем, начиная от большого объема обрабатываемых данных и кончая нюансами восприятия человеком поисковой выдачи.

Авторы курса — создатели поисковой системы на портале Mail.Ru — обладают опытом разработки систем искусственного интеллекта. Увидите, насколько увлекательно делать поисковую систему и решать задачи обработки текстов на естественном языке.

Лекция №1

Введение в информационный поиск. Общая архитектура и особенности

4 часа

Смешанное занятие №1

Индексация и булев поиск

4 часа 4 часа СР

Смешанное занятие №2

Методы оптимизации обратного индекса

4 часа 2 часа СР

Смешанное занятие №3

Фильтрация. Антиспам и антипорн

4 часа 4 часа СР

Смешанное занятие №4

Вероятностные языковые модели

4 часа 2 часа СР

Рубежный контроль №1

Коллоквиум №1

4 часа 2 часа СР

Смешанное занятие №5

Исправление опечаток в запросах

4 часа 2 часа СР

Смешанное занятие №6

Тематические классификаторы запросов. Саджесты. Переформулировки

4 часа 4 часа СР

Смешанное занятие №7

Фильтрация. Дубликаты

4 часа 4 часа СР

Смешанное занятие №8

Лингвистика в поиске. Основы обработки текстов

4 часа 4 часа СР

Смешанное занятие №9

Классические текстовые модели ранжирования

4 часа 2 часа СР

Смешанное занятие №10

Суммаризация текста

4 часа 4 часа СР

Смешанное занятие №11

Граф знаний

4 часа 4 часа СР

Рубежный контроль №2

Коллоквиум №2

4 часа

Смешанное занятие №12

4 часа

Экзамен №1

Экзамен

4 часа

Пересдача №1

Пересдача

4 часа


Также в втором семестре:
Многопоточное программирование на языке программирования С/С++

– Изучите классическое создание дочерних процессов (через fork) и использование средств межпроцессного взаимодействия (IPC)
– Освоите различные способы создания многопоточного приложения (pthreads, std::thread, boost::thread), а также и более высокоуровневые средства распараллеливания (OpenMP, Intel TBB).
– Научитесь работать с сетью и контейнерами (STL, boost).
– Реализуете протокол HTTP для будущего веб-сервера.

Нейронные сети в машинном обучении

– Получите опыт подбора архитектуры нейронных сетей и ее быстрой реализации на PyTorch.
– Реализуете классификаторов изображений, системы переноса стиля и генерации изображений при помощи GAN. 
– Станете реализовывать нейронные сети как «с нуля», так и на библиотеке PyTorch. 
– Привыкнете читать научные статьи и сможете самостоятельно проводить научное исследование.

© Mail.ru Group, 2011–2020

Обратная связь

Присоединяйся:

Группа ВКонтакте
  • Дизайн:
    Nimax
  • Разработка:
    Лаборатория
    Технопарка
Версия портала - 5.43.1