Информационный поиск. Часть 1

Длительность
  • 16 занятий
  • 64 ак. часов
Курс преподают
  • Чернов Евгений Чернов Евгений
  • Юлия Сергукова Юлия Сергукова
  • Андрей Мурашев Андрей Мурашев
  • Владимир Гулин Владимир Гулин
Получаемые навыки

Студенты по завершении данного курса получат знания в области задач машинного обучения, узнают, как решается одна из самых сложных проблем искусственного интеллекта, понимание потребностей человека и поиск подходящего решения.

Контроль знаний

Неуспевающие студенты будут отчисляться.

Трое лучших студентов получат предложение о стажировке в Поиске@Mail.Ru.

Все студенты, успешно сдавшие экзамены, лабораторные и курсовые работы, получат сертификат об окончании курса. В случае необходимости, мы так же можем написать для вас рекомендательные письма при устройстве на работу.

На протяжении всего семестра за определенные виды работ, выполняемые студентами, выставляются баллы. Итоговый рейтинг по дисциплине представляет собой сумму баллов, полученных студентом за прохождение контрольных точек – рубежных контролей, домашних заданий, защиты итогового проекта. Важное условие — своевременное выполнение работ.

Для успешной аттестации по данному курсу студентам необходимо набрать пороговый рейтинг — 50 баллов.

При пересчете баллов студенты могут получить итоговую оценку:
0-29 неудовлетворительно,
30-49 удовлетворительно,
50-74 хорошо,
75+ отлично.

Цель курса — в нашем курсе мы хотим рассказать об основных методах, применяемых при создании поисковых систем. Некоторые из них – хороший пример смекалки, некоторые показывают, где и как может применяться современный математический аппарат.

Все пользователи интернета имеют опыт работы с поисковыми системами, регулярно вводят туда запросы и получают результаты. Поисковые системы стали настолько привычными, что уже сложно себе представить, что когда-то их не было, а качество современного поиска воспринимается как данность, хотя ещё пятнадцать лет назад всё было совершенно иначе.

Однако, современная поисковая система является сложнейшим программно-аппаратным комплексом, создателям которого пришлось решить огромное количество практических проблем, начиная от большого объёма обрабатываемых данных и кончая нюансами восприятия человеком поисковой выдачи.

Авторы курса – создатели поисковой системы на портале Mail.Ru – обладают большим опытом разработки систем искусственного интеллекта, многие имеют опыт преподавания. Мы хотим показать студентам, насколько интересно и увлекательно делать поисковую систему, решать задачи обработки текстов на естественном языке; хотим показать основные методы и средства решения таких задач.

Лекция №1

Введение в информационный поиск. Общая архитектура и особенности

4 часа

Смешанное занятие №1

Индексация и булев поиск

4 часа 4 часа СР

Смешанное занятие №2

Методы оптимизации обратного индекса

4 часа 2 часа СР

Смешанное занятие №3

Лингвистика в поиске. Основы обработки текстов

4 часа 4 часа СР

Смешанное занятие №4

Вероятностные языковые модели

4 часа 2 часа СР

Рубежный контроль №1

Коллоквиум №1

4 часа 2 часа СР

Смешанное занятие №5

Фильтрация. Дубликаты

4 часа 4 часа СР

Смешанное занятие №6

Фильтрация. Антиспам и антипорн

4 часа 4 часа СР

Смешанное занятие №7

Исправление опечаток в запросах

4 часа 2 часа СР

Смешанное занятие №8

Тематические классификаторы запросов. Саджесты. Переформулировки

4 часа 4 часа СР

Смешанное занятие №9

Классические текстовые модели ранжирования

4 часа 2 часа СР

Смешанное занятие №10

Суммаризация текста

4 часа 4 часа СР

Смешанное занятие №11

Граф знаний

4 часа 4 часа СР

Рубежный контроль №2

Коллоквиум №2

4 часа

Смешанное занятие №12

4 часа

Пересдача №1

Пересдача

4 часа

Также в втором семестре:
Многопоточное программирование на языке программирования С/С++

В течение семестра студенты реализуют протокол HTTP для будущего веб-сервера, работу по сети, многопоточность.

Нейронные сети в машинном обучении

По результатам курса вы научитесь применять нейронные сети для многих практических задач, а также оценивать целесообразность их применения. Вы получите опыт подбора архитектуры нейронных сетей и ее быстрой реализации на PyTorch.

© Mail.ru Group, 2011–2019

Обратная связь

Присоединяйся:

Группа ВКонтакте
  • Дизайн:
    Nimax
  • Разработка:
    Лаборатория
    Технопарка
Версия портала - 5.40.6