Лектор (теоретическая часть): Дмитрий Шабанов

Лектор (прикладная часть): Никита Волков

Семинарист: Ольга Калиниченко

Ассистенты:

Кафедра дискретной математики.

Таблица результатов и распределение задач

Правила и система оценивания

Оставить анонимный отзыв


Содержание

Лекции (прикладная часть)

Лекция 1. ЕМ-алгоритм: вариационная нижняя оценка, вывод формул E и M-шага. Пример смеси распределений.

Лекция 2. Скрытые марковские модели: опреление и свойства, примеры применения. Оценка параметров с помощью EM-алгоритма, метод forward-backward вычисления условного распределения цепи. Оценка последовательности скрытых состояний методами forward-backward и Витерби. Поиск траектории Витерби.

Презентация

Лекция 3. (Ольга Калиниченко) Введение в Reinforcement learning.

Презентация

Лекция 4. (Антон Нужный) Вычисление мер пространственной корреляции, вариограммы, модели вариограмм: чистый наггет, сферическая, экспоненциальная, гауссовская, степенная. Простой кригинг и обычный кригинг. Примеры применения на практике.

Лекция 5. Прогнозирование временных рядов. Автокорреляционная функция, кореллограмма, критерий Льюнга-Бокса. STL-декомпозиция временного ряда на тренд, сезонность и остатки. Стационарные временные ряды, критерий KPSS, преобразование Бокса-Кокса, дифференцирование ряда. Анализ остатков. Экспоненциальное сглаживание, адаптивное Экспоненциальное сглаживание. Модель скользящего среднего MA и модель авторегрессии AR. Представление модели AR в виде модели MA(inf), стационарность в модели AR. Модели ARMA, ARIMA, оценка параметров модели. Подбор оптимальных гиперпараметров модели на основе автокорреляционной и частичной автокорреляционной функции. Учет сезонности и экзогенных факторов: модель SARIMAX. Способы нелинейного прогнозирования временных рядов. Способы оценки качества, кросс-валидация для временных рядов.

Презентация

Семинары

Семинар 1. Введение. Ветвящиеся процессы Гальтона-Ватсона.

Презентация

Семинар 2. Ветвящиеся процессы Гальтона-Ватсона. EM-алгоритм.

Ноутбук про EM-алгоритм, PDF

Ноутбук про кластеризацию, PDF

Семинар 3. Марковские цепи.

Примеры (с доказательством однородности) Pagerank

Семинар 4. Скрытые марковские модели.

Простейший_POS-tagging, PDF

hmmlearn, PDF

Семинар 5. Однородные пуассоновские процессы.

Семинар 6. Контрольная. Неоднородные пуассоновские процессы. Проверка однородности.

Генерация пуассоновских процессов (IPYNB, PDF)

Семинар 7. Гауссовские процессы. Винеровский процесс.

Решение 4 задачи из ДЗ

Задача про гауссовский процесс

Задача про гауссовский и винеровский процесс

Семинар 8. Стационарные процессы. Регрессия на гауссовских процессах.

Примеры ковариационных функций

Семинар 9. Простой анализ временных рядов.

Презентация

Семинар 10. ARIMA и ее друзья.

Разбор задачи 2 из дз

Разбор задачи 4 из дз

Пример работы с моделью SARIMAX, PDF

Семинар 10. Марковские моменты.

Задача на марковские моменты

Теория (повтор)

Теория (новая информация)

Задача на теорему Башелье

Теоретические задания

Задание 1. Дедлайн 18 февраля за 20 минут до семинара.

Задание 2. Дедлайн 25 февраля за 20 минут до семинара. Для учета задач нужно заполнить опрос.

Задание 3. Дедлайн 4 марта за 20 минут до семинара. Для учета задач нужно заполнить опрос. Распределение по письменной задаче см. в таблице результатов.

Задание 4. Дедлайн 10 марта 23:59. Для учета задач нужно заполнить опрос.

Задание 5. Дедлайн 24 марта 23:59. Для учета задач нужно заполнить опрос. Распределение по письменной задаче см. в таблице результатов.

Задание 6. Дедлайн 31 марта 23:59 по задачам 1-4, 7 апреля по задаче 5 (опрос по дз 7) Для учета задач нужно заполнить опрос. Распределение по письменной задаче см. в таблице результатов(!!!).

Задание 7. Дедлайн 7 апреля 23:59. Для учета задач нужно заполнить опрос.

Задание 7.5: задачи 2-4 из задания 7. Дедлайн 14 апреля 23:59. Для учета задач нужно заполнить опрос.

Задание 8. Дедлайн 21 апреля 23:59. Для учета задач нужно заполнить опрос. Нужно сдать письменно один из пунктов задачи 2: распределение см. в таблице результатов.

Задание 9. Дедлайн 28 апреля 23:59. Для учета задач нужно заполнить опрос. Распределение по письменной задаче см. в таблице результатов.

Задание 10. Дедлайн 12 мая 23:59. Для учета задач нужно заполнить опрос. Распределение по письменной задаче см. в таблице результатов.

Практические задания

Задание 1: IPYNB, PDF, данные, варианты, BranchingProcess.py. Дедлайн 23.02 23:59. Задать вопрос по заданию.

Задание 2: IPYNB, PDF. Дедлайн 12.03 23:59. Задать вопрос по заданию.

Задание 3: IPYNB, PDF, data.zip. Дедлайн 30.03 23:59. Задать вопрос по заданию.

Задание 4: PDF. Дедлайн 19.04 23:59. Задать вопрос по заданию.

Задание 5: IPYNB, PDF. Дедлайн 15.05 23:59. Задать вопрос по заданию.

Задание 6: PDF, electricity.txt. Дедлайн 15.05 23:59. Задать вопрос по заданию.

Задание 7: PDF, data.zip, baseline.ipynb, baseline.pdf. Дедлайн 25.05 23:59.

Задание 8: PDF, ASR_Sphinx.zip. Дедлайн 25.05 23:59.

Литература и полезные ссылки

Лекция про ЕМ-алгоритм от DeepBayes