Машинное обучение

1.       

Название дисциплины

Машинное обучение

2.       

Курс обучения

специальность

1 , 1- 31 81 06 Веб- программирование и интернет технологии

3.       

Семестр обучения

1

4.       

Количество кредитов

5

5.       

Ф.И.О. лектора

Радыно Евгений Мефодьевич

6.       

Цели изучения дисциплины

Ознакомление студентов с основными современными способами автоматического обнаружения и описания закономерностей в данных из окружающего мира.

Обучение способам автоматизации деятельности на основе анализа данных и моделирования, без явного предварительного написания алгоритмов действий.

 

В результате изучения дисциплины обучаемый должен

знать:

— классификацию видов данных имеющихся в окружающем мире;

— формулировку задач регрессии, классификации, ранжирования, оценки распределения, уменьшения размерности, кластеризации;

–– основные подходы к решению задач  вышеупомянутых задач регрессии, классификации, ранжирования, оценки распределения, уменьшения размерности, кластеризации;

уметь:

— определять вид имеющихся данных;

— проводить первичную обработку данных;

— формализовывать задачу, как задачу регрессии, классификации, ранжирования, оценки распределения, уменьшения размерности, кластеризации или их совокупность;

— решать упомянутые задачи  с помощью современных программных средств;

— оценивать качество предложенного решения.

 

7.       

Пререквизиты

Линейная алгебра, теория вероятностей, математическая статистика,

основы математического анализа, основы функционального анализа, основы программирования

8.       

Содержание дисциплины

Типы переменных (непрерывные, категорные, упорядоченные). Прецедентное обучение. Предикторы и целевые переменные. Задачи регрессии и классификации. Вероятностная постановка задачи классификации. Шаги анализа данных CRISP-DM. Переобучение модели и способы борьбы с переобучением модели.  Энтропия и информация.  Плотность распределения. Метод максимального правдоподобия при оценке параметра. Сравнение бинарных классификаторов. ROC-кривая.  Функция потерь при оценке качества работы модели. Основные метрики для оценки качества.

Линейная регрессия и регуляризация (LASSO, Ridge). Обобщенная линейная регрессия. Логистическая регрессия. Деревья в задаче классификации и регрессии. Метод ближайших соседей. Метод опорных векторов. Метод главных компонент. Составные модели (Bagging). Нейронные сети (перцептрон, LSTM). Кластеризация

 

9.       

Рекомендуемая литература

Основная

1. Вапник В.Н., Червоненкис А.Я. Теория распознавания образов. Статистические проблемы обучения. – Москва, 1974. – 416 c.

2.  Trevor Hastie. Robert Tibshirani. Jerome Friedman. The Elements of. Statistical Learning. Data Mining, Inference, and Prediction. – Springer, 2009. – 745 p.

 

10.   

Методы преподавания

Лекции, лабораторные занятия, УИРС

11.   

Язык обучения

Русский

12.   

Условия (требования), текущий контроль

Лабораторные работы (при выставлении экзаменационной  оценки учитывается текщая успеваемость — с коэффициентом 0,3)

13.   

Форма аттестации

Экзамен

Машыннае навучанне (бел.яз)