Определение эффективной последовательности базовых моделей в градиентном бустинге - курсовая работа | ИСТИНА – Интеллектуальная Система Тематического Исследования НАукометрических данных

Научный руководитель: Китов В.В.
Автор: Амир Мирас Сабыргалиулы
Тип: Бакалавр
Организация, в которой проходила защита: МГУ имени М.В. Ломоносова
Кафедра: Кафедра математических методов прогнозирования
Год защиты: 2016
Курс: 3
Аннотация: Метод градиентного бустинга представляют собой семейство мощных методов машинного обучения, которые показали значительный успех в широком диапазоне практических применений. Например, один из представителей данного семейства, xgboost набрал большую популярность среди команд-победителей ряда конкурсов по анализу данных. Основная идея градиентного бустинга заключается в последовательном построе- нии композиции алгоритмов машинного обучения, когда каждый следующий алго- ритм стремится компенсировать недостатки композиции всех предыдущих алгорит- мов. Высокая гибкость алгоритма позволяет вводит различные изменения в дизайн метода, таким образом, делая метод подходящей для многих задач машинного обучения. Обычно, в качестве базовых алгоритмов используются так называемые "слабые"модели. В их число относятся неглубокие деревья решений. Но бывают случаи, когда градиентный бустинг над деревьями работает относительно плохо, например, по сравнению с методом ближайших соседей. Здесь возникает идея в качестве базо- вых моделей использовать метод ближайшего соседа, или лучше смешать два семей- ство моделей. В данной работе предложен метод смешивания различных семейств алгоритмов. На каждом шаге метод выбирает ту модель, которая показывает наи- меньшее значение ошибки. Однако, существует и варианты градиентного бустинга, состоящих из "силь- ных"решающих моделей. Например, Deep Boosting, использующий глубокие де- ревья решений и метод итеративного бэггинга с базовыми бэггинг моделями. Для анализа работы алгоритма часто используется разложение ошибки на смещение и дисперсию. Некоторые методы машинного обучения уменьшают дисперсию (бэггинг), а другие смещение (бустинг). Также были попытки комбинирования этих двух технологии для уменьшения сразу двух компонентов ошибки. Например, вышесказанный метод итеративного бэггинга. В данной работе предложен модифицированный вариант этого метода.
Добавил в систему: Китов Виктор Владимирович

	ИСТИНА	Войти в систему Регистрация
	ИСТИНА ЦЭМИ РАН
	Главная Поиск Статистика О проекте Помощь

ИСТИНА

ИСТИНА ЦЭМИ РАН

Определение эффективной последовательности базовых моделей в градиентном бустингекурсовая работа (Бакалавр)