Нейросетевая модель распознавания ключевых слов в аудиозаписи - курсовая работа | ИСТИНА – Интеллектуальная Система Тематического Исследования НАукометрических данных

Научный руководитель: Шокуров А.В.
Автор: Бабий П.С.
Тип: Специалист
Организация, в которой проходила защита: МГУ имени М.В. Ломоносова
Кафедра: Механико-математический факультет
Год защиты: 2022
Курс: 5
Аннотация: В курсовой работе рассматривается нейросетевая модель распознавания ключевых слов на аудиозаписи, а также методы предварительной обработки данных и их влияние на итоговый результат классификации. Задача распознавания ключевых слов является крайне актуальной, так как системы распознавания речи используются повсеместно для повышения удобства пользования приложениями и устройствами (тем самым увеличивая лояльность клиента к продукту), а также для снижения затрат на обслуживание клиентов бизнесу. В работе рассматриваются следующие методы предобработки данных: центрирование, удаление шумов на записях. Также, в связи с тем, что в датасете были выявлены ошибки в разметке данных, предложен способ удаления выбросов, основанный на статистических характеристиках вектора амплитуд аудиосигнала. В работе показано, что предварительная обработка данных значительно повышает качество классификации голосовых команд. Реализация методов представлена на языке Python.
Добавил в систему: Бабий Полина Сергеевна

	ИСТИНА	Войти в систему Регистрация
	ИСТИНА ЦЭМИ РАН
	Главная Поиск Статистика О проекте Помощь

ИСТИНА

ИСТИНА ЦЭМИ РАН

Нейросетевая модель распознавания ключевых слов в аудиозаписикурсовая работа (Специалист)