Аннотация:В курсовой работе рассматривается нейросетевая модель распознавания ключевых слов на аудиозаписи, а также методы предварительной обработки данных и их влияние на итоговый результат классификации. Задача распознавания ключевых слов является крайне актуальной, так как системы распознавания речи используются повсеместно для повышения удобства пользования приложениями и устройствами (тем самым увеличивая лояльность клиента к продукту), а также для снижения затрат на обслуживание клиентов бизнесу.
В работе рассматриваются следующие методы предобработки данных: центрирование, удаление шумов на записях. Также, в связи с тем, что в датасете были выявлены ошибки в разметке данных, предложен способ удаления выбросов, основанный на статистических характеристиках вектора амплитуд аудиосигнала. В работе показано, что предварительная обработка данных значительно повышает качество классификации голосовых команд. Реализация методов представлена на языке Python.